在当今信息密集的环境下,对于数据仓库的需求日益增长。的确,众多的应用程序,如CRM、ERP、信息门户网站以及商务智能解决方案等,都要求得到数据仓库的支持。

  数据仓库平台的实施,再与企业信息集成(EII)软件相结合,就可为组织的内外部信息提供更好的访问,进而促进更快、更好的决策制定。

  Aberdeen 集团把EII定义为“在公司级或企业级上把离散数据源结合起来的软件,以全新的方式提交、分析或修改数据,为应用程序提供支持”,相对于传统的数据仓库,EII具有一些独到优点:

  在特定方式下传送实时数据的功能

  较早地将有价值的服务交付企业,降低项目风险

  灵活易变,以适应紧急业务需要

  明显的交接机制,可以清楚了解进展

  切实的成本减少以及迅速的投资回报

  虽然超出了本文范围,但其中必须予以重视的一点是:在数据仓库的创建及维护过程中,应当有一个数据质量策略。这一点对于任何增强数据仓库的EII解决方案来说也是同样要求的,选择有很多:最好的实施方案以便在源头对数据进行清理,或是启发式的工具,既可在转换时进行清理,又可在把数据仓库中的数据装载到数据集市时进行清理。

  元数据管理是另一极为重要的方面,已被广泛认为是成功实施数据仓库的关键。数据工程师在整体数据模型的基础上,运用建模技术来设计数据仓库的结构,在建模时,应根据对数据仓库的业务需求来考虑应采用的数据工具。这里主要是指传统的ETL工具,它们可以迅速的传送大量数据,并且转换成可用格式以便装载到新创建的数据仓库中。

  事实上,根据决策、分析或应用程序的需要将数据存入数据仓库以备实时访问时,放入所有的数据并没有多大意义,这就是EII软件为什么会出现的原因,特别是在模型驱动的解决方案中。通过对数据建模,可以得出数据架构的结论,以决定载入何种数据以及在特定方式下将用到何种数据。最好解决方案能有一个元数据库,以及允许建立大量数据模型的能力。这些模型中有一个是用来创建数据仓库的,而其它的则是用于驱动数据返回引擎的,以便创建某种企业视图。这意味着,最好是既拥有数据仓库以存储历史资料和保护运作系统,又具备根据需要及时访问数据仓库以外数据的能力。

  既然对企业随时所需的各种信息进行预料是不可能的,那么当需要时对整个组织的各种数据进行快速访问的能力就显得至关重要了,而对于业务用户的信息需求进行快速建模的能力,可以使公司适应快速变化的业务需求。

  按需时实数据访问的体系结构

  这种结构基于下述要求:

  一个中心数据库,以便为所有可用信息资产提供在线目录

  一组全面的、集成的信息视图

  为决策所需信息提供简便的返回方式

  完善的应用程序、门户网站产品、报告及商务智能工具、对迅速生成特定报告所需信息的快速建模及重建模能力

  可满足现存报告及分析流程的灵活环境

  对多变的业务需求的快速支持,同时需考虑到高度的可用性、性能及可伸缩性

  从旧系统、关系数据库、实时供给以及其它来自供应链伙伴的数据源中直接抽取数据的能力

  通过有选择地将那些不需实时的数据转移到数据仓库,使运作系统减轻负担

  另外,任何的实时数据管理系统还应该符合以下的关键标准:

  水平可伸缩性,可通过另外增加软硬件资源来解决数据量增长及指标增加问题

  基于标准的组件,用于提供开放的、适应未来发展的基础设施

  适应能力强的功能及性能

  向基于“购买而非自建”解决方案的市场领先者购买的组件

  实时数据管理在数据仓库和其它系统之间搭起了桥梁,可以随时根据需要抽取数据生成集成视图,它跨越了数据仓库、历史记录、快照数据和实时运作数据,以便时实地回答特定问题和监视业务性能。