Informatica:数据集成与数据质量密不可分

时间:2022-10-25 03:04:05

Informatica:数据集成与数据质量密不可分

数据质量和数据集成具有天然的联系,两者相互协作才能更为有效地为数据仓库等系统提供准确、一致的高质量数据。

数据集成是企业普遍存在的需求。随着IT技术应用的逐渐深入,很多企业开始着手建设数据仓库、或者进行系统的升级或者迁移,在这些项目的开展过程中,数据集成往往是必不可少的环节。与之相比,人们对数据质量的了解则知之甚少,有些企业也许朦胧地感觉到了数据质量这一需求,却也并不知道该如何着手进行这项工作。

“数据质量同样是企业普遍存在的需求。实际上,数据集成与数据质量具有天然的联系。比如,在进行数据集成之前有必要进行数据质量的保证,而数据质量往往也离不开数据集成。最好的方式是两个功能无缝协作。”Informatica大中华区董事总经理吴韶益告诉记者。

据吴韶益介绍,实施数据集成的目的通常是为数据仓库或者CRM、ERP等应用提供数据。因为在大多数情况下这些应用的原始数据来自于多个数据源,往往具有不同的格式,数据集成平台所做的工作是将这些数据从多个数据源提取出来,按照需求转换为统一的格式。但是,这些数据的准确性和一致性却不是数据集成平台所能解决的,解决这一问题的最好办法就是实施数据质量。数据质量的主要任务就是探查数据的准确程度、查找和修复缺失或者不准确的数据,保证无论其应用、使用或者来源如何,都能为企业及时提供全面、一致、相关和符合要求的数据。

实际上,随着众多决策系统的应用日益普遍,对数据的质量问题日益凸显出来,比如数据中关键内容缺失、同一数据表达形式各异、数据明显错误等在很多IT系统中并不鲜见,而准确、一致的数据是确保项目最终成功的前提。因此,数据质量的必要性也就不言而喻。

鉴于数据质量对项目的重要作用,吴韶益建议,在为数据仓库、CRM、ERP等应用系统提供数据之前,最好能进行数据的分析和清洗(这就是数据质量的核心工作),特别是应该把数据的分析和探查作为数据集成项目流程中的一个基本步骤。因为数据的分析和探查可以帮助企业识别和了解其源数据,并最终在源数据和目标应用系统之间进行协调。

而另一方面,企业数据质量也离不开数据集成的支持。随着数据质量在企业中应用逐步深入,数据质量的解决方案会嵌入到企业的应用系统和流程中,这些都要求基本的数据集成平台提供高性能和可扩展性,以帮助企业实现其数据的真正价值。

上一篇:多千兆无线网络标准年内完成 下一篇:IBM 存储方案响应动态需求