Informatica释放Hadoop强大潜能

时间:2022-03-22 06:43:12

精益原则在大数据时代比以往任何时候都有效,并且是使大数据不成为大债务的关键。Hadoop使企业能够适用精益数据管理,以降低数据成本,这包括:业务成本、硬件成本、人工成本、软件成本、存储成本。

大数据,如今成为很多企业越来越关注的话题,但尽管很多企业已经意识到大数据的机遇,但却不知道如何才能从庞大的数据中挖掘到商业价值。企业如何在大数据时代,通过增加数据价值、降低数据成本,在大数据环境下有效实现数据集成与管理,为业务决策优化提供权威、可信、一致的数据,最大化数据投资回报,是Informatica能够为企业带来的价值。

什么是大数据?Informatica核心技术部资深产品管理总监郑玮认为,大数据是大交易数据、大交互数据和大数据处理的总称,大数据的三个特征(Volume、Variety、Velocity),除了数据总量之外,还有数据的速度和种类。

如果大数据得不到正确的管理,也可能代表了巨大的成本和法规遵从风险,这样对数据处理平台带来了更大的压力。企业希望能够以更经济的方式、更好的性能来处理数据,从而能够经济有效地利用快速增长的数据推动业务创新。

自从Hadoop在2008年作为Apache开源项目以来,一直让人备感兴奋,原因在于它结合了成本低、可扩展性佳以及无需构建预定义模式(predefined schema)就能灵活地处理任何数据等优点。郑玮说,在大数据时代,许多人寄希望于Hadoop厂商们能够开发出成熟可靠的工具、功能和技术创新,以更经济的方式、更好的性能实现数据处理和分析。因此,Informatica扩展了其数据集成平台以支持Hadoop,最新的Infonnatica 9.5提供了全新及扩展功能,释放了Hadoop潜能,帮助客户实现大数据最大投资回报。

Hadoop最大价值主要有两方面:一是Hadoop可以帮助降低大数据的成本;二是Hadoop能够真正提高大数据的价值。精益原则在大数据时代比以往任何时候都有效,并且是使大数据不成为大债务的关键。Hadoop使企业能够使用精益数据管理,以降低数据成本,这包括:业务成本、硬件成本、人工成本、软件成本、存储成本。此外,通过易访问性。可操作性、权威性、整体性、相关性、安全性,及时性、可信性等特性,Hadoop还能帮助客户增加数据的价值。

郑玮解释说,在IT环境中,Hadoop不可能作为一个孤岛存在。为了让Hadoop可以跨越不同平台并成为一种主流技术,用户需要将Hadoop作为他们IT大环境中的一部分来管理,通过Hadoop重复使用他们的开发技巧、资产及数据,并统筹管理全部数据。Informatica 9.5为企业带来了他们所需的交互性、生产力以及可管理性,以便快速采用Hadoop并最大化他们的大数据投资回报。

究竟Info rmatica怎样来释放Hadoop的能力,郑玮告诉记者,从数据处理的六大步骤来说,第一步,是将数据摄入到Hadoop;第二步,发现Hadoop数据的异常、关系和域类型:第三步,在Hadoop中解析和准备数据,这对于Informatica来讲是非常独特和重要的,现在数据类型非常多,要对其进行分析,首先要解析,将其变成可以工作的结构型数据:第四步,在Hadoop中转换和清洗/标准化数据,数据一旦格式化后就可以进行转换,过滤、集成、分类等等;第五步,在Hadoop上调用自定义业务分析;第六步,从Hadoop上读取数据,目前一些大的报告工具,还不能够直接在很多平台上运行,因此需要把计算结果提取出来放到传统数据库中。当然,在一到六步的实现过程中,企业还需要管理整个过程,需要监督、监视系统发生情况。

据了解,目前Informatica9.5已经实现了上述提到的一、三,六步的功能,而二、四、五步功能则将在年底推出的Informatica 9.5.1中实现。

上一篇:“数形结合”:对话高中数学解题能力的快速提升 下一篇:入世十年后汽车格局再解读