Informatica:专注数据集成 提升商业价值

时间:2022-06-20 02:41:29

Informatica:专注数据集成 提升商业价值

我们已经进入大数据时代,关于大数据的讨论如火如荼,那么大数据究竟是福还是祸?Gartner认为,大数据是一个极具破坏力,业已影响到传统认识和业务模式的新事物,它打乱了现行规则,同时也带来了公共部门、业务和IT领导者们无法忽略的巨大机会。如果企业不具备应对大数据带来的冲击的能力,那么所丧失的将不仅是机遇,还将招致实质性风险:高涨的数据量可能妨碍机遇和危机的可视性,数据复杂性则能够影响合规性,而来自多个渠道的无休止实时数据流还会损害客户销售和服务,甚至对企业架构、成本产生冲击。我们该如何应对和利用好如此庞大的数据,获得更好的投资回报?Informatica 公司主席兼CEO苏哈比·阿巴斯就大数据时代的企业数据管理策略和数据集成的商业价值发表了自己的独到见解。

大数据淘金未来

李树翀:像云计算一样,大数据一经推出便得到了业界的广泛关注。您怎么理解大数据? 大数据并没有一个标准的定义,在Informatica看来,大数据应该是怎样的?

阿巴斯:大数据代表了技术发展的方向,主要包括三方面:海量交易数据、海量交互数据、大数据处理。大数据处理包括来自Oracle、IBM等的关系型数据库,以及SAP、Teradata的数据库;海量交互数据主要以社交媒体为代表和主要载体,例如Facebook、Twitter和其他服务。

李树翀:交易数据一般存在于社交网络交互中。大数据包括像您刚才提到的数据库这样的结构化数据,以及社交媒体中的非结构化数据,大数据时代会给我们整个IT行业带来怎样的变化?

阿巴斯:我举个例子,我们有个零售商客户,他们曾经认为他们最好的客户就是在他们在线商店里面花钱最多的。从他们的交易数据中,去把这个客户给找出来。现在的定位是:最重要的客户是最有影响力的。他们通过社交媒体发现这些人——他们的好朋友都是谁?通过Twitter或者Facebook提取数据。他们现在要统计出来他们这些人的朋友在这个小店花了多少钱。他们把这些人作为目标客户。如果锁定这些目标客户,他们的销售额就会上升。他们用Informatica的软件实现了这个目标。

李树翀:阿巴斯先生举的例子,跟我下面提到的问题刚好有一些关系。因为现在很多IT企业都在讲大数据,大数据的产业链非常长。包括数据存储、分析等各个方面。我想请阿巴斯先生给我们介绍一下,Informatica在这个产业链中扮演了什么样的角色?处于怎样的位置?

阿巴斯:客户之所以对大数据这么感兴趣,原因是大数据可以让他们做四件事。

第一,让他们能够分析交易数据,Informatica提供了相当准确的交易数据分析。第二,这个软件能够把社交媒体数据和企业商务数据结合起来。Informatica能够让客户实现这个功能,把商务数据和社交媒体数据有效结合起来。第三,大数据能够让客户把物联网数据和商务数据结合起来。Informatica可及时提供物联网数据和商务数据结合。第四,我们的产品成本较低,可谓低投入高回报。Informatica的产品能够提供非常完整的信息,使用Informatica产品能让客户很容易看到他们想要的数据。

最大化数据投资回报

李树翀:是否可以将Informatica理解为是一家数据集成及数据分析的解决方案供应商?

阿巴斯:是的。就是说我们的定位对客户来讲,是要最大化客户的数据投资回报。就像信息的投资回报一样,我们倡导的新概念是数据投资回报。Informatica增加数据的价值,举例来说,美林证券使用我们的产品使整个收入增加了10%。同时我们的产品也能降低数据操作中的成本,例如硬件成本和人工成本。

李树翀:说到数据集成的概念,随着云计算、物联网、移动互联网的发展,出现大量的可用数据,这是大数据发展的一个前提,同时这样的海量数据为数据整理和分析带来了非常大的挑战。Informatica又是怎么做的?

阿巴斯:我还是给您举个例子。US Express公司是一个物流公司,他们有好几千辆卡车,每辆车上都装上传感器,收集胎压、道路情况等信息。这些信息通过Informatica的产品被集中和处理,用来保证货物的准时送达,及降低成本。我们的工作就是帮助客户处理大数据,这是我们在物联网领域中的实例。

李树翀:我们也了解到在Gartner魔力象限当中,Informatica的位置非常靠前,位列领导者象限,我想请阿巴斯先生介绍一下Informatica的独到之处?

阿巴斯:Informatica专注于数据集成,相比其他公司,我们的目标更加明确和专一。Informatica非常重视创新,尤其是技术创新,在过去六年时间里每个季度都有新产品推出。

李树翀:说到专注,我想请问一下,数据集成和分析有什么差别?Informatica更专注于集成还是分析?

阿巴斯:我们专注于数据,不是分析。你要想把分析做好,需要可信的数据、及时的数据、相关的数据、权威的数据、可执行的数据、可访问的数据,我们正是在做这些。

李树翀:我理解阿巴斯先生说的这段话,数据应该是数据分析的基础,因为有了数据才有了分析。可以理解为Informatica是搜集很优质的原材料,但是我们并不做炒菜的环节。刚才提到了非结构化的数据增长,无论是数量还是速度都远远超过结构化的数据。目前我们手里拿到的数据显示,全球80%的数据是非结构化的,未来这个比例还会大幅度的增加,但是目前大部分所谓的大数据处理,都是集中在结构化数据上,我想请阿巴斯先生给我们讲一下,Informatica怎么区分结构化和非结构化的数据?在非结构化数据的处理方面,我们有哪些好的技术和解决方案?

阿巴斯:绝大多数的非结构化数据是在社交网络中,如FaceBook、Twitter或LinkedIn,或者是在物联网中。大多数非结构化数据没有什么商业价值。挑战是我们如何发现非结构化数据的价值。Informatica会告诉客户找到相关有用的信息,比如刚才所举的例子,帮助零售商在社交媒体上发现客户。用户怎样才能知道他们要找什么,用了Informatica的系统就会知道,应该锁定什么样的人。找到了这些数据,怎么才能从这些数据中发现价值?举一个美国网上约会网站的例子。它的信息全部都是非结构化的。他们知道用户怎么使用他们的网络,他们用了Informatica产品,得以从这些非结构化的数据当中提炼有价值的数据。

李树翀:很多人把对Hadoop的支持看作是处理非结构化数据的主要途径,请您给我们介绍一下Informatica如何支持Hadoop。

阿巴斯:应用Hadoop有三个挑战。第一,这是一个完全不同的技术。现实的情况是:今天的IT基础架构和Hadoop之间还有距离。Informatica的产品可以充当桥梁,将数据移入到Hadoop中,或从Hadoop中将数据移出。第二,Hadoop的编程语言不一样。你要是编程的话,需要很多的技术投入,还要找很多的编程人员。Informatica产品可以支持并实现编程语言。第三,Hadoop要求有很大的存储空间。一般来讲,单位容量数据进入Hadoop中,其大小会自然增长到4倍。我们的产品就是把这些数据压缩并且保管好,提供压缩解包功能。我们的客户一般都通过用Informatica产品来使用Hadoop。

数据集成潜力无限

李树翀:接下来的问题有关中国市场。目前,对很多企业来讲,数据集成对他们来说是一个新概念,包括大数据处理也是一个新的概念。请问阿巴斯先生,数据集成是不是只有拥有非常复杂的海量数据的大企业才可以应用?中国有大量的中小企业,如何运用数据集成技术来帮助这些中小企业提升竞争力?

阿巴斯:任何一个公司都需要及时、可靠和相关的信息。有一些信息放在云端里,有一些是在物联网上出现的。任何一种规模的公司,都需要把信息集中在一起。

李树翀:相对来讲中小企业对成本比较敏感,我们有没有针对中小企业特别提供一些解决方案?

阿巴斯:我们有Informatica Cloud,超过1000家公司正在用我们这个产品。是订购式的。

李树翀:目前很多IT企业把中国市场分成大型企业和中小型企业。大型企业比较倾向于建设自己的私有云,中小企业就会用公有云上的一些服务。Informatica也是采用这样的模式为大型企业和中小企业进行服务的吗?

阿巴斯:我们有超过36家的云服务商。包括,他们都是我们的合作伙伴。客户会在云端做数据集成,全球近5000家公司都在用Informatica的产品。他们在建立自己的私有云的时候,也会用到Informatica的产品技术。无论是公共云还是私有云,我们都会提供支持。

李树翀:我们知道在美国,数据集成这样的解决方案已经有了成功的落地,但中国可能还处在起步的阶段,请阿巴斯先生谈一下您觉得中国市场和美国市场有哪些不一样的地方?特别是在需求特点方面有哪些不同?

阿巴斯:中国的“十二五”规划将会加速新技术的采用。在这期间,云计算将成为重点关注对象。云计算将带动其他更多的新技术应用。云计算代表了下一个时代数据主导的浪潮。云服务提供的越多,数据也越多。同时,我们也关注物联网,物联网产出的数据也越多。我们提供基于位置的服务(Location Based Services),以及上下文感知服务(Context Awareness),将物联网数据和商业数据结合在一起。

美国零售业已经开始用这种定位技术刺激销售,如果客户正好在店面附近的话,他们会获得特别的折扣,让他们进店来买东西。

“十二五”规划的落实,将推动信息产业中的新技术应用。Informatica会帮助世界上所有国家的企业来实现数据的集成化管理。

李树翀:说到云计算,前几年通过概念的普及,目前已经开始在一定范围内落地。我想问一下阿巴斯先生,在中国,Informatica的云服务目前处于怎样的实施阶段,什么时候可以真正落地?

阿巴斯:现在还是早期阶段,我们的客户现在已经开始尝试云计算。很快他们就会发现,他们需要掌控企业内部的数据。

现在所有把数据放在云端的客户,都不能很好地控制他们的数据,甚至完全失去控制,因此他们的数据只能交给其他公司管理。对于这些公司来讲,问题是如何重新获得对数据的控制权。现在可以说,越来越多的公司在使用云计算的时候,会更依赖Informatica产品。

李树翀:我理解Informatica未来可能会提供的数据方面的服务,从我的角度理解,未来Informatica会提供一个很大的云,所有的企业甚至是终端的个人消费者,都可以通过这个云提供的服务,拿到他所想要的任何互联网上的数据,而且是整理好的,是不是可以这样理解?

阿巴斯:我们可以帮助客户在云里找寻他们需要的东西,用不同的方式把他们需要的这些数据整合出来。但是请记住,现在云计算还没有办法取代个人电脑计算。只要个人电脑没有被取代,云计算就只能是协助IT。

我们现在把IT理解为一个混合的产业。会有很多云公司,也会有很多大型机、个人电脑、移动终端,还有很多云服务,包括云中的社交媒体服务。对于企业来说,能不能把这些分散的数据有效整合,对其提升自身竞争力十分重要。

李树翀:近两年,国外一些大企业的大佬们纷纷来华,他们都很看好中国市场,这次阿巴斯先生来到中国,是不是也是基于这样的想法?

阿巴斯:我第一次来中国是1996年,我从来没有看到过任何一个国家的发展速度,像中国这样快,中国是一个市场机会很大的国家,中国市场有着非常值得学习的发展历程。Informatica对中国市场的承诺是,在未来三年里,业绩要翻番,当然,这段时间内我们的投资也会增倍。

记者手记

数据管理重在策略

在大数据方面,IDC预测,未来十年,超过90%的数据将是非结构化数据(例如图像、视频、MP3音乐文件,以及其他基于社交媒体的文件和在Web上进行的工作)。正如IDC所指出的,大数据拥有丰富的信息,但是在理解和分析数据方面企业却面临挑战。

一项由 Informatica 公司赞助的 Unisphere Research 调查发现,87%的受访者将企业的应用程序性能问题归咎于不断增长的数据量。在大数据面前,没有良好的数据质量,没有更加良好的数据管理策略,用于业务应用的投资将随着应用组合在企业内的增长和扩展而日渐缩水。

企业面临的挑战是如何管理不同层面的数据并进行有效分析。灵活的数据管理技术可以帮助企业从不同的系统中提炼数据,同时降低其拥有成本。高性价比和高效率的数据管理系统可以搜索、发现和整合大数据。在此基础上,通过了解不同数据集之间的点,企业可以创建一个单一的客户视角,从而获得对客户个体需求宝贵的洞察力。

上一篇:腾“云”驾“物”双引擎:创新与人才培养 下一篇:从产品到生态系统