试论大数据价值特征及价值构成

时间:2022-03-25 05:13:25

试论大数据价值特征及价值构成

摘要:本文通过批判性地吸收其他学者对大数据价值的论述,创新性的提出了大数据价值的两大特征以及大数据价值释放所需的三大要素。笔者认为大数据的价值具有“隐匿性”和“持续性”特征,同时大数据价值的充分释放需要借由“数据、技术和大数据思维”三大要素的协同发力。笔者认为在对大数据价值特征及构成要素进行认真研读之后,才能对大数据时代下的社会变革进行有效解读和预测,进而趋利避害,造福社会。

关键词:大数据 价值 特征 云计算

当前学界和业界对大数据的研究主要聚焦于大数据对政府服务、企业营销以及传媒业的影响方面,这无疑有助于加强服务型、廉洁高效型政府的建设,帮助企业实现精准营销和助推传媒融合转型。但是笔者认为除了对大数据的影响进行研究之外,还应该思考为什么大数据能够对社会带来革命性变化,或者说大数据价值释放的驱动因素是什么。

大数据价值特征

笔者认为,“价值就是有用性”,即相对于价值评估主体而言客体所具有的有用性或积极意义。具体到本文,大数据的价值就是数据的升值效用,即有利于创建廉洁高效的服务型政府,有利于提升企业营销水平。

隐匿性。大数据的“隐匿性”是说大数据的价值潜藏在线性和非线性多类型数据之中,它需要“提纯”技术的介入才能被挖掘出来。我们通常说大数据价值密度低,其实就是大数据价值隐匿性的体现。大数据的价值并不是只要拥有了足够多的数据,价值就自然而然地显现出来,也不是说数据越多价值就越大。它隐藏在数据堆中,需要经历高效的存储、挖掘之后,再通过可视化技术才能加以呈现。如果不对数据进行处理分析,不把隐藏的价值挖掘出来,就会造成越来越多的“僵尸数据”或“数据坟墓”。在大数据时代之前的数字化时代,数据往往仅作为交易的对象,交易过程的结束也就意味着数据价值的转移和分解。而在大数据时代,数据的真正效用在于它未来的潜在价值,现在看似没有价值的杂乱数据,也许在不久的将来就会显示出非凡的社会效益和商业用途。

持续性。大数据价值的持续性特征就是强调数据价值通过二次利用或多次利用仍不衰减,仍然具备指导现实和预测未来的效用。在笔者看来,大数据这种能预测未来的能力俨然建立在大数据价值持续性的特征之上。也就是说,大数据的价值不像普通产品的价值,一次性消费后就荡然无存,大数据的价值是开发不尽、用之不竭的,我们完全可以通过调取存储设备中的数据,对其加以重复利用、纵深挖掘,实现价值总量的叠加。对数据的挖掘越深入,价值呈现越明显;对数据的重复利用越多,价值的持续效应就会越强,就会发现不同事物之间更多的相关性,对未来的预测也就更加准确,这就是经济学家所言的“非竞争性”的好处。

大数据价值构成的三大要素:数据、技术和大数据思维

和君商学院赵国栋等人在《大数据时代的历史机遇》中提出的一个核心的观点就是:缺少数据资源,无以谈产业;缺少数据思维,无以言未来。这个观点强调了“数据”以及数据“思维”的重要性。但笔者认为,大数据价值的释放还需要增加“技术”要义,三者缺一不可。其中数据是根本,技术是手段,大数据思维是催化剂。

数据。占有大量数据或者能够收集到可观的数据是大数据价值发挥的根本前提,没有达到研究需要的数据资源,一切将无从谈起。

首先,占有大量数据。数据的产生不是凭空的,而是在人类计量和记录的基础之上逐步诞生的。从无数据到有数据、从小众数据到今天的大数据,数据价值才得到更进一步显现。大数据的典型特征之一就是数据量的无界性,小范围的数据采样已不合时宜,大数据价值的发挥要建立在大量数据之上,能不能占有大量数据可供专业人员挖掘是大数据价值发挥的首要前提。

其次,数据思维的变革。思维决定行动,大数据时代下思维的创新与变革和数据价值的释放休戚相关。我们所追求的数据并不仅仅局限在数量之上,还应该在数据质量、数据相关性、数据结构、数据模型等方面,因为我们不再仅仅通过数据来获得因果关系,而更倾向于相关性和关联性;不仅追求随机抽样,而更想要达到样本等于总体的效果;不仅追究结论的精确性而更注重混杂性,因为在有限时间里获得事物发展的方向和脉络比追求严密的数据结构和模型要重要得多。

第三,无所不在的数据。“数据无处不在,一切皆可量化”是大数据时代的典型特征,文字、图片、喜好、位置、沟通甚至意图都可以量化。一切皆可量化才造就大数据时代,才能够对社会、商业和人类生活带来根本性变革。占有或者能够收集大量的数据在当今的商业竞争中有两大优势:第一就是通过大数据的分析可为企业战略决策提供参考;第二就是对数据的“打包”出售,再次获利。

技术。百度CEO李彦宏在2015年百度联盟峰会上首次提出要收集“新数据”,“找到有价值的信息,而不是看收集了多少信息”,强调要通过企业级软件和人工智能实现数据价值的最大化。而企业级软件的设计和人工智能的实现都需要相关技术的突破,因此技术对于大数据的价值释放举足轻重。

首先,技术发展能减少“数据坟墓”。随着数据以PB级别的翻倍速增以及数据挖掘技术的滞后,“数据坟墓”和“僵尸数据”大量出现。同时受制于存储器的效能,我们不得不删除大量数据以释放存储空间。然而大数据的价值是潜在的、未来的,是隐匿的和持续的,我们删除数据的过程也是数据价值的贬值和损耗过程。数据一旦被删除,就会造成某个数据节点的断裂,进而导致数据价值链的残缺。因此占有大量数据或者能收集到大量数据只是数据价值释放的第一步,而通过相关技术手段挖掘有效信息,并通过可视化手段对数据加以呈现和利用才是关键。通过大数据的技术挖掘,让潜藏在“坟墓”中的数据重见天日,也就为数据价值的释放和利用提供了更多可能。

其次,数据价值释放依赖技术的发展。对数据价值的提取主要涉及到存储、挖掘和可视化技术,大数据价值的提取也正是经历类似三个步骤。随着大数据产业对技术的依赖性增强,新催生的大数据分析师、数据管理专家和数据科学家等专门数据人才的工作范围和影响将会进一步扩大,大数据价值的释放对技术的依赖也会越来越强。

分布式存储技术与大数据价值:通过多个节点和多个CPU核数来分担存储负荷,利用位置服务器定位存储信息,解决了传统存储方式中存储性能和安全瓶颈问题。存储效能的提高和存储空间的扩展,减少我们删除数据的概率,间接地增加了数据的潜在价值。同时依靠大量的数据存储,实现对多密度、多层次数据的占有,也就为进一步的技术挖掘和可视化提供可能。

数据挖掘技术与大数据价值:通过先进的云分析和处理平台的运用,大数据价值的提取和释放机会将进一步增加,大数据潜在的、持续的价值将会被机器更加智能和高效地挖掘出来。

可视化技术与大数据价值:关键是如何把挖掘到的稍显复杂的数据信息通过可视化方式(信息图、可视化视频和互动图表)最终展现出来,让政府决策者、企业管理人员等在阅览之后能够对事物之间的关联性有着较为明确的认知,从而辅助科学决策,彰显大数据的社会价值和商业价值。

大数据思维。根据舍恩伯格的定义,大数据思维就是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解决的问题提供答案。通过占有大量数据和掌握关键技术,大数据的价值在很大程度上已经释放出来。但笔者认为,我们只看到了大数据价值的冰山一角,仍然有一部分甚至是大部分价值被雪藏。日益增多的“数据坟墓”正是缺少数据思维的表现,面对千方百计搜集来的宝贵数据,要不就是因为缺少技术手段无法提取数据价值而无可奈何,要不就是缺少创新思维而对数据无动于衷。

首先,要先人一步。大数据挖掘和可视化技术通常掌握在咨询公司、技术供应商和分析公司手中,但是掌握了专业的数据技术并不意味着能提出创新性用途的方案,关键是要具备大数据思维。舍恩伯格强调了具备大数据思维的人或企业能够先人一步的发现机遇,虽然自身并不占有大量数据或掌握专业技能。如布拉德福德・克罗斯的团队通过分析过去十年航班的情况来预测航班是否会晚点,这让掌握航班信息数据的美国运输局和美国联邦航空局大惊失色。这是典型的用大数据思维“改造社会”的实例。

其次,要数据公开。从舍恩伯格对大数据思维的定义中我们还能发现数据思维的另外一层属性即“公开”或“共享”。笔者认为,通过开放式思维,建立数据共享联盟或专门的开发平台已成为未来大数据价值继续释放的关键。美国有data.gov网站和阳光基金会,英国有政府倡议的开放式数据中心和开放知识基金会,澳大利亚、巴西和智利也相续出台并实施了开发数据策略。这些开放数据的举措定能促进大数据相关研究的蓬勃发展,进而继续改造社会,提高国家和企业竞争力。

以上所讲的数据、技术和大数据思维三要素既是大数据价值释放的前提条件,也是未来企业竞争的法宝,如世界科技巨头谷歌公司就是三者兼备的典型,它既占有大量的数据(通过谷歌浏览器搜集到的数据),也掌握着尖端的数据挖掘技术,同时还具备超前的大数据创新思维(如向公众开放免费谷歌地图为制造无人驾驶汽车做准备),因此谷歌公司作为世界科技巨擘的位置不易撼动。

因此从大数据价值释放的影响因素来看,政府能否把大数据提升为国家战略,能否开放数据为社会所用直接关系到廉洁、高效、服务型政府的构建;企业能否做到在有限时间内搜集有效数据,并分析和可视化数据直接关系到营销水平高低和蓝海市场的开辟;对于传统媒体来说能否跟上大数据时代的步伐,如转变经营方式、人才培养模式、运作流程,更是关乎生死存亡的大事。

(作者单位:河北大学)栏目责编:陈道生

参考文献:①邬贺铨:《大数据思维》[J],《科学与社会》,2014,01:1-13。

②维克托・迈尔-舍恩伯格,肯尼思・库克耶著,盛杨燕,周涛译:《大数据时代:生活、工作与思维的大变革》[M],杭州:浙江人民出版社,2013年。

上一篇:市政给水管道施工技术要点分析 下一篇:提高房产测绘精度的分析