大数据的下一站

时间:2022-09-29 10:28:36

【前言】大数据的下一站由文秘帮小编整理而成,但愿对你的学习工作带来帮助。现在,我们可以基于数据重新检验过去的理论,重新选择支持或者否定它们。而且大数据可以帮助我们做一些过去不可能实现的事情,比如很感性化的企业管理,这在布拉德·皮特主演的电影《money ball》(中文译名《点球成金》)中有体现。 《点球成金》这部电影是根据迈克尔...

大数据的下一站

数据一直是一个热点,只是随着量化数据大量出现而进一步获得关注。往前追溯,比如国外的人口普查这类统计数据就比较健全,现在还能调用百年前的数据。现在,尤其是随着社交网络的出现,大数据呈现出以下三个新的特点:一是实时,二是全样本,三是连续性,人口普查算是全样本,但另外两点人口普查做不到。

因为有了上述三个特点,我们对社会的理解大大增加。通过对足够大量的样本,全样本进行连续监测、实时汇总,并对实时情况进行深入反馈。

重新理解社会

有了大数据之后,我们对人与社会的理解大为增加。比如以前经济学家假设人是理性的,现在我们发现未必如此。还有关于感性与理性的偏差在哪儿这一问题也有了新的解读。比如《乌合之众》这本书,因为缺乏数据支持,所以得到一些悲观的结论,但实际上,不同实验的方法会得到不同的情况,比如人们做决策的不同,取决于决策环境是否独立,作判断之前是否得到足够信息等条件差异。

不管结论悲观还是乐观,我们首先要有足够的数据支撑,而比采集数据更重要的是实证。国外的一些myth(迷思),过去并未得到印证或者数据支持,而人们习惯接受假设。

现在,我们可以基于数据重新检验过去的理论,重新选择支持或者否定它们。而且大数据可以帮助我们做一些过去不可能实现的事情,比如很感性化的企业管理,这在布拉德·皮特主演的电影《money ball》(中文译名《点球成金》)中有体现。

《点球成金》这部电影是根据迈克尔·刘易斯2003年出版的《魔球:逆境中制胜的智慧》一书改编。书中讲述了前职业棒球手、现在的球队经理贝恩在自己的三位明星球员被大财团吸引走的劣势之下,如何重新组织起球队获得成功的故事。主人公是如何获得成功的呢?通过电脑统计数据分析再制定比赛方案。

过去我们教练是通过自己的判断来管理球队,判断队员的表现和前途,但实际上一个棒球队的管理可以通过数据来实现,而且最后发现教练的判断不如数据准确,这支球队在美国历史上创造了20连胜这一历史记录。虽然这个是个案,但我们身边很多事情已经可以通过大数据来解决。

此外,在维克托·迈尔·舍恩伯格的《大数据时代》这本书中,总结了业内很重要的观点:相关性比因果更重要,如果只是旁观者,大数据很难验证因果。

因果的验证往往需要参数和改变,而大数据还有一个特点是不介入,比如社交网络大数据使用时,只是记录而不是改变。而且大数据也无法做实验,只要知道因果就可以做很多事情。当然国内有不少人还是希望知道因果,但很难,大数据能够起作用就是反映相关性。

总体而言,因为大数据的发展,我们更强调实证,更强调相关性,所以我们有些假设要重新看待,或者能否用数据来更新。当数据和假设发生冲突的时候,比如在《点球成金》电影中,当教练的经验和数据分析人员的数据发生冲突的时候,到底该相信谁。我们逐渐进入一个时代:我们甚至在很多方面不如机器。不借助设备,我们无法理解和准确地预测结果。

量化数据的发展也会促使更多人数字化。政治家未来必不可少地需要携带电脑,过去美国总统在携带数字设备上是很保守的,但现在奥巴马及其团队对于数据的借助可见一斑。

大数据与创业

关于大数据创业这件事情,我最近在反思这个问题:我们似乎过分强调创业了。其实任何创业者都不是孤立的创业者,他只是在产业里积累足够多的经验,然后出来做个公司。这是一个生态环境的问题,是依附在大树旁边的小树慢慢长起来,而不是单独长出一棵小树。我们的创业者以前更多凭感觉作事情,但未来不是。比如乔布斯做了iPhone,我们都说好,但乔布斯未必是使用大数据来判断这一趋势的,所以说大数据并不见得是一个创业辅助工具,但大数据能判断谁能活下来,当年和乔布斯同时创业的也有很多人就牺牲掉了。而这个结果,哪些项目活下来,哪些项目没有,大数据能够告诉我们。

未来,创业者会依靠大数据,在创业之前做好更多的准备,判断自己的选择是不是对的。不过,创业者其实很大程度上是要靠运气。

理论上讲,未来大数据未必会成为多大的独立产业,但大数据会越来越多被应用在数据密集型的产业里。但其中有趣的是,今天我并不认为这一轮大数据浪潮会多么深刻地改变社会,因为还没到时候。因为这一轮浪潮中,主要进展是体现在数据量充分的大公司上,而我从来不认为大公司推动社会。

我们可以回顾一下PC的历史加以对照。计算机刚起来的时候,谁使用计算机?大公司,他们用得起。而我们看到上个世纪五、六十年代的时候,计算机已经在往小型化发展了,但真正开始突飞猛进和丰富多彩是从什么时候开始呢?是在上世纪80年代小型机进入家庭之后,才开始促使整个社会的变革。只有当每个更加有活力、更自由的个体使用它,才能真正突破式发展。

今天的大数据就象当初的大型机。首先你得有数据,而数据在哪里?银行、机场、电力公司、电信公司等大公司手里。当然,国外的数据透明度高很多,但国内这些是不会给的。单个大公司的数据已经很丰富了,这是产业里孤立的每个点,都有进展,而且很丰富,但目前和人们没关系。

从大公司本身来讲,大数据的发展很有用。比如银行计算机化的发展推动信用卡的普及、航空公司的计算机化推动其联网化进程。但目前还远远没有到达让社会普遍获利、形成创业机会大潮流的时候,除非大数据资源下降到人人可以享受的地步,就象电力一样,人们连接上它就可以使用。只有人人都能触及、去使用,大数据本身才能进一步提升,目前我们大数据的开放性、丰富性还不够。美国这方面情况好一点,但大数据应用还是以大公司为主,没有大规模个人化。

哪些力量推动这一进程呢?我认为,不能依赖传统产业,它们是保守的。大公司和个人化的大数据使用未来有可能融合,但我认为公众大规模使用大数据不是因为大公司开放了系统,而是因为更多数据积累和采集的方式在公众中产生。不是因为运营商,而是因为我们在协议的基础之上,共同使用某个应用。

服务于大公司当然目前有很大的价值,但我认为全社会接触大数据另有发展路径。第一步是通过简单应用,形成数据潮流和汇总,各个点汇集起来;第二步,通过对几个不同开放来源的数据汇总,提供更多内容和服务。今天我们看到的大型机还是主流,利用大企业的海量数据做处理的思路还是绝对主流,而我认为,这个趋势未来可能与公众大规模使用相并进,前者也有可能旁落。

大数据有个特点是必须要很实战、要落地,从这个意义上讲,创业者往往是有智慧、有能力,但是没有资源。国外有个创业公司Skybox,它利用卫星拍摄地球上某个地方的图片,但是这个数据采集是要有资金支持的(该公司目前已共融资9100万美元),Skybox通过新的两款高清摄影微卫星一起拍摄地球。

创业者需要获得数据,拿来建立模型,用数据训练模型,与现实做比对,而前提是有足够数据。因此创业者需要具备实现建模的能力、数据处理能力,还要有数据来源。目前,大公司不是创业者的主要数据来源。

那么,为什么还是会关注大数据的创业项目呢?首先,我们关注的是人,各方面的需求汇总起来,便于我们理解人,所以2C的这方面会有商业机会。

未来会有更多商业化的数据产生,比如用户愿意佩戴某个可穿戴设备,比如手环,用户愿意上传数据,开放出来,平台方可以据此给我的客户提供更好的交叉服务。目前还相对比较孤立,现有的在每个细分领域里孤立收集、分析数据的点,丰富到一定程度之后,自然会有人去做标准化工作,把A数据与B数据打通。

所以,未来会有越来越多的商业化大数据出现。这些商业化大数据,通过商业行为取得,比如用户在手机上安装某个软件,认同对方使用公布这些数据,具有一定的开放性,未来变成一个小平台提供给别人。现在社交平台已经在做了,比如新浪微博、腾讯的QQ和微博。这需要我们走另一条路,这条路更远,但我认为是对的。今天就象当年大型机的时代,但我们可以干PC路向的事情,这是未来。

上一篇:时趣:社会化营销的“大管家” 下一篇:融360:大数据与金融垂直搜索