沈浩 走在媒体大数据挖掘前端

时间:2022-09-24 11:46:41

沈浩 走在媒体大数据挖掘前端

今年春节期间,百度基于LBS(基于地理位置的服务)的大数据和可视化展现技术推出了“百度迁徙”,结合央视的报道,首次实现了全程、动态、即时、直观地展现中国春节前后我国人口大迁徙的轨迹与特征,也让老百姓真正体会到了大数据的应用价值。随着大数据的可视化实现,大数据越来越被社会大众所熟知和认可,特别是在新媒体环境下的传播领域,大数据挖掘与应用也随之愈受重视和关注。已经60年硕果累累的中国传媒大学,作为培养中国传媒人才的重要院校,在方兴未艾的新媒体领域学术上也执一方牛耳,大数据在传媒领域的应用和重要影响,同样也成为中国传媒大学新媒体领域中不可或缺的一部分。

在中国传媒大学新闻学院任教的沈浩教授,拥有20多年统计和数据分析经验、精通多种统计分析技术和传播研究方法的资深专家,尤其在数据可视化领域,堪称一位虔诚的布道者。他经常对学生说:“只有看得见,才能做得到;只有看得见,才能做得好。”记者来到位于传媒大学46号楼的大数据挖掘与社会计算机实验室,看着墙上关于实验室中心项目、中心成果、中心技术、中心目标和中心定位的介绍,初步了解实验室承担的工作和取得的成果,而在之后与沈浩的交谈中,更进一步了解了中国传媒大学在这方面培养人才所做出的成果以及未来所要努力的方向。

新媒体越来越具有大数据味道

在接受记者采访之前,沈浩刚刚从中央电视台赶回来,现在社会各界特别是媒体界对于大数据应用的重视与认可,也让他的生活倍加忙碌起来,他所带团队在中国传媒大学从事大数据研究,在业界的影响也可见一斑。

对于新媒体时代,沈浩说:“今天很多新的概念,层出不穷,包括对新媒体,到底什么是新媒体,是不是能讲清楚,其实也是一个很值得商榷的事情。其实今天谈新媒体,不是‘新’,而是‘全’媒体,甚至已经把传统媒体的那些概念等全都包含在里面。现在新媒体第一个特性肯定是要跟互联网沾边的,但是如果我们今天去谈新媒体,可能一个手机的Apps就是新媒体,比如微博、微信。再进步一说,其实更多跟数据有关。”之前,媒体和大数据是两个领域,但随着新媒体的不断发展和衍生,这两个概念越来越多地融合在了一起。“今天的新媒体,或者新兴的媒体,一定是基于数据的。如果不基于大数据,它的新媒体特性就体现不出来。因为新的媒体,就要social(社交),互动,大众传播,要通过人际互动,我们才能感知这种传播效果。所以我们说微博、微信的互动都是数据驱动的。”再例如“今日头条”,这种新闻聚合和个性化推荐内容,也是数据驱动的,现在的新媒体应该是由数据驱动的媒体。有一种说法:未来的新闻媒体,就是数据分析,新媒体越来越具有大数据的味道。

“在新媒体时代的大数据挖掘与应用,可以让我们越来越多地从数据中观察到人类行为的复杂模式,以数据为基础的技术决定人们的未来,但并不是数据改变我们,而是我们对数据可用知识的增加。”这句话是沈浩为美国复杂网络专家巴拉巴西教授的一本新书《爆发》中文版写的推荐语。这本书的核心观点是说人类行为的93%是可预知的。今天人们甚至把大数据当成了第四生产要素,是一种新的石油。最简单也最贴近我们实际的例子,今天我们每个人都在使用微博,当然也包括微信。微博跟微信是不一样的,微博的数据是可以通过爬虫或API数据接口获取转发数据。当然移动公司也可以分析我们发了多少条短信,什么时候发,但是它不能分析我们发什么内容,微博可以。“今天如果你在微博上发文字,我不光知道你什么时候发,而且你发的什么内容,说的什么事情,我也可以进行挖掘和分析。”所以沈浩经常对学生说:“你要好好写微博,将来你的雇主在雇佣你之前都会仔细看你的微博,由此了解你的性格,了解你的消费方式,了解你的生活态度,甚至你的价值观。你相信这一点吗,如果你相信,你就要好好写。”

推动大数据人才培养

大数据的影响也带来了新闻报道方式的改变,因为在新闻学院任教,更接近新闻传播领域,二者结合更让沈浩感触颇深。“过去,新闻是新近发生的事实的最新报道,现在,人们越来越关注的,比如说能不能从数据中发现新奇有趣的事情具有报道的价值。”

2014年新年,推特的一个实时数据,看到人们正好在发推特搞新年祝贺,在一个时间轴上,这也是大数据上很重要的实时应用,可以捕捉到每个城市各个地方在不同时区进入新年时人们新年祝贺这样词汇的一个捕捉和监测,这些都是大数据应用。我们可以看到,最典型的在大数据时代对于传媒特别是新闻报道领域诞生一种新的新闻报道形式,叫数据新闻。“这也是大数据时代带给我们对新闻传播领域的一种新的理解和趋势,更是对广电行业,特别是我们传媒行业提出了一些新的挑战,也是一种机遇。过去我们更多的是在传播内容上,现在我们要针对微博、软件、技术、工程实现等各种各样的挖掘能力。”也正是因为基于数据报道的业界需求,能发挥传媒大学的学科优势,学校创建了数据新闻报道实验班,从大学二年级开始招募20多个学生,学籍都转到了新闻学院。

数据新闻报道实验班的设立,最初也是源于沈浩的一些经历和想法:“当时由于中央台春季百度迁徙图的报道受到了有关领导的表扬,并提出了应该加强‘两会’大数据报道,由于人才培养和技术实现路径,有关部门找到了我。那段时间,我去了中央电视台、国际广播电台、人民日报、人民网等主流媒体,大家都有这些需求。我给他们做一些讲座,或者培训,讲怎么做数据可视化的数据新闻报道。交流过程中,我感到新闻传媒领域对大数据人才的需求,急需懂数据、懂数据挖掘的、又懂新闻的复合型人才。记得我从中央台回来,路上就给学院领导打了一个电话,我说应该从新闻学院招募一些,比如在新闻专业、传播专业、创意专业(媒创),还有媒体市场与分析专业方向,这四个专业中招募一个兴趣小组,各招10个人,然后组成一个实验室。但是领导听了我的想法以后,认为可以更具体一些。向学校领导汇报后相关领导说:直接成立一个班就可以了,先弄一个实验班。所以在学校的各方大力支持下,就成立了全国第一个数据新闻报道实验班。”

由于是第一届实验班,而且大数据这个方向需要文理的综合能力,对于学生各方面素质要求也比较高,所以我们对进入这个实验班的学生考核还是比较严的,“我们要求英语达到六级,学习成绩比较高。这次实验班招来的20个学生中有几个学生都是各学院综合测评第一名。”对于实验班学生的发展,沈浩也是信心和担忧并存:“现在大数据分析是热门趋势,是急性需求,特别是在传媒大学的背景下学数据分析研究,在媒体领域很有优势,这些学生将来的发展是很有可为的。”他给记者介绍说,关于数据领域过去培养的毕业生,很多都去了新媒体,新媒体比较热也是大趋势,急需这些人才,他们更多的不是当记者编辑,而是做经营分析和数据管理分析。比如有很多毕业生去搜狐做消费者产品体验研究;在联想做消费者用户研究;在淘宝做消费行为的商家体验研究,更多的从技术方面影响媒体。也正因为认识到数据的重要性,传媒大学很早就在研究生中开了很多定量研究课。

“但是对于实验班的学生我也有担忧的地方。他们考研可能存在问题,后续的两个学期可能更多的是学新技术,但考研往往不考这些东西。我们这个学习量非常大,要在有限的时间内学会很多过去你可能没想过的,比如网络爬虫、网页设计、新媒体的应用、可视化技术、数据挖掘的技术,这些时髦的东西硕士考试不会涉及。但我相信如果这些学生是优秀的,干什么都行。另外一点担忧是师资问题,不是一个人的能力,需要师资团队,逐步摸索和完善教学计划,这需要一个体系,如果说所有的学生最后都培养成为像沈浩一样的,我相信一定有竞争力,但这是不可能的,每个人的个性发展不可能都一样。我也不能把我的知识都让学生掌握成像我一样。这需要多个学科多个老师,这个师资队伍的成熟还需要时间的培养,当然,这也不是我们一个学校的问题,好在我们的师资相对要好一点。这个领域对于整个社会都很新,大家都在摸索前进。”

适应并迎接大数据时代

在日新月异的新媒体发展中,沈浩能够走在媒体大数据挖掘的前端,他说自己这一路走来,并没有受到冲击,而是更多的随着自己的兴趣“玩儿”出来的。沈浩毕业于北京师范大学数学系,毕业后分配到中国传媒大学(当时叫北京广播学院)的数学教研室,由于在上学时候对计算机的兴趣,他又通过学习有了扎实的计算机功底,由于在传媒大学的环境中,沈浩渐渐对新闻传播产生浓厚的兴趣,并且攻读了传播学博士,可以说是一个典型的复合型人才,这些基于他本身兴趣的学术背景,为他走上大数据研究之路奠定了扎实的基础。

沈浩在传媒大学工作后最早从事数学教学,后来因为教研室的带头人在统计分析和传统调查、传播研究方法领域非常强的柯惠新老师带领下,把沈浩和教研室的其他同事都带入到定量研究和调查研究方法上,同时得益于当时像丁俊杰(现中国传媒大学广告学院副院长)这样比较有远见的领导,把一些学数学、数理的人转到新闻学,“所以1998年开始,我们正式到了新闻学院,一直专注于在新闻传播领域的数据、定量研究。慢慢进入市场研究领域,比如说CCTV的改版研究,特别是收视率、收听率、互联网调查等等这方面研究的工作,我们做的是比较早的。”

后来基于个人兴趣和背景,沈浩2003年转到数据挖掘领域,“那时候转得很早,很少有人知道。在2005年的时候我就给研究生开公选课,讲社会网络分析。其实今天的社会网络分析就是现在的微博呈现的网络科学,大概在2009年,我开始关注互联网的数据采集,到现在成立大数据挖掘与社会计算机实验室,通过对海量数据的采集,运用空间技术、社会网络科学、情感分析技术以及可视化技术,提取空间数据和人类的情感数据,用来研究人类社会行为。”沈浩对于新的技术或者应用都会去尝试,也经常和自己的学生说要亲近互联网,特别是现在的学生都是“90后”,已经是数字一代,不断尝试才能适应新媒体时代的数据挖掘需求。“人家说我的数据分析很好,是因为了20多年,一直从事这个工作。而且这东西不累。我喜欢这个事儿。”

大数据不仅仅是中国热,它是一个现象。这个现象随着社会的发展,特别是移动互联网,以及各种技术的发展,使得我们越来越感知到将来数据在各个领域的作用会越来越大。不久的将来也许大数据这个词,人们不会时髦地去谈论,但是数据影响社会生活,影响媒体发展已经是方方面面的了。“如果你不具有这种处理分析数据的能力,你可能就处于劣势。甚至你现在的商业模式就是以数据驱动的。所以,现在IT领域和大数据专家经常提的一个话题,叫‘软件定义一切,数据驱动未来,算法统治世界’。”也许下次中国传媒大学校庆的时候,就如沈浩的设想,数据技术的应用会更加凸显,舞台上的背景屏幕画面喷射的不再是星空效果,而是通过数据应用,从世界各个社交媒介上采集来的莘莘学子对母校深切的祝福。

上一篇:吴云川 新励成 新征程 下一篇:新媒体是什么?