大数据技术背景下的新闻生产模式创新

时间:2022-08-20 07:54:01

大数据技术背景下的新闻生产模式创新

机器人新闻(Robot Journalism或Autom Journalism)是使用算法自动从结构性数据中生成的新闻,这种依赖数据生成新闻的程序一旦开发出来就可以高速生产出海量内容。①目前,机器人新闻在新闻生产领域的应用还仅仅局限于财经报道、体育赛事报道等方面,这些新闻报道类型的典型共同点就是其新闻产制通常涉及大量数据、图表和量化分析,新闻写作内容和结构有相对固定的标准和模式,变化的只是涨跌起伏的数字,这使基于大数据分析和自然语言模板生成技术的机器人新生产有巨大的发挥空间。《纽约》杂志著名的撰稿人凯文・罗斯认为,机器人新闻恰恰是人类新闻从业者疲于应付与大量数据相关的“体力活”的产物。任何数据驱动的领域,比如财经类、体育赛事类、健康咨询、民意调查、天气等报道都可以依赖机器人写作。机器人新闻付诸实践只有四五年的时间,但其技术研发者坚信它在20年或更短的时间内将获得普利策新闻奖。

从文房四宝到电脑打字、激光照排,到现在的机器人写作,传播技术不断经历着跨越式的变革,机器人新闻的出现和发展预示着新闻生产工业化时代的来临,在不久的将来,机器人生成内容(CGC)将与专业新闻记者生成内容(PGC)和用户生成内容(UGC)在数字化新闻的角逐中实现三足鼎立。本文聚焦中外财经类机器人新闻生产实践,选取该领域目前最具代表性的两家媒体的新闻机器人――美联社的“语言大师”平台和腾讯的Dreamwriter――进行生产模式的分析,总结出其生产模式依托大数据资源实现了内容自动化生成、个性化服务和智能化聚合三个方面的创新。

一、“循规蹈矩”的自动化生成

2014年,美联社率先使用“语言大师”(Wordsmith)撰写每季度的公司财报,机器人新闻进入人们的眼球。美联社将公司财报数据输入到“语言大师”内容生成平台上,软件根据预先设定的程序自动生成一条150~300单词的新闻,编辑在其之前预览一遍即可,这样的新闻生产模式正好适合需要定期但是格式僵化的财报类新闻的生产,机器人新闻这一新生事物也借助美联社这一在全球新闻生产领域颇具影响力的媒体而广为流传。2015年腾讯的《8月CPI同比上涨2%创12个月新高》成为国内首篇由机器人撰写的新闻稿,它出自腾讯开发的自动化新闻写作机器人Dreamwriter。它可以根据最新的数据,利用内置算法在第一时间内形成稿件,经编辑审核后上传平台,一分钟内将资讯送达用户。②

根据对“语言大师”平台和Dreamwriter财经类机器人新闻生产的流程进行观察和分析,发现其有近似的运行逻辑:机器人新闻软件依赖大量的数据来源,遵循特定报道类型的常用模式,大批量生产新闻。它具体的生产过程包括以下步骤:首先,程序软件以新闻关键词和数据指标为线索,在已有的数据库采集新闻写作所需的素材。其次,对采集到的数据进行结构化归类和多维度统计,将数据呈现的变化趋势与系统设定好的新闻点进行对比来确定报道方向。再次,利用机器人模板“遣词造句”呈现出描述性新闻。这个过程类似于完形填空,机器人只需要在设定好的语境中进行简单的填充即可。最后,在之前人类编辑对新闻稿内容进行审核与润色,这个环节是机器人新闻生产中唯一有人参与的环节。

机器人新闻的出现是科学技术进步的产物。机器人新闻通过设置相关的程序对数据进行挖掘分析,再对其中有价值的点进行模式化写作,这是对传统新闻生产模式的颠覆,也是高科技对于海量大数据资源的开垦和利用。但同时机器人新闻也是新闻业面对不景气的生存环境所采取的用以削减成本的无奈之举。

面对激烈的竞争,机器人新闻自动化生产的快速高效为媒体带来了“突围”的可能,未来,媒体上出现越来越多署了机器人名字的新闻绝非天方夜谭。但是,当我们欣喜于机器人新闻一触即发的自动化生成速度和数量时,也要认识到这种过于简单的生产模板带来的稿件质量不高的问题,美联社总编辑费拉拉认为,机器人新闻内容的生硬和重复直接影响了稿件的质量,稿件缺乏人性化和个人风格,不能为读者带来阅读。③

二、“信息小灶”的个性化服务

机器人新闻生产系统中预先设定了结构化的数据文件,它可以创建多种叙述模板,从而创建分支内容,为受众提供更加细化的服务。据了解,“语言大师”通过与美联社等的合作确定了超过3亿可使用的新闻写作模板,这一规模随着机器人新闻快速普及的趋势还将不断扩大。在对新闻机器人设定模板的时候,根据实际情况对模板进行细分,用不同的词汇、短语或段落更为贴切地描述事件本身,系统会根据具体的事件细节生产稿件,并可以根据受众信息接受习惯更新创造性的细节,使之更符合受众的个性化需求。当受众一时兴起想查询哪只冷门股票的变动情况时,总有一篇符合受众阅读习惯的报道及时呈现在眼前,这是人类记者提供不了的服务。

随着自然语言和算法技术的不断成熟,机器人新闻生产过程中出现了越来越多的新尝试,充满人情味和个性化的写作技法的探索就是其中一个典型变化。近期的机器人新闻可以做到根据报道的详略、侧重点对遣词用句进行调整,新闻呈现也有了创新,可以针对不同的受众提供不同的新闻版本。“语言大师”平台可以根据受众的群体特征选择报道角度,比如针对持某支下跌股票的用户进行报道时会避免使用负面用语。从现有的应用情况来看,机器人新闻还可以实现文风的定制。对特定读者的阅读习惯进行数据挖掘与分析,将读者喜好的语气、角度等融入新闻报道中,根据其常用的词汇和语法习惯组织语言,从而完成一篇易于为受众接受和喜爱的新闻稿。

“海量+个性化”的组合将是未来机器人新闻发展的新方向。海量内容生产是机器人新闻的显著优势,据统计,“语言大师”2015年写作的稿件总量为10亿篇,而这些文章的平均浏览量在100万次左右,除此之外,它还建立了50万则Twitter内容。④而个性化内容生产将成为机器人新闻的新优势。2015年10月,“语言大师”平台推出了面向公众的版本,用户通过在该应用上注册就可以拥有一个个人模板,之后应用会帮助用户根据最新的数据生成文章。⑤在这个过程中,用户等于拥有了个人数据处理专家,它生成的文章不再面向大众,只有一个用户的专属定制可以更好地满足用户需求。2016年,腾讯Dreamwriter开始推出“风格化”“个性化”写作,其财经报道不再是“千人一面”,而是针对不同用户的个性化需求进行写作,这很好地适应了当今人们信息需求个性化的追求。囿于技术的发展,目前该功能还较为单一,分类较为粗略,其财经类新闻生产只能简略地分为“研判版”和“民生版”两个版面,随着技术的发展,该个性化服务将越来越精细。

上一篇:融媒体时代新闻生产要注重内容+体验 下一篇:针对我国互联网金融发展存在的问题及解决对策...