独家新闻,“机器人”报道

时间:2022-10-26 04:19:03

独家新闻,“机器人”报道

Alex Wilhelm是美国技术博客TechCrunch的记者,最近,他刚刚写了一篇文章,抱怨新一轮财季的到来让他有种“想用尖锐物体戳瞎双眼”的冲动。

当一家公司季度财报后,Wilhelm必须在很短的时间内从中提取出最重要的数字,并搞清楚这些数字背后更宏大的故事是什么―到底是公司净利润下降、销售成本增加、营业利润率扩大,还是丧失了有效执行力……当然,他还需要给文章快速拟一个一目了然的标题。

然而,往往就在Wilhelm刚刚文章,赞扬某家公司当季财报数字表现亮眼的十分钟后,他就会接到这家公司市值大幅缩水的消息。这使得Wilhelm不得不在上一篇报道的基础上更新该公司最新的收入表现。“你同时还要想,这一现象对它所处的行业来说意味着什么,如果一家公司即将上市,它的收入数据到底是会帮助还是阻碍其IPO等等诸如此类的问题。”Wilhelm写道。

看来,Wilhelm已经对所从事的工作产生了“职业疲劳”,他觉得自己花了太多时间在收集和撰写硬性信息上,以致对行业的分析显得并不到位,下的判断也不够有说服力。

美联社用来商业新闻的“机器人”,或许能让他看到从枯燥乏味的财报中解脱出来的希望。美联社近期正式宣布,自今年7月起,每个财季的财报新闻撰写工作都会交给“机器人”去完成。

这里的“机器人”,实际上指的是一套利用人工智能技术来帮助撰写新闻内容的计算机软件。它能把记者们研读财报并在电脑上敲打出一篇文章的时间缩短为几秒钟,并自动生成一条150至300字的新闻报道。

这意味着,今后美联社不仅能够确保自己可以在第一时间自动全美上市公司当季财报的新闻消息,同时,其每一财季的报道数量也能够从过去人工撰写时期的300篇提升为“机器人”自动撰写的4400篇。

其实,相比新闻生产,面向终端受众的新闻阅读类技术更为成熟。比如去年被雅虎以3000万美元收购的智能新闻摘要应用Summly。它能将新闻内容自动提炼为不足400字的摘要文章,并根据读者兴趣,将新闻归类,确保读者在有限的时间内,优先看到最想看的。该App一经推出,便大受欢迎。

不过,在新闻报道的自动化撰写中,“机器人”必须更加聪明。它们除了需要像Summly那样能够在大量的数据中主动识别并快速提炼最关键的信息,还要懂得从诸多新闻写作的模板中挑选出最适当的一个,然后自动填写并新闻报道。

为美联社提供“机器人”新闻撰写软件的公司是位于美国北卡罗来纳州杜伦市的一家初创公司Automated Insights,它与股市分析研究机构Zacks Investment Research共同向美联社提供服务。

Automated Insights创立于2007年。在此之前,创始人兼CEO Robin Allen曾在思科公司担任了13年IT部门工程师,负责大规模的IT建构项目,比如对思科公司的内部架构系统进行翻新,为其提供基于云计算的解决方案等。

3年前,Automated Insights的定位还只是一家比赛数据推送公司。Robin Allen最早从体育比赛数据的自动化生成领域看到了商机。2011年,Automated Insights联合包括雅虎在内的多家公司,开发了一款可以根据体育赛事实况自动编写体育新闻的软件,报道字数从50字到100字不等。在一场4小时的比赛中,这款软件可以以每秒钟500篇的速度,自动撰写出比ESPN、CBS、福克斯等媒体的报道总量还多得多的新闻。

与美联社合作多年的运动统计网站STATS同样是Automated Insights的作品,它被用来为新闻撰写软件输送实时数据。上个赛季,美联社曾使用这项服务自动生成橄榄球球员的排名系统。雅虎也曾用它为上百万用户提供定制化的Fantasy Football新闻报道服务。

“我们渐渐发现这款软件可以应用于许多垂直领域,除了体育外,还有财经、消费者研究、商业智能、网站分析等。”Automated Insights公司公共关系部门经理James Kotecki对《第一财经周刊》说。而体育领域内,它也可以在个人体育锻炼及体能分析、赛事实时追踪等细分环节中应用。

Automated Insights不仅为美联社这样的媒体客户提供自动新闻撰写服务,它还能为企业客户在管理链条的任何一个步骤上提供量身定制的分析报告。这些报告能在数据图表和表格的基础上自动归纳出一些行业趋势。

所有这些业务都基于一个叫做Wordsmith的平台。它是Automated Insights的核心竞争力。2011年,公司还在为雅虎编写体育新闻时,创始人Robin Allen就为这一平台申请了专利,并于2013年8月正式获得专利认证。

“我们的大数据团队通过Wordsmith的专利语言来建立各种各样的业务算法。这些算法会决定每篇新闻报道的选题是什么、语气和语调、写作形式,以及如何运用词汇生成最终文章。”Kotecki解释说,“最后呈现出来的文章可以是任何媒体形式的体裁―网站、E-mail,甚至社交媒体。”

自动化信息编写的商业前景也为Automated Insights吸引了一批重要投资人。6月底,它宣布获得了美联社、三星等四家公司共计550万美元(约合3414万元人民币)的B轮融资。

不过,Automated Insights并不是这个新兴商业领域中唯一的玩家。今年4月,《洛杉矶时报》记者兼程序开发员Ken Schwencke就利用自己两年多前研发的Quakebot系统率先报道了当地发生的4.4级地震。

Schwencke首先与美国地质勘探局取得联系,要求对方向他开发的这一地震新闻自动生成系统实时发送地震信息。系统会对收到的信息进行过滤,根据震级判断是否具有报道价值。

比如6.0级以上地震会自动报道;3.0级至6.0级则会将报道发送至编辑,由其决定是否值得追踪报道;3.0级以下则不会收到消息,因为多数情况下,这意味着不值得大惊小怪。

确定选题后,自动提取的重要内容会被填入提前设置好的文章模板,生成最终文章。Quakebot所撰写的那条地震新闻,从收集信息、写作,到最终,一共只花了3分钟的时间。

目前,《洛杉矶时报》还开发了一套用来搜集当地犯罪新闻的系统,根据警方提供的信息,自动判断价值并进行追踪,最后生成报道。

而Automated Insights最直接的竞争对手是一家叫做叙述科学(Narrative Science)的公司。包括《福布斯》在内的20多家媒体从2011年就开始使用其自动撰写新闻报道的软件。该软件的应用领域同样囊括体育赛事、财经、数据分析等。叙述科学甚至预言:“机器人记者有可能在5年内赢得普利策新闻奖。”你可以直接把它当成一句广告语,精神世界可以大批量生产是件可怕的事。

叙述科学的技术总监、高级合伙人Kristian Hammond早在1990年代中期就发明了一个可以追踪用户阅读和写作习惯的软件。在西北大学任教期间,他的几名学生则创造出一个名为“统计猴”(Stats Monkey)的软件原型。有了这些基础,Hammond最终为叙述科学研发出一套与公司同名的自动撰写新闻系统。

此类系统的技术核心是高质量数据的积累。一方面是信息本身的数据,因此,体育、财经等蕴含丰富数据的领域会成为该类软件最先的用武之地。另一方面,则是文章模版数据,它决定着将提取的数据变成真正的新闻―这时就需要仰仗真正的记者。电脑通过对他们过去完成的大量报道,以及其中的立意角度、文章结构等方面的大数据分析,形成一系列标准化的撰写方案。

而相比叙述科学公司,Automated Insights认为自己的优势正在于拥有3亿种的写作模板,撰写速度也已经达到每秒钟1600篇短文。

对于其技术是否会导致记者们失业的问题,Kotecki对《第一财经周刊》表示,“这简直太荒谬了。”“我们的技术深入到了人类本身无法企及的层面。Wordsmith所做的工作是对记者的解放,他们因此有更多的机会去尝试更有意思的事情,读者也会因此获得更有趣的故事。”他说。

换句话说,此类技术并不会将新闻行业变成完全标准化、流水线的生产,媒体从业者和计算机或许可以借此进行更深入的分工合作:该类新闻撰写软件的应用可以将记者们从规范性的事实报道中解放出来,转而在更深层次上进行思考―或者在写作角度和写法上尝试更多创新,或者专注于深度评论。

“数据给你提供的信息是谁在什么时候什么地点做了什么事,而记者能够聚焦于事情是如何发生的以及为什么发生。记者当然更擅长做人类所擅长的分析研究工作,所以就让计算机去做它们擅长的事情吧!”北卡罗来纳大学教堂山分校新闻与传播学院副教授Ryan Thornburg曾公开表达对Automated Insights的赞赏。

美联社则在声明中指出:“相比花费大量的时间和精力来简单的财报信息,我们现在倾向于用自动化手段报道全美所有公司的财报新闻。我们的记者也因此可以把更多精力花在报道和探究这些数字背后的商业意义上。”

美联社目前还在尝试把这项技术推广到撰写全球公司的商业财报新闻中。许多美联社员工也已经在诸多场合表示自己确实从中获益。

“我真的不想给美联社说好话,”Alex Wilhelm在TechCrunch的博客中愤愤地写道,“但是快给我来一台天杀的机器人!我有18美元,谁能电邮一个给我吗?”

上一篇:开拓“另类”酒店市场 下一篇:多洛定理让你慎用