数据新闻可视化的不足与改进

时间:2022-07-04 03:29:53

数据新闻可视化的不足与改进

面对一批数据,如果没能对其产生过程做周详了解,没能发现其中的盲点,所下的判断往往是危险的。

经过近些年的不断实践,数据可视化报道在互联网已经成为常规产品,在纸媒上也日益增多。笔者注意到,除了新浪、网易等门户网站设置专门的可视化新闻栏目外,识局、智谷趋势、中国政库、饭局阅读、一图观政等大量微信公号相当活跃,不时会出现让人眼前一亮的数据可视化报道。而新京报、南方都市报、东方早报、壹读、南风窗等报刊,也多设置固定的数据新闻版面。可以说,数据可视化报道已由边缘走到中央,而且不少作品令人印象深刻。

数据可视化报道何以蔚然成风?客观方面,各种资讯的数字化使信息收集变得容易,各种软件不断升级更迭,使制图手段丰富异常,早已超越昔日简单粗糙的图表形式;而政务公开已成不可逆转的趋势,从中挖掘更具深度的数据信息变得容易许多。主观方面,数据新闻相比传统文字报道更新颖、更稀缺,媒体人也将其视为吸引读者眼球的新利器。

不 足

数据可视化报道是一项新鲜事物,它通过图表和简单的事实来展示观点、阐明道理,而为读者所乐见。笔者结合自身实践与对业内的观察,对这一报道形态存在的不足,做一些初步分析。

其一,数据解读偏狭,结论难以服人。数据是由专门的人员或者机器出于特定的目的收集而来的。我们必须了解数据产生的过程,并洞悉其中可能发生的偏差和错误。中国社科院今年5月的蓝皮书《形象危机应对研究报告2013~2014》,公布了各省的官员素质形象排名,把危及官员形象的新闻分为贪、渎、枉、色、假五种,看看哪个省的官员负面报道案例最突出。结果显示,15.40%的官员负面报道典型案例涉及广东官员,进而得出广东官员形象在全国最差这一结论。大量媒体对这一报告作了报道,同时,它也引起不少媒体的吐槽。盖因其计算方法是:1.形象危机度(%)=某省案例数÷全国社会责任事故典型案例总数;2.典型案例总数=2013年新华网、人民网、央视网报道的负面新闻事件2074个。微信公号“一图观政”就质疑:1.前述三家媒居北京,它们对北京的负面事件会一视同仁报道吗?它们会对边疆省区足够关注吗?2.该报告中“官员形象危机度”计算方法靠谱吗?因为根据常理,某省媒体发展水平和市场化程度高,对地方政府的曝光率自然就会上升,官员的“负面报道”也会相对增多。但这并不能说明该省官员形象危机度很高。以广东为例,其不少官员虽然被媒体批评,却因坦诚面对善于“纳谏”,而博得开明口碑,形象并不负面。显然,这一组数据根本无法支撑广东官员形象最差这一结论。这样的数据可视化报道就无法获得读者认可。

再比如,德国总理默克尔今年7月在清华大学发表演讲。南都借此机会,“回溯”2000年以来在中国高校做过公开演讲的外国领导人(包括国家首脑和政府首脑),看看他们是如何通过演讲、与学生或学者互动来阐述立场,寻求认同。在这期间,共有73个国家的97名外国领导人在华高校演讲过114次。南都记者发现,美国连续三届总统访华演讲,每次学生的提问几乎没有太大变化,“”、“美国应该反省”等每次必然涉及。如果据此判断,我们或会得出中国学生视野狭窄、缺乏提问能力的结论。这些学生为何没能提出一些更有新意、更贴地气的问题?幸而记者对这一数据背后的因素做了进一步了解,发现如果有外国领导人前来演讲,一些院校会将学生想要提出的问题进行收集和挑选,最终选出提问者――谜底原来在这里。在推出这一数据时,将上述背景做一说明,我们的结论就会真实有力得多。读者自然会体会到,发言人式的“外交辞令”并不能代表中国学生的面貌。

可见,面对一批数据,如果没能对其产生过程做周详了解,没能发现其中的盲点,所下的判断往往是危险的。数据并非天然地占有真理。如果不能认识数据收集过程中的偏失并加以说明,读者就会深深质疑:你对因果关系的理解正确吗?

其二,议题设置不佳,挖掘缺乏纵深。比如,由媒体人转为媒体研究者的钱钢先生曾指出,词语有生命,通过政治词语的出生、发育、萎缩、消亡和不同政治词语构成的色谱变化,政治家的施政轨迹被勾勒出来,不容易一眼看出的政治趋势会显露出来。他发表多篇“语象”报告,其中,2013年年底发表的年度“语象”报告,指出中共党内的8大“开明话语”――“邓小平理论”、“三个代表”、“科学发展观”、“和谐社会”、“以人为本”、“政治文明”、“党内民主”、“民主政治”,在2013年的传播频度都跌到历史最低点。

包括南都在内的不少媒体,也试图对不同时期的官方报告作出解读,但常聚焦于“中国”、“人民”、“政协”等词以期观察某种政治趋势。从效果来看,并不好。因为这些相对空泛的词语时代色彩较淡,并非衡量时局变化的敏感温度计。读者会感觉记者只是为统计而统计。所以,报道主题与词语的挑选,仍有赖于新闻人更加到位的判断和提炼。

再如,不少媒体仅止于“官方如何报告,我就如何报道”,缺乏问题意识,没能进一步做数据挖掘与数据比较。比如,随着财政透明度普遍提高,对于政府的三公消费,如果停留在可视化呈现这些数据,读者可能并不满足。从这些数据中发现问题才能让读者有所收获。如一个镇街的接待费预算有5000万元,官方通报的这个孤立的数字价值并不大,但如果采编人员将其与往年数据、与其他镇街数据做出对比,这组数据的意义就呈现出来了。如果其中有猫腻,我们还可做进一步追问。这样的数据可视化报道,才不是绵软无力的展示,才可望在议题上获得突破。可见,选题如果缺乏热度,仅做形式上的追求,对读者的吸引力是有限的。

其三,错过新闻热点,传播效果平平。一般来说,与文字稿、摄影图片相比,数据可视化产品的生产过程要复杂不少,生产周期也相应变长。在互联网时代,社会热点的转换异常迅捷,各领两三天,所以,许多精心准备的新闻产品生不逢时,容易为人忽略。但不少媒体没能认识到数据可视化报道的“周期性”问题,只管耕耘,不问收获,最终是事倍功半,效果不彰。比如,在领导人出访后一两个星期才推出相关报道,在一起大火灾过后半个月才做出相关产品,这些煞费心血的作品往往自生自灭,无法获得广泛传播。

这里,笔者要举出一个正面典型。今年5月22日,新疆乌鲁木齐市沙依巴克区公园北街早市发生严重暴力恐怖案件,共造成39名无辜群众遇难,94人受伤。微信公号“一图观政”在新疆乌鲁木齐案发生后的五六个小时后,即推出了《数据说:中国恐怖袭击到底多严重?》,对案的发生地、组织形式、袭击形式、袭击目标、伤亡人数等,进行周详的统计与分析,网上传播极广,影响力不小。该公号是如何做到快捷的呢?据该公号负责人透露,他们已对近些年的恐怖案件做了三四个月的整理与分析,甚至翻译了若干外文资料,掌握了丰富的数据。这次恐怖袭击案发生后,他们就以此作为新闻由头,推出了筹划已久的数据专题。原来如此!

其四,专业积累不足,技术数据错误。新闻的数据化开发仍处于初级阶段,在缺乏靠谱的官方数据时,一些媒体自行做统计,却缺乏严谨性与专业性,导致数据错误,结论失真。例如,广州一家媒体曾做了一期盘点:哪些职位会成为广东省委常委?文中有一个结论:广州、深圳之外,其他城市的市委书记一般不会成为省委常委,但珠海市委书记李嘉则在2012年打破了这个惯例。其实,早在2000年,黄龙云任职珠海市委书记时也是省委常委。在数据统计过程中,也需要良好的专业素养,否则百密一疏,犯下低水平错误,就很难取信于读者。本来数据统计是为了增强可靠程度的,但一个小小的错误,就会全面毁掉貌似不可移易的根基。

其五,制图过于炫技,目标定位不清。很多报纸在做新闻时,经常借助可视化工具,追求直观、生动,但不少版面仅仅追求新奇、美观,并没有充分展示数据之间的逻辑关系,有些制图展示数据过多,缺乏取舍,且彼此关系不清,让人难以理解。不读则已,越读越糊涂。也许,记者和编辑误把新闻可视化当成数据化,本身就没有想明白所要呈现的主题与目标,以己昏昏使人昭昭,哪有可能呢?这样的作品多了,只会败坏数据可视化的名声,令人对这种报道形态产生厌倦。

改 进

笔者以为,数据可视化报道要获得可持续发展,乃至更上一层楼,需要从几个方面努力:

其一,做好后勤保障,加强技术投入。这包括:1.建立多类型的数据库。比如,对各地的交通黑点、火灾,对各级官员资料等都可在平时着手收集并随时更新数据。再如最高人民法院正在建设的“中国裁判文书网”,被视为司法公开的风向标。但遗憾的是目前公开的数量有限,且不涉重案,更无检索功能。要把这些资料转化为新闻,仍需要按照新闻生产的规律来再加工,按照不同主题,选取不同材料,爬梳整理,才能做到为我所用。2.数据分析团队可以引入统计学、政治学、经济学、社会调查等领域的专业人士,对数据做更周密的分析。3.IT技术团队建立多门类的数据模型,制作精美图表等。南都最近组建了以主持人为主导、由17人组成的数据新闻工作室,涵盖文字记者和音视频制作、美术设计、凯迪网、南都网等方面的人才。

其二,强化专业性,少些低级错误。决定推出相关产品之前,需注意在数据统计上应有可行性,确保数据的权威性,而且数据指标能够准确地解释选题。如缺乏权威机构的现成数据而需要自行统计时,最好组成一个临时资料整理团队,全面细致查证资料,交叉核实,堵塞漏洞。有些数据不可能在短时间内获得,要勇于放弃相关选题,不勉强做数据可视化,坚持宁缺毋滥。

其三,未雨绸缪,增强预判性。新闻报道最讲究的是快,但数据化牵涉多种材料、多种数据,还需要美术编辑、技术人员的参与,生产周期较长,出品往往严重滞后。这就需要依据新闻经验梳理出一些高频事件,对焦点新闻有预判,相信近期或不远的将来还会遇上,在平时即做未雨绸缪的准备。当然,无论何事,都有投入产出比的问题,如果准备周期过长,未免浪费精力;周期过短,则可能来不及收集整理足够的资料。那么,怎样准备较为合适?根据笔者的经验,最好为一周至半年内可能发生的新闻做好准备。如前述的新疆事件,如某些门类的自然灾害、人为事故等。

其四,秉持以新闻为核心的思维。当前,读者对可视化的数据非常关注,这催生了大量此类作品。但有些媒体在追求可视化形式时,操之过急,几乎忘记了自己是在做新闻,徒具美丽形式,内容空洞无味,成了炫技的产物。南都一直强调避免数据简单堆砌,为形式而形式,数据可视化新闻的第一核心概念仍是“新闻”,而非“可视化”,关键是把分散的信息整合起来,做出合乎逻辑的分析,能发现人所不知的结论,帮助读者发现新趋势。新闻的“新”,依旧是数据可视化新闻最重要的衡量指标。数据可视化报道同样也考验一家媒体的话题生产能力、热词制造能力、舆论形成能力。

跟网络媒体相比,纸媒在数据可视化道路上起步晚了些,会有很多不足,有很多值得改进的地方,但还是值得大力尝试的。从数据角度挖掘新闻,现在应该说不是做多了,而是做得不够。在人类的精神产品不断被数字化的当下,在各领域数据走向开放的大潮中,不能充分挖掘利用其中蕴含的宝藏,新闻报道的增值服务就会大为欠缺,就无法在快速阅读的年代,让新闻多一些智慧含量,多一些附加值。

(作者为南方都市报要闻部主任)

上一篇:迷失的年轻人 下一篇:大数据思维与媒体变革思路