三网融合背景下的收视率及数据挖掘

时间:2022-09-03 05:43:58

三网融合背景下的收视率及数据挖掘

三网融合的不断推进,将给广播电视行业带来巨大变革。尽管目前融合的产业形势并不十分明朗,但终端业务融合无疑是融合的趋势和重点。而作为其中焦点的“视频”概念逐渐深入人心,它将取代“电视”概念而成为一种新的媒介形态。收视率作为定量评估媒介产品的重要工具,如何应对融合后受众的媒介接触方式、广告商的媒介诉求和内容的评价体系?在媒介产业重新布局、传播技术全面升级的背景下,收视率是否也该升级?面对大数据时代,收视率的数据挖掘是否也应该适应新的潮流,实现一次质的飞跃呢?

当前电视收视率所面临的挑战和质疑

当前收视率动辄得咎,甚至被视为“万恶之源”。这其中固然有误解和偏见,但同时也是由于收视率数据本身存在显而易见的缺陷。

1.小样本测量带来的高风险

尽管收视率调查样本户是科学抽样产生,具有一定代表性,但样本过小难以排除耦合性因素,带来统计学误差。目前,北京、上海乃至国外一些城市的收视率调查的样本规模——仅有300多户、1000人。在这样的用户规模下,收视率曲线上0.1个百分点的波动,只取决于一个被调查户的变化,用0.1个百分点的波动去评价节目节奏和片段价值,“显然多少有些自欺欺人的味道”。①

样本数量不足,难以支持深度的数据分析。如果说当前样本规模在集中反映某一节目收看情况这一效果层面代表性尚不足虑,那么,当我们将收视率数据按照不同的细化指标细分深度挖掘受众特征和受众行为时,其在子指标下的代表性便成了一个不能忽略的问题。

小样本还提高了贿赂样本户的可能性和可行性,一个样本户对应的巨大收视价值产生的利益驱动提高了这一风险。

2.收视率难以代替满意度

收视率作为一个客观指标,本身不承载满意度的测量重任。但由于收视率测量自身已相对比较成熟,积累了较为完整的经验,并且是一套定量的客观评价工具,因此,人们往往对收视率寄予“厚望”,希望它能担起重任——利用已铺就的样本户和实践经验提供准确、“客观”的满意度数据。加之现有节目评价体系中收视率使用广泛、权重较高,因此许多节目千方百计追求收视率,甚至造假作弊、走低俗化路线。“收视率是万恶之源”,与其是说“仇收视率”,不如是说“仇收视率导向”。

3.数据泡沫:缺乏对媒介价值和受众价值的深层挖掘

收视率是频道、节目和广告商眼中利益权衡的定盘星,但是三方又对收视率颇有微词。节目的专业评价经常和收视曲线错位;频道不能确定收视人群的准确特征,难以判断谁是忠实观众;广告商的怨气最大,他们只能得到一串空洞的数字。他们对收视点广告成果的计算只能依赖收视率,而广告到达人数与节目到达人数本身就有差异,收视数据又无从描述受众的“理解”、“喜爱”、“勉强接受”,更不能奢求收视数据反映受众的兴趣、偏好、消费行为。

三网融合后收视数据挖掘的实现

数字化技术带给收视率调查的最大想象空间就是“全样本”。这就意味着把当前这个模拟的、经过甄别的“点收视”环境,还原为真实的网域内的每一个“点”,形成全样本或海量样本,对每一个“点”的收视行为实时记录并进行分析测算。

目前CSM两屏项目中,数据来源主要是对电视及网络固定样组调查,并正在尝试“全天候360°”的三屏数据调研。而尼尔森提供的三屏数据解决方案A2/M2,将原有的收视率调查的PM方式与在线研究的标准化模式相结合解决其中两个屏的数据获得,在手机屏方面则通过具有数据收集功能的特制手机来完成。②三网融合后的收视率调查,除了依据现有的调查方法和调查体系,更多的还要借助当前的互联网智能监测技术,彼时收视率调查称作收视调研或收视监测可能更为准确。

海量样本无疑能很好地解决样本规模问题带来的统计误差、数据挖掘所需的样本量支持以及数据作弊的风险。但当前的技术条件下,数字机顶盒或者IP地址回传的数据为家户收视率,而不是个人收视率,损失了年龄、性别、学历、收入等人口统计特征。而这又是当前收视数据含金量最高最有指导意义的部分。这部分损失价值,应当依靠调研监测技术的改进和社会的发展进步得到合理代偿。

1.以受众为中心的收视监测

以受众为中心的监测,可以依靠基于Web数据的内容挖掘和结构挖掘来实现。Web数据的内容挖掘,就是从受众收看的视频、图像甚至是网页中提取有效信息的过程,对这些信息的分析主要用于发现受众对内容的兴趣、偏好以及粘性、忠诚度。通过实时统计其观看时长,不仅可以发现其对节目的偏好和粘性,甚至能精确分析观众对广告的接受程度;对观众收看的节目、频道甚至是网站的结构挖掘,可以大致了解观众的媒介接触过程和媒介使用行为,发现观众在不同时段对不同频道、节目的选择,跟踪受众的转台行为。

媒介可以根据自己的定位以某种规则设计抓住受众的某一个维度,比如行为、身份、关系、群组等代表着用户的识别度,“分享”追求的是用户对内容的好恶,“状态”可以窥探出用户粘性……这些规则和功能的设计其实都指向准确高效的用户价值,用户的行为与偏好在某一维度上的集合数据,才是广告主最希望获得的媒介产品。

2.以频道和节目为中心的收视监测

对频道和节目的调研,还应结合互联网IP传输协议中用户的使用记录或者说网络日志,这一过程是根据网站、频道、节目的用户如何使用该站点的内容来提取有用信息的过程。这可以反映受众的结构、分布和行为特征。

在收视过程中,服务器上会囤积大量的用户访问记录,这些记录都符合通用日志格式,其中包含了基本的客户访问信息(客户端IP、客户端机器名、访问时间、访问资源的URL和用户浏览工具的版本等)。使用记录的挖掘,主要是为了发现受众在某一站点、某一电视台、某一频道的浏览模式,了解用户在互联网络上的行为,以便为站点管理者提供改进意见,增加个性化服务,或者在电子商务中发现潜在的客户群,在广告中发现目标人群等。

3.节目交互性增强:提升收视体验,改进节目评估体系

数字化和网络化使受众在终端实现与节目、频道的互动性成为可能。受众不仅可以实现点播、延时收看,还可以及时将自己的感受和意见反馈给节目制作者。受众可以在收看的同时对节目进行评价,并且可进行观后留言,甚至选择接受节目或频道的在线调查,对节目的“影响力”、“引导力”等进行评价。

如此以来,收视率调查就可以兼顾到满意度,提供科学准确的数据支持。而随着社会的进步,网络调查技术不断精进,尤其是如果网络实名制得以推广,那么人人都相当于网络固定样本组成员,受众的人口背景资料将会更易得、更清晰。

改变“数据爆炸而知识贫乏”:收视数据的开发和挖掘

如何对这庞大、零散、无序、混沌的数据进行挖掘和开发?这也正是数据挖掘技术想要解决的问题。

数据挖掘这一专注于解决“数据爆炸而知识贫乏”的技术热点,在现代社会科学研究中还远未得到充分运用。所谓数据挖掘,就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。③“啤酒与尿布”即是借助数据挖掘技术,对大量交易数据进行挖掘分析而得出的一个有价值的规律,这也是关联规则挖掘的一个典型。

数据挖掘中的聚类分析,在收视率数据分析中可以集中呈现某一频道某一栏目的受众的某些类型或者某一维度的特征,从而更好地为频道或栏目的受众分析、内容定位、竞争策略提供指导,甚至提供精准的广告营销资源。当前计算科学中,也逐渐有人重视数据挖掘和软件开发在收视率领域的应用。

注释:

①田翔:《2.0升级:破解“唯收视率”的困窘》[J],《新闻实践》,2010年第6期

②陈书昊:《“三网融合”时代的收视率调研图景》[J],《新闻实践》,2010年第6期

③谭建豪:《数据挖掘技术》[M],中国水利水电出版社,2009年1月版

(高卫华:河北大学校报编辑部主任;刘辰辰:河北大学新闻传播学院硕士生)

上一篇:全媒体时代的新闻现场直播 下一篇:图书也“早产”