样本量大小和调查准确度的关系

时间:2022-09-11 06:16:26

样本量大小和调查准确度的关系

收视率是怎么来的?

观众看到的是带着百分比或小数点的阿拉伯数字,使用方视其为刚性的“行业通货”,而调查公司和专家更明白,那是基于样本户规模之上的概率统计。

“CSM曾就全国网样本量的抽样方案,找了科学院、北大、人大的几位抽样方面的专家以及我,帮他们把过关。”中国传媒大学调查统计研究所所长柯惠新介绍到,这个抽样设计方案是多级分层抽样:整体样本分为城市、农村及城村中间层三层,每层又各分20个小层,再从这20个小层的每一层中各抽取20个样本,最后组成全国5000余个样本户的大样本。“从抽样设计和调查技术方面看,这样收集的收视数据本身应该是没有问题的。”

但也有业内人士质疑这种平均分层抽样是否科学合理:“之前就有不少高质量、高品位节目的收视率过低,被认为与样本分层不合理有关。如何顺应社会转型和变化调整分层,使样本更加吻合人口代表性特征,是比样本分析成本更高,也更有价值的问题。”

据CSM的公开数据,目前CSM反映全国电视观众收视行为的全国电视测量仪网中,样本量为5120户,一般以5000户为准。在这个基础上,CSM还有29个代表省级电视收视人口的省级调查网(包括直辖市),其中4个直辖市和10个省网是采用的测量仪方式,其余15个省网是日记卡调查网。此外,还有59个使用测量仪的城市网和90个使用日记卡的城市调查网。而在省级测量仪和省级日记卡网络里面,很大一部分包括农村样本,可反映全省的情况。全国测量仪网,也是由城市和农村样本共同组成的。

“5000多户的全国样本,从抽样的方法来说,我觉得还是做得比较好的。后来我还把它当做一个案例介绍给我的学生。譬如怎么去分层、怎么样去抽样等,这些我还写进了《传播研究方法》一书中。”柯惠新对记者表示。

一般人认为,样本量越大,收视数据的精度就越高。柯惠新也十分肯定这一点,但她进一步指出,两者的关系并不是一种线性关系,实际上是一条曲线关系。也就是说,样本量的多少与收视数据的精度并非是简单正比关系。当样本量增大到一定程度时,误差虽然还会随着样本量的增加而减小,但是减小的幅度会越来越缓慢,二者的关系是一条曲线,这条曲线的尾部几乎就是水平的。

“一般来说,国际上的民意调查,样本规模大多都控制在1000多人,不超过2000人。”柯惠新介绍说,简单随机调查,样本量达到1000左右的规模,其调查误差不会超过3%。她举例道:“如果某节目的真实收视率是2%左右,而收视率调查样本为1000个左右,那么调查出来的收视率绝对误差不会超过1%。即调查收视率会在1%-3%之间浮动。”而调查公司采取多级分层抽样,其收视率精度由于分层的不同,目标区域不同,或高或低。“以全国网样本量5000户来算,其绝对误差很低,应该在1%以下。”

柯惠新对记者强调,如果某节目的收视率过低,在相同样本户规模基数上,其调查收视率误差相对高收视率的节目会比较大。也就是说,如果绝对误差为1%,而真实收视率低于这个误差率,譬如只有百分之零点几的话,那么实际误差就相对过大,此时原先的样本量就显得不足了。王兰柱在CSM的相关新闻会上也承认,如果300个样本户里有5户家庭的收视数据出现问题,将影响近一个点的收视率准确性。

《中国电视收视率调查准则》规定,在抽样方案形成之前,需要开展基础调查。基础调查样本量一般是受众测量样本量的3倍或更多。“基础研究一般一两年进行一次,主要是为了了解总体电视观众结构、收视习惯及一般变化,从而保证固定样本组对总体的代表性。”柯惠新估计,由于一年或两年才做一次基础研究,其成本对CSM这样的公司而言应该不算多。

“在考虑提高精度的时候,必须要兼顾样本量和成本之间的平衡关系。”柯惠新不仅考虑学术问题,成本控制也在其视野之内。“扩大样本量,我觉得是好事,只是要增大投入成本,数据价格自然也会水涨船高。”

柯惠新始终认为,从设计和技术方面,调查公司的数据本身应该是没有什么问题的,但是数据被过度用于政绩或业绩考核的时候出了问题。样本户被污染确有其事,但污染的程度多严重不好说。毕竟我国样本户范围覆盖很广,如果要在大范围进行污染其成本也是比较高的。“当然CSM也要采取更严密的控制措施,但可能更多要从源头上去抓。”

上一篇:CSM的第一次危机公关 下一篇:广告公司:影响有限