连续性抽样调查中样本轮换理论与应用

时间:2022-02-26 11:31:12

连续性抽样调查中样本轮换理论与应用

摘要:文章在连续性抽样背景下,就连续性抽样调查四种方法进行对比分析,总结出样本轮换既吸收了其他方法的优点又克服了其他方法的缺点,是一种被广泛使用的连续抽样方法。然后就样本轮换讨论其在分层抽样中的理论应用。最后以兰州阅读情况为例系统的阐述样本轮换在分层抽样中的具体实施办法。

关键词:连续性抽样;样本轮换;分层抽样

中图分类号:C829 文献标识码:A 文章编号:1674-1723(2013)03-0198-03

当今社会是个信息化时代,信息数量之多,变化之快是以往任何一个时代都无法比拟的。在纷繁复杂的社会活动中,如何能及时、准确地搜集有用的信息是统计研究者们的首要任务。通过传统的调查方法(也称一次性调查)已不能满足人们对统计信息的时效性需求,取而代之的是连续性抽样调查越来越普遍。

在进行抽样调查时,几乎所有的调查总体都在随时发生着变化。总体中包含的总体单位的特征随着时间的推移而不断发生着变化,比如居民消费。或总体本身的内部结构也在随时发生着变化,比如人口结构的变化。如果我们进行调查的总体单位特征和总体内部特征不发生变化的时候我们考虑用一次性抽样,但是如果调查总体单位特征或总体内部特征发生变化时我们用一次性抽样不能够满足我们对调查信息的需要。这时我们就要采取连续性抽样调查,在不同时间点上对总体进行估计。

一、连续性抽样调查方法

连续性抽样根据其调查的目的和调查对象的不同,可分为四类。

1.重复样本调查(或渗透抽样):每期从同一个总体中独立地抽取一个样本进行的连续性抽样调查方法。

2.固定样本调查(或纵向调查):每期调查都用同一个样本进行连续性调查。

3.轮换样本调查:样本单元在经过连续几轮的调查之后,将会退出调查,同时新的样本单元将会产生并开始接受调查。

4.分裂样本调查:将固定样本抽样同重复样本抽样或轮换样本抽样相结合的一种连续性抽样调查。

四种方法的比较:在连续抽样调查中,轮换样本调查时使用最为广泛的一种连续性抽样设计,目前存在各种类型的轮换模式。轮换样本调查既吸收了重复样本调查和固定样本调查的优点,同时也克服了两者的缺点。具体说来主要存在以下几个优势:

首先,定期替换一样本单元既可以提高轮换样本对调查总体的代表性,又可以有效地降低被调查者的回答负担,从而减少因为样本老化而带来的非抽样误差。

其次,每次调查都保留一定单位的固定样本,减轻调查组织者的工作负担,并节省调查费用。

最后,在连续性的样本轮换中,可以有效地利用前后各期轮换样本之间的相关关系,来提高现期目标量的估计精度,从而提高连续调查数据的准确性和连贯性。

本文就分层抽样下样本轮换的设计过程的理论及操作步骤进行系统性的描述。

二、分层抽样下的样本轮换模型

所谓分层抽样是先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本的方法。分层抽样保证了样本结构和总体结构的一致性,提高了样本对总体的代表性和估计精度,因此也被应用到连续性抽样调查中,在连续性抽样调查中使用分层抽样就会涉及到样本轮换的问题。

(一)分层抽样下样本轮换的估计量

1.两个时期的样本轮换。我们首先考虑两个时期的样本轮换策略。假设两个抽样时期的样本都为n,分别称为前期抽样n1和当期抽样n2,显然n=n1=n2(这里我们把前期样本用下标1来表示,当期样本用下标2来表示)。样本轮换是将一部分样本m必须保留,另一部分样本u必须替换,其中u=n-m。由于必须保留的样本m与上期样本有重叠的地方,所以重叠率s=m/n,替换率t=u/n。

设所需研究的变量为y,第一期所要研究的变量记为y1,第二期所要研究的变量记为y2,对应的估计量分别为1和2。保留m1个单元的前期样本均值为,而现期样本均值为。新轮换进当期的样本单元为,他们均是总体的无偏估计。前后两期调查指标具有较高的正相关关系。设r为前期后两期的样本相关系数,我们视容量为n的前期样本为第一相样本,视现期样本中保留的前期样本m2个样本单元视为第二相样本,根据回归估计的二相抽样理论,取回归估计量,其中回归系数b=。

由于总体均值是由上期保留下来的样本单元m2和本期新添加的轮换样本单元u2所组成,则总体均值的估计量是与的加权,即。其中的选取应使的精度最高,即使V()达到最小。V()=,为使V()达到最小,对求偏导数,并令其为0。解得代入则,Vmin()=

2.两个以上时期的抽样。我们对两个以上时期的抽样,可以从第三次抽样起,用前一次样本回归估计量替代得到第h次总体均值的估计量。

(h>2),V()=,其中,为第h次抽样轮换样本的层权,为第h次抽样固定样本的层权。

(二)分层抽样下样本轮换的最优轮换率

在不考虑第i层子总体的前期样本全部被轮换掉(=0)或第i层子总体没有进行样本轮换(=1)这两种情况下的样本轮换率。进行样本轮换的条件是:0

三、案例分析

随着电子信息时代的到来,人们的生活习惯也随之发生改变。从传统的纸质阅读到现在的电子阅读。在兰州阅读情况调查中采用样本轮换能够很好地反映电子信息迅猛发展人们阅读方式的改变。一般情况下一旦用户开始使用电子阅读方式接受调查,这种使用方式基本不会改变。因此我们主要考虑固定权重或增加电子阅读调查户权重的样本轮换策略。

在这种情况下我们首先分析城市居民电子阅读方式抽样调查的一些基本理论,包括样本轮换下均值和方差的估计以及最优样本轮换率等。分别讨论两个时期抽样和两个以上时期抽样的样本轮换策略。我们首先将电子阅读方式和纸质阅读方式进行分层,为了讨论方便,我们特将电子阅读方式和纸质阅读方式分别进行样本轮换。由于抽样总体的总体单位数N很大,每次抽取各个样本量是相互独立的。

(一)样本轮换时间的确定

样本轮换时间主要考虑三个因素:总体随着时间的推移发生变化的快慢、调查员或被调查员对连续调查的调查时间和调查次数的反感以及调查成本的限制。

首先,我们对年龄在18周岁以上兰州市城市居民的阅读情况查。由于兰州是一个不发达的地区,人口流动性不强使总体抽样框中的抽样单元基本不发生变化。其次,在我国城镇住户统计报表制度中,报表体系分为基层定期报表和基层年度报表。其中年度报表要求是年度的完整资料,还要求各个不同年份之间的进行相互比较。最后,从时间,数据处理,经费,调查员的积极性,调查户的配合等多个角度考虑,样本轮换时间不宜太短。同时,如果样本轮换时间也不宜过长,过长会降低样本轮换的效果。

考虑上述因素我们对兰州市城市居民的阅读情况调查每三年进行一次调查。其中由一相抽样获得信息将被调查者有电子阅读习惯和纸质阅读习惯进行分层。然后按比例,从各层中进行随机抽样。抽取的样本就是二相样本。也就是说,样本轮换时间为一年,三年内样本轮换次数为三次。

(二)样本轮换率

样本轮换率主要是由相关系数决定。当前后两期指标具有一定程度正相关性时,无论是不进行样本轮换还是全部进行样本轮换,估计量精度都不如对样本进行部分轮换较高,即最优样本轮换率取值于(0,1)内(张宁,2008)。一相调查是一个多指标调查,这时我们只考虑一个主要指标如学历、工作等与其他指标为正相关关系。所以我们可以充分利用前期样本中保留样本的信息作为后期调查的辅助信息来对现期调查做回归估计,从而来确定样本轮换率。一般情况下,比较适合的样本轮换率在1/3到1/2之间。考虑到被调查户数较多,易于操作,我们先确定样本轮换率选取固定值1/3。

(三)样本轮换组数及轮换组的单位数

拟采用二相抽样和多阶段抽样相结合的方式进行调查。首先用pps法随机抽选街道,再抽中的街道内随机起点等距选着住宅。对选中的一相样本进行调查。就被调查者的收入、学历等辅助信息来研究是否有电子阅读的习惯。我们假设在兰州市内抽取90个经常调查户,一般一相抽烟总体单位数是经常性调查户的5~6倍,这里选取经常性调查户的6倍即540户为一相样本的调查户数。这样在每个轮换组内的调查户数为30户的情况下。具体的样本轮换组数为540/30=18。

进一步,我们分别来讨论电子阅读调查户与纸质阅读调查户的样本轮换组数。假设在兰州市所抽取的90户经常调查户中有12户采用电子阅读方式,另有78户采用纸质阅读方式。样本轮换率均为1/3。

首先考虑电子阅读调查户的情况。需要选取的一相样本的调查户数为经常性调查户12户的6倍,即72户。电子阅读调查户轮换组的单位数应为12×1/3,即4户。电子阅读调查户的样本轮换组数为72/4,即18组。对于采用纸质阅读调查方法进行调查,需要选取的一相样本调查户数为经常性调查户78户的6倍,即468户。纸质阅读调查户轮换组的单位数应为78×1/3,即26户。纸质阅读调查户的样本轮换组数为468/26,也是18组。

(四)样本轮换操作流程

1.电子阅读调查样本轮换流程。一相调查每三年进行一次,需要选取的一相样本为72户有条件接受网络调查的调查户。采取简单随机抽样的方法,将总体72个单位分成18组,每组4个调查户。从这18个组中按照不重复抽样每次抽取一组出来,依次编号为①、②、…、18。在进行一相调查以后的第一年,选出三个轮换组进入调查。比如说,选取①、②、③三个轮换组调查一年以后,第二年①号轮换组退出,④号轮换组进入调查;第三年②号轮换组退出,⑤号轮换组进入调查,依次类推。三年以后进行第二个一相调查,按照随机抽样抽取18个调查组,依次编号为①、②、…、18。

表1 电子阅读调查样本轮换流程

2.纸质阅读调查样本轮换流程。每三年进行一次一相调查,选取468户接受非网络调查的调查户。采取简单随机抽样的方法,将总体468个单位分成18组,每组26个调查户。按照电子阅读调查同样的办法分组及对轮换组进行编号。

表2 纸质阅读调查样本轮换流程

四、结语

本文以连续性抽样调查中样本轮换为例,研究了连续性抽样调查中分层抽样样本轮换的问题。分层抽样样本轮换模式是连续性抽样调查中非常理想的一种样本轮换模式,不仅估计量的精度提高了,而且能够更好地实现抽样调查的目标。

作者简介:崔冠男(1988-),女,辽宁人,就读于兰州商学院,硕士,研究方向:抽样调查;吴洁琼(1989-),女,内蒙古人,就读于兰州商学院,硕士,研究方向:抽样调查;刘建国(1988-),男,山西人,就读于兰州商学院,硕士,研究方向:抽样调查。

上一篇:试论思想政治工作在企业稳定工作中的作用 下一篇:酶联免疫法在食品检测中的应用发展探讨