随机化回答技术中的试验指向及其应用探讨

时间:2022-10-08 03:39:31

随机化回答技术中的试验指向及其应用探讨

摘要分析现有随机化回答模型的局限及其所使用的随机试验指向的不适应性,提出解决随机化回答技术应用问题的基本思路,讨论随机化回答技术所用试验指向应具备的特性和品质,提出并探讨有效证件号码、密封条等几种随机试验指向及其在随机化回答技术中的应用方法和过程。

关键词试验指向;适用型随机试验指向;随机化模型;非现场调查

中图分类号 C8 文献标识码A文章编号1673-9671-(2010)041-0158-02

随机化回答技术的产生已有40余年。多年来,有关这一技术的理论研究不断向纵深发展,有关其模型的讨论也取得了众多成果。但这一技术在实用方面却少有起色,在统计调查实践中未获得应有的知名度,令人满意的应用成果为数甚少,仍多停留在应用试验阶段,与之在理论研究方面持续进展的状况呈现较大反差。

本文试图从随机化模型本身的局限性及随机化模型所使用的随机试验指向的适应性两方面来分析造成这种应用涩滞状况的原因,并提出解决问题的一个思路,以期促进随机化回答技术向实用领域大面积转化。

1适用型随机试验指向的提出

随机试验指向是指随机试验所利用的客体或装置。适用型随机试验指向是指适用于随机化回答技术的试验指向。

1.1现有模型的局限

影响随机化回答模型应用的原因之一是现有模型有一定局限性。

沃纳模型的局限。沃纳模型是最早的模型,它由被调查者从混合在一起的1号和2号两类卡片中随机抽取1张,按照自己的情况,作出“是”或“否”的真实回答。被调查者回答的是那个问题,只有被调查者自己知道,从而起到保密作用。但沃纳模型存在有三个方面的问题。其一,从随机化处理过程来看,被调查者仍必须回答敏感性问题,因为两类卡片上都是敏感性问题,只是提法不同而己。因此被调查者仍可能心存疑虑;其二,当1号卡片和2号卡片比例各占1/2时,最能得到被调查者的配合,对敏感问题的回答的保密性最好。但此时,模型中的分母为0,无法计算,从而无法得到具有敏感性问题特征单位数的估计量;其三,从估计量的方差看,两类卡片的比例差异越大,则方差越小,但却越得不到被调查者的配合。

西蒙斯模型的局限。西蒙斯模型将沃纳模型中2号卡片上的对立敏感性问题改为与敏感问题无关问题,这样较好地消除被调查者的疑虑,易于得到真实的回答。且两类卡片的比例可以各为1/2。这就有利于消除被查者的疑虑。其局限有二:

1)具有无关问题特征的单位的比例必须是己知的或是待估计的值,而这个比例的估计偏误会引起具有敏感性问题特征单位数的估计偏误。

2)要减小估计方差,就应增大1号卡片的比例,但随着这个比例的增长,被调查者的配合程度会逐渐降低。

两次试验模型的局限。格林伯格等人提出的两次试验模型的改进之处在于不需预先知道具有无关问题特征的单位比例,而是通过其他途径对非敏感性问题进行核对,以此验证调查的准确性。但它也有缺限:

①如果对同一批调查者试验两次,他们两次回答的结果必然具有相关性,从而破坏了模型的随机性。如果两次试验不是同一批被调查者,则又不容易保证他们的结构具有相似性,从而产生较大误差;②两次试验产生的方差显然要比西蒙西斯模型大的多;③两类卡片的比例不能太接近,越接近,方差就越大,特别当两个比例相等时,模型失效。

双随机化回合模型的局限。这是赵俊康提出的一种改进模型。该模型的改进之处在于,两类卡片中有一类不提任何问题,这就更能得到被调查者的合作。但这两个方面也有进一步探讨的必要。

①计算比较复杂,不易为被调查者接受;②要减少该模型的方差,也需要两类卡片的比例不能太接近。另外,在相同条件下,要比西蒙斯模型的方差大。

1.2现有随机试验指向的局限

影响随机化回答技术实际应用的另一个原因是现有随机试验指向的局限性。现有随机化回答模型所用试验指向具有单一性和不适宜性特征。现有随机化模型中所使用的随机试验指向无一例外都是设计卡片、抽取卡片。这种试验方式在使用时需要被调查者分别抽取作答,操作十分不便。更大的局限还在于这种方式必须有调查者亲临试验现场组织实施,这就使它无法被应用于非现场调查,如邮寄问卷调查等。因为非现场调查恰恰就是调查者不出现于实验现场的调查。此外,这种方法的原始性和低层次性还使对其使用显得不太正规,似带有某种游戏性质。

1.3解决问题的思路

创建新的更实用更有效的随机化模型自然是解决问题的最好的途径,但这有待于理论上的突破和创新。现有模型已有8种之多,更为理想的模型的能否产生、什么时候产生是一个很大的变数。解决问题的另一种思路是弱化敏感性问题的敏感度,即考虑建立弱化敏感度模型,使敏感性问题转化为一般性问题,这样避开了随机化模型,使调查趋于常规调查。在这方面也已有学者作了探讨,设计了一些方法,但其调查结果的精度与要求相差甚大,且还远远谈不上应用。综合分析考虑,最现实、最经济的方法是利用现有模型,构造和选择适宜的随机试验指向和方式,使现有模型得以简便而有效的应用。作者经过考察、试验和分析,证明这个思路是可行的。

1.4适用型试验指向应具有的品质和特征

适用于敏感性问题调查、特别是敏感性问题非现场调查的随机试验指向应具有以下品质和特性。

1)随机事件分布的可估计性。随机事件的分布构成是利用随机化模型计算敏感性问题相应统计量所应具备的已知条件。因此,随机事件构成分布的可预知性是用于随机化模型的试验指向应具备的品质之一。选择获取符合这一品质的试验指向,可由对试验指向总体的分布的逻辑推理和经验判断来实现。因为试验指向总体的分布决定试验样本的分布。对于通过试验装置设计来进行随机试验的方式来讲,则可在设计时直接确定相应的比例或构成。

2)试验结果的隐蔽性。试验结果只能为被调查者知道,而不能为任何其他人所知。这样,被调查者对对敏感性问题的回答才能处于保密状态。这是适用于敏感性问题调查的试验指向应具备的最基本的品质。

3)试验操作的方便性与独立性。试验操作如果过于复杂,制作成本及调查费用过于昂贵,则会降低随机化模型的应用价值。方便程度应以被调查者乐于接受为基本标准,其次要考量便利度与调查制作成本的结合优度,因为“便利”会引起制作成本的增高。

独立性是指随机试验的实施操作可由被调查者自己独立完成,而不需调查者亲临现场参与。试验指向的这一特征尤其在使用随机化回答模型进行敏感性问题的非现场调查时必须具备。亦即这些试验指向应当既可用于调查者亲临现场组织的现场调查还可用于调查者不亲临现场组织的非现场调查。

随机化回答技术的随机试验指向设计应满足上品质和特征的要求。

2若干试验指向的提出及初步考察

2.1几种适用型试验指向

作者研究设计了血型系列式、有效证件号码式、密封条式、信息卡式、出生日期式等若干种随机试验指向。

血型系列式是利用人类血型分布比例作为已知条件来进行随机化调查。医学统计资料表明,人类四种血液类型A、B、O、AB在人群中的分布比例约为3:3:3:1。这为将血型作随机试验指向提供了可能。密封条式试验指向是将所设定的代表问题的信息符号用高光膜加以封蔽,调查时由被调查者按规则刮启密封膜,然后按启封后信息作答。有效证件号码及人群出生月日的分布也具有等比例性和随机分布特性,也具有适用型试验指向的品质和特征。这些试验指向除均具有适用型试验指向的品质和特征外,还表现出较强的肃重性和规范性,是随机试验指向比较理想的选择。

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

考察分析和实际应用表明,以这些适用型试验指向为基础的随机实验结果的概率分布与总体的分布是一致的,以这些试验指向为基础的统计调查的结果可以满足一般抽样推断对一致性、无偏性的要求。

2.2适用型试验指向在随机化回答模型中的应用考察

沃纳模型、西蒙斯模型在非参与式随机试验基础上用于逻辑型敏感性问题的调查。

由于沃纳模型要求记写敏感性问题和对立的非敏感性问题的两种卡片的比例不能相等,即p≠1/2,所以该模型多采用概率分布为可控式的随机试验,比如密封条式、信息卡式等。就密封条式来讲,为使所密封的代表两个问题的信息符号数目比例存有差异,可以按预定比例要求,将一定比例的问卷或卡片的两个信息符号设置为相同的符号。但要注意“相同的符号”须是答案与“不具有敏感性问题特征”相一致的符号。

例如:调查个体工商户漏税比例,用符号A表示问题“我有过漏税行为”,用符号B表示问题“我没有漏税行为”。为使p≠1/2,需在一定比例的密封条中,将两个信息符号均设制为B,其余密封条中的两个信息符号均为A和B,再随机安排两种符号的顺序并密封。调查内容的设计可按如下方式:A表示我有过漏税行为,B表示我没有漏税行为。请您在密封条中任选一密封块并刮启,然后根据启封后的符号及您自身情况按照以下规则作答:如果您启封的符号为A,并且您具有问题A特征,请回答“是”,如果不具有问题A特征,请回答“不是”;如果您刮启的符号为B,并且您具有B问题的特征,请回答“是”。不具有B问题特征,请回答“不是”。调查者根据回收问卷中回答“是”的数目n1,按模型计算求得容量为n的样本中有漏税行为的比例及其方差的估计值。

在西蒙斯模型中,p值不受1/2的限制,这样,凡二点分布随机试验均可运用此模型。比如,调查学生浏览的比例,可由被抽选到的学生依其学生证号或图书借阅证号最后一位数字的奇偶性来确定是回答敏感性问题还是回答无相关非敏感性问题。因为被调查学生是随机抽选的,所以样本中具有敏感性问题特征学生的比例与总体中的比例是一致的,即p是P的一致有效估计,因而p≈P=1/2。由此,再根据问卷回收统计情况和西蒙斯模型即可求得浏览过学生的比例。

适用型试验指向在随机化回答“改进型模型”、“非相关模型”中的应用考察此文不赘,作者将另择机献述。

参考文献

[1]晓钟.随机化回答技术口[J].中国统计,1989.

[2]晓钟.数量特征的随机化回答技术.中国统计[J].1989,9.

[3]孔圣元,孟生旺.敏感性问题随机化回答模型的改进[J].统计研究,1997,1.

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

上一篇:GPS系统技术在地形测量中的应用 下一篇:针对高速公路机电系统决策评价及运行管理