非参数统计中多样本数据位置比较问题的研究

时间:2022-09-14 01:06:56

非参数统计中多样本数据位置比较问题的研究

【摘要】本文介绍了几种常见的多样本检验方法,集中分析了各种方法的适用范围及优势。其次介绍了非参数统计中对多组数据位置进行比较的各种检验方法,然后通过一个实证――对“中部崛起”战略的思考来进行分析,直观地展现不同方法的差异及适用条件,运用非参数方法找出中部六省发展情况的差异性,从而为战略提出具有参考意义的建议。

【关键词】非参数统计 多样本 位置参数 中部崛起

一、引言

非参数估计方法又称分布自由检验,不涉及总体参数或不依赖于对总体分布的严格假定的推断方法称为非参数方法。非参数统计常用于以下4种情形:第1种情形是待分析资料不满足参数检验所要求的假定,因而无法应用参数检验;第2种情形是资料仅由一些等级构成,因而不能应用参数检验;第3种情形是所提的问题中并不包含总体参数,这时也适宜采用非参数方法;第4种情形是当急需要迅速得出结果时采用的简易方法。非参数统计方法在对总体分布一无所知的情况下,也能很容易而又很可靠地获得结论。在解决多组独立数据位置比较的问题时,总体分布条件一般都难以满足,则不宜选用参数统计方法,而不依赖于对总体分布严格假定的非参数估计方法是解决这类问题的恰当手段和工具。

基于此,本文首先说明了非参数统计方法相比参数统计方法的优势及其适用性;其次介绍了非参数统计中对多组数据位置进行比较的各种检验方法;然后通过一个实证――对“中部崛起”战略的思考来进行分析,直观地展现不同方法的差异及适用条件,运用非参数方法找出中部六省发展情况的差异性,从而为战略提出具有参考意义的建议。

二、非参数统计的适用性及优势

参数方法对数据要求较多,前提条件不仅要各组观测值的总体符合正态分布,它们的方差也是同性质的。而非参数统计方法则不同,研究的出发点是假定研究总体的理论分布是未知的,是一个待检验的假设,实际应用中这种问题是非常普遍,即面对一大堆试验所得数据,它们服从何种分布往往是不知道的,因此减少了实际应用中对假设条件的依赖,进而使得对多样本数据问题的研究更加客观,不受样本分布形式的限制。

非参数统计应用优势集中体现于以下几个方面:(1)可以减少模型偏差;(2)具有稳健性;(3)适用范围广;(4)简单易操作。

因此在以此构造的合理模型中,参数统计方法往往对设定的模型有更多的针对性,一旦模型改变,方法也随之改变。非参数方法则不然,由于非参数模型中对总体的限定很少,以致只能用很一般的方式去使用样本信息,如位置、次序关系等。非参数统计方法对数据的限制较为宽松,因而只能从其中提取一般的信息。当数据资料允许使用参数统计方法时采用非参数统计方法会浪费信息,非参数统计的稳健性反映出的性质表现为当真实模型与假定的理论模型有不大的偏离时,统计方法仍能维持较为良好的性质。

三、非参数统计中多样本数据比较方法

多样本的问题是统计中最常见的一类问题,主要涉及如何检验几种不同的方法、决策或试验条件(称为处理)所产生的结果是否一样等问题。首先,要看这些样本是否独立:在独立的条件下,可以利用Kruskal-Wallis检验和 Jonckheere-Terpstra 检验来处理两种(有序与否) 备择假设情况。但在各样本不独立时,如果是完全区组试验设计,对于定序变量,可以引进Friedman 检验和 Page 检验对应两种(有序与否)备选假设情况,对于定类变量,采用Cochran检验来测量多处理之间的差异;如果是不完全区组试验设计,则引入Durbin分析法进行推断。

四、实证分析――对“中部崛起”战略的思考

(一)样本选取。

为了中部地区的经济能够尽快赶上周边地区,各种各样的政策都在不断地实施中。然而,相关政策是否能在六个省份同时以同样的力度实施却是无法确定的。若六省没有差异或差异不大的方面,政策可以普遍实行;但是若在各个省份有明显差异的情况下政策的颁布实施依然一刀切的话,也许就达不到决策者想要的预期的效果,甚至影响到其他政策的顺利实施。

在下面的分析中,将采用中部六省2006―2011年六年间的数据,数据来源于《中国统计年鉴》。

表1 中部六省2006―2011年的GDP水平 单位:亿元

地区 2006 2007 2008 2009 2010 2011

江西 4670.53 5500.25 6971.05 7655.18 9451.26 11702.82

山西 4714.99 5733.35 7315.4 7358.31 9200.86 11237.55

安徽 6131.1 7364.18 8851.66 10062.82 12359.33 15300.65

湖北 7851.32 9230.68 11328.89 12961.1 15967.61 19632.26

湖南 7508.87 9200 11555 13059.69 16037.96 19669.56

河南 12362.79 15012.46 18018.53 19480.46 23092.36 26931.03

(二)非参数统计分析。

由表1中给出的中部六省2006―2011年的GDP水平数据结构,这是关于多组相关样本的非参数检验,数据取自完全区组设计并且变量类型为定序变量。根据上述介绍的各类方法适用条件,考虑采用Friedman检验来验证各省的GDP水平是否具有显著性差异,若存在差异性,再对两两省份进行比较,为制定战略措施提供可靠的依据。

1.六省GDP水平的差异性检验

运用Friedman检验来进行验证,假设检验问题为:

其中,θ1为江西省,θ2为山西省,θ3为安徽省,θ4为湖北省,θ5为湖南省,θ6为河南省。得到处理(省份)在每个区组(年份)之中的秩。

运用R软件计计算Friedman统计量,得到的结果为:

因为 ,所以有理由拒绝零假设,接受备择假设,认为中部六省2006―2011年的GDP水平存在显著差异。同时因为Q服从分布χ2(k-1),所以用R软件可以算出p值远小于0.01,同样验证了显著差异性存在的假设。

2.六省GDP水平的两两比较

当得到GDP水平存在显著差异的结果后,为了能够更好地实施相关政策,还应该检验任意两省之间的差异是否显著,以此来考查同样力度政策的实施在各省取得的效果。

成对样本的比较共有k(k-1)/2=15种,六个省份GDP的秩和分别为:9,9,18,26,28,36。设α=0.05,则α*=0.00167,。根据SE的计算公式可以得到:

再计算得到比较表:

表2 两两省份比较的H-W计算表

由表2中六个省份的GDP水平比较可知,河南省与江西省、山西省之间都存在显著性差异,另外江西省、山西省与湖南省之间也存在一定的差异。这样的比较结果对于制定“中部崛起”战略措施是很有价值的,通过直观分析,我们能够大致得到省份间GDP的差异比较,再利用非参数统计方法进一步分析,验证了关于不同省份经济发展存在差异的猜想。

五、结论与建议

运用非参数检验方法,可以对中部地区的协调发展提供有价值的参考。针对本例的检验结果,不同地区的经济水平存在差异,进行战略投资时不能一概而论,而需要因地制宜,政府应不断加大对相对贫困地区的资金投入力度,同时要保证资金的结构和分布应更合理化,增强中部地区的核心竞争力,实现跨越式共同发展。在教育投入方面,要注重各区域教育资源的合理配比,采取创新的拨款机制,创新财政教育拨款机制主要是指打破现行的按编制核拨经费的传统做法,探索财政投入按学生数量、毕业生质量拨款的新方式。同时,探索采取民办公助、贷款政府贴息、以奖代补等形式鼓励社会资金进入教育领域。要做到一省带动多省,保证整个中部地区的教育资源相对平均,协调发展。

参考文献:

[1]吴喜之.非参数统计[M].北京:中国统计出版社,2006.

[2]王星.非参数统计.第一版[M].北京:清华大学出版社,2013.

[3]王静龙,梁小筠.非参数统计分析[M].北京:高等教育出版社,2005.

[4]刘镇.区域协调发展与中部崛起的战略思考[J].2006(6).

上一篇:我国企业筹资管理问题研究 下一篇:于家村公共建筑艺术中的石头文化