PPS抽样方法在我国出口贸易预测中的应用

时间:2022-08-03 06:34:31

PPS抽样方法在我国出口贸易预测中的应用

摘要:通过对我国31个省市自治区的出口贸易额进行不等概率抽样,抽取了13个对象作为研究样本,预测了2008年我国出口贸易总额及抽样方差,同时与简单随机抽样的效果进行了对比,结果发现PPS抽样方法在总体单元之间差异比较大的情况下,能够取得很好的估计效果。这种方法仍可运用于今后的出口贸易的预测中。

关键词:PPS抽样;简单随机抽样;对外贸易;出口

中图分类号:F224 文献标志码:A文章编号:1673-291X(2011)02-0156-02

引言

自2001年加入WTO以来,我国的对外贸易得到了飞速的发展,从2000年我国的进出口总额4 743亿美元,到2008年高达25 632亿美元,增长了5倍多,进出口贸易总额以年均16.3%的速度增长,大大超过了同期国民经济的年均约11%的增长速度。目前的中国经济对国际市场的依赖程度越来越深。为保证宏观经济的持续稳定增长,出口贸易的增长问题正受到前所未有的关注。本文通过对我国31个省市自治区的货物进出口总额进行不等概率抽样(PPS抽样),抽取了8个省市作为研究样本,以此来预测2008年我国各地区出口贸易总额及抽样方差,并与简单随机抽样的预测结果进行比较,以期得到较为准确的预测结果,为宏观决策层更准确地把握各项促进出口政策的实施力度提供依据。这种方法仍可运用于今后的出口贸易的预测中。

一、PPS抽样方法简介

1.不等概率抽样的基本含义

不等概率抽样是指在抽取样本前给总体的每一个单元赋予一定的被抽中概率。在有放回的不等概率抽样中,最常用的是按总体单元的规模大小来确定抽选的概率。设总体中第i个单元的规模度量为Mi,总体的总规模度量为M0=Mi,则该单元的抽选概率应为Zi=。这种不等概率抽样称作按与规模大小成比例的概率抽样,简称PPS抽样。

2.PPS抽样的实施方法

PPS抽样的实施方法有累积总和法、拉希里方法、规模累积等距抽选的方法和分裂法,本文这里选用规模累积等距抽选的方法。这种方法是在累积和的基础上采取等距抽样的方法。具体如下:

设总体单元数为N,其规模度量分别为M1,M2,…,MN,进行累积,直至M0=Mi。若欲抽取样本的容量为n,则先求得等距抽样的间隔K=,然后在1~K之间随即等概率抽取一个数,假设为r则所r在的单元代码区间相应的单元即为被抽中的单元。以后每隔K个度量值,即r+K,r+2K,r+3K……r+(n+1)K等数字所在的单元代码区间的相应单元,即为被抽中的单元。

这种抽样方法的特点是当所有单元的度量Mi<K时,它是不重复的抽样;当某个Mi>K时,则第i个单元有可能被重复抽中;当Mi<2K时,则第i个单元肯定会被重复抽中。这种方法抽取样本比较容易,每个单元的被抽中概率与Mi<K的大小成比例,因而在我国得到广泛的应用。

3.Hansen-Hurvitz估计量

(1)总体总量的估计

1943年,汉森和赫维茨对PPS抽样提出了估计总体总量的估计量为:

HH=

其中Yi为入样的第i个单元的变量值,Zi为第i个单元根据其规模大小的入样概率。通常情况下若以该单元包含的元素单位为度量时,Zi=,其中,HH是总体总量的一个无偏估计量。

(2)方差估计量为:

(HH)=(-HH)2

二、实证分析

1.数据收集与处理

本文采用2007年与2008年各地区按经营单位所在地货物出口总额的原始数据,根据2007年货物出口总额采用PPS等距抽样法抽取13个样本,以2007年货物出口总额作为规模 ,并进行累计,得到表1。

将M0=Mi=121777576除以样本量n=13,得到抽样间隔K===9367505。在1~K之间抽一随机数R=2751684,处于北京的代码范围,因此北京作为抽中的样本。按照规模累积等距抽样法,依次抽到其他省市,分别是辽宁、上海、江苏、浙江、福建、山东、广东。其中广东作为出口大省被重复抽中4次,则广东省应入样4次,应计量4次;上海、江苏分别被抽中2次,则各入样2次,应计量2次。即总共8个省市入选。

2.总体总量的估计

这8个省市被抽选的概率为Zi=,分别为北京0.0402、辽宁0.0290、上海0.1181、江苏0.1672、浙江0.1053、福建0.0410、山东0.061678、广东0.3033,用这8个样本省市来估计2008年全国出口贸易总额,采用汉森-赫维茨估计量,由公式得:

HH==(++……+)==140837723

故估计推断,全国31个省市2008年出口贸易总额为14 0837 723万美元。

抽样的方差:

(HH)=(-HH)2=[(-140837723)2+(-140837723)2+……+(-140837723)2]=2.4326×1012

置信度为95%的置信区间为:

HH±Z

即: 所以置信区间为(137718364.1~143957081.9)

2008年,这31个省市的实际出口贸易总额为143069307万美元,位于置信区间内。

3.与简单随机抽样估计方法的比较分析

(1)基于简单随机抽样的估计

用随机数抽取13个地区作为样本,具体如表2所示。

总体总量估计:=yi=5164923=N=160112610

总体方差估计:

()=(yi-)2

=[(4210299-5164923)2+(4210299-5164923)2]=2.3365×1015

置信度为95%的置信区间为±Z即160112610±2×48337502.16

所以置信区间为(63437605.68~256787614.32)

将上面两种方式估计的结果汇总到表3。

三、结论

通过对2007年我国31个省市自治区出口贸易额进行PPS抽样,估计出2008年全国出口贸易总额为140 837 723,置信区间为(137718364.1~143957081.9),而2008年实际值为143 069 307,在置信区间内。通过与简单随机抽样方法的比较可以看出,无论是总体总量的估计还是抽样误差,PPS抽样的效果都优于简单随机抽样。所以,对于总体单元之间差异非常大时,用PPS抽样可以的到更好得估计效果。

参考文献:

[1] 倪家勋.抽样调查[M].桂林:广西师范大学出版社,2002:161-173.

[2] 倪家勋,张勇.调查内比估计效果的数据模拟分析――关于简单抽样设计与PPS系统抽样设计的比较[J].统计研究,2005,(11):32-35.

[3] 方世建,付文林.影响我国出口贸易增长的因素分析[J].上海经济研究,2001,(9):9-13.

上一篇:我国贫富差距扩大的原因\影响及对策分析 下一篇:美国市场经济地位标准与我国现实之比较