基于主成分分析的甘肃省民族地区经济综合评价

时间:2022-06-11 10:17:39

基于主成分分析的甘肃省民族地区经济综合评价

内容提要:科学地评价区域经济竞争力,将为地区寻求发展、制定竞争战略及有效政策提供重要依据。本文运用主成分分析法,选取与甘肃省民族地区综合经济竞争力有关的13项指标进行分析,根据相关性等确定生活状况因子、综合实力因子和固定资产投资因子为3个主成分因子,得出主成分综合模型,最终根据该模型对甘肃省民族地区21个县(市)的综合经济实力加以排序并进行综合评价,同时分析了各县市经济差异的特点及形成原因等问题。

关键词:民族地区;主成分分析;主成分因子;综合评价

中图分类号:F127.42文献标识码:A文章编号:1003-4161(2009)05-0041-04

甘肃省民族地区共包括21个县(市),分别为甘南、临夏自治州的16个县(市)及肃南、肃北和阿克塞、张家川、天祝5个自治县,有回、藏、东乡、土、满、裕固、保安、蒙古、撒拉、哈萨克等10个少数民族,其中东乡族、保安族和裕固族是我省独有的3个民族,土地总面积18万平方公里,占全省总面积的39.6%。截至2007年底,总人口为319.88万人,占全省总人口的12.22%,经济发展水平较低,国内生产总值只有全省的5.56%,人均国内生产总值只有全省的45.36%(全省的人均值为10 346元)。因此,加快民族地区经济社会全面发展,对协调全省国民经济发展,增强民族团结,维护社会、政治安定具有重要作用。本文运用主成分分析法,选取能够代表甘肃省民族地区21个县(市)经济实力的13项指标进行比较,找出各县(市)经济发展的特点及存在差异的原因,并对甘肃省民族地区经济发展的现状做出综合评价,进而提出对策建议。

1.主成分分析法

1.1 主成分分析

主成分分析(Principle Component Analysis)的概念最早在1901年由皮尔逊(Karl Pearson)首先引入。主成分分析是通过恰当的数学变换,使新变量――主成分成为原变量的线性组合,并选取少数几个在变差总信息量中比例较大的主成分来分析事物的一种方法。这些主成分能够反映原始变量的绝大部分信息,通常表示为原始变量的某种线性组合。当原来p个变量的总变差能由少数几个线性组合来概括,且这些线性组合中包含的信息与原来p个变量几乎一样多时,可以用这些线性组合替代原来的p个变量,这样会使观测数据从高维降到低维,从而简化数据。主成分就是p个变量Y 1,Y 2,…,Y p的一些特殊线性组合,如果以X i(i=1,2,…,p)表示标准化的原变量,F i (i=1,2,…,p)表示主成分,C ij(i=1,2,…,p;j=1,2,…,p)表示组合系数,则主成分分析的模型为:

F 1=C 11X 1+C 12X 2+…+C 1pX p

F 2=C 21X 1+C 22X 2+…+C 2pX p

……

F p=C p1X 1+C p2X 2+…+C ppX p

因主成分分析中各主成分是按方差大小依次排序的,则在分析问题时,可以舍弃部分主成分,用前后方差较大的几个主成分来代表原变量,这样不但可消除评价指标间的多重共线性,还可减少指标选择的工作量。

1.2 分析步骤

主成分分析的应用范围很广,但很多情况下,会出现主成分分析和因子分析两者混用的现象。实际上,两者在分析步骤上是有区别的,主成分分析的步骤①如下:

1.2.1指标的正向化。

1.2.2指标数据标准化(SPSS软件自动执行)。

1.2.3指标之间的相关性判定: 用SPSS软件中表“Correlation Matrix(相关系数矩阵)”判定。

1.2.4确定主成分个数m:用SPSS软件中表“Total Variance Explained(总方差解释)” 的主成分方差累计贡献率、结合表“Component Matrix(初始因子载荷阵)”中变量不出现丢失和碎石图“scree plot”确定主成分个数m。

1.2.5主成分表达式:将SPSS软件中表“Component Matrix”中的第i列向量除以第i个特征根的开根后就得到第i个主成分函数的系数(在“transform――>compute”中进行计算),由此写出主成分F 1表达式。在SPSS16.0②中可自动执行得到Component score Coeficient Matrix(因子得分系数矩阵),利用这个系数矩阵可以直接写出主成分F 1表达式。

1.2.6主成分F 1命名:用SPSS软件中表“Component Matrix”中的第i列中系数绝对值大的对应变量对F 1命名。

1.2.7主成分与综合主成分(评价)值:综合主成分(评价)公式:

F=∑mi=1(λ i/p)*F i

1.2.8检验:综合主成分(评价)值用实际结果、经验与原始数据做聚类分析进行检验。

1.2.9综合实证分析:根据SPSS运行结果分析、比较和判断经济发展水平,为区域经济发展提供对策。

2.甘肃省民族地区经济综合评价分析

2.1 指标的确定及数据来源

为了全面、系统地分析评价甘肃省民族地区21个县(市)经济发展水平和竞争力,根据甘肃省2008年统计年鉴和各县(市)的政府工作报告等文件及甘肃省民族地区实际经济状况③,本文选取了21个县(市)的13项指标:

X 1-国内生产总值(万元);X 2-人均国内生产总值(元);

X 3-全社会固定资产投资(万元);X 4 -财政收入(万元);

X 5-农业总产值(万元); X 6-工业总产值(万元);

X 7-第三产业总值(万元); X 8-社会消费品零售总额(万元);

X 9-人均固定资产投资总额(元);X 10-人均农业总产值(元);

X 11-人均工业总产值(元); X 12-城镇可支配收入(元);

X 13-农村人均年纯收入(元);

2.2 相关性分析

表1 相关系数矩阵

表1中可看出,X 1-国内生产总值、X 4-地方财政决算收入、X 5-农业总产值、X 6-工业总产值、X 7-第三产业总值、X 8-社会消费品零售总额这六个指标之间存在极其显著的关系;X 3-全社会固定资产投资、X 9-人均固定资产投资总额、X 10-人均农业总产值、X 11-人均工业总产值、X 12-城镇可支配收入、X 13-农村人均年纯收入这六个指标间存在极其显著的关系。2.3主成分个数m的确定

根据表2,每一个指标变量的共性方差均在0.8以上,且大多数都超过了0.9,说明这3个公因子能够较好地反映原各指标变量的大部分信息,本次主成分提取的总体效果较理想;根据主成分个数提取原则,应提取特征值大于1的主成分,因此一般可以用特征值大于1作为纳入标准。表3中包括了特征根由大到小的次序排列,各主成分的贡献率及累积贡献率:第一主成分的特征根为5.937,它解释了总变异的45.672%;第二主成分的特征根为3.884,解释了总变异的27.879%,第三主成分的特征根为1.199,解释了总变异的9.223%,前三个特征根均大于1,累积贡献率为84.774%,故宜取前三个主成分。从另一个侧面分析,在碎石图(图1)征根曲线的拐点及特征值根在3处拐点,也验证了本文取前3个主成分为宜。因此,本文的主成分个数m确定为3。

图1 碎石图

表2 变量的共同度

表3 主成分的统计信息

2.4 主成分的确定

根据主成分确定原则和以上分析,本文取前3个主成分是科学合理的。现根据因子载荷矩阵(Component Matrixa)确定主成分1、2、3(见表4,表5)。

主成分1:其因子载荷较大的指标有:X 2-人均国内生产总值、X 9-人均固定资产投资总额、X 10-人均农业总产值、X 11-人均工业总产值、X 12-城镇可支配收入、X 13-农村人均年纯收入,综合分析判断,主成分1是人民生活状况的综合性指标,可称为生活状况因子。

主成分2:其因子载荷较大的指标有:X 1-国内生产总值、X 4-财政收入、X 5-农业总产值、X 6-工业总产值、X 7-第三产业总值、X 8-社会消费品零售总额,它们的影响远远超过了其他指标,可以判断因子2主要体现综合经济实力,可称为综合实力因子。

主成分3:其因子载荷较大的指标只有:X 3-全社会固定资产投资,因此称为固定资产投资因子。

表4 初始因子载荷矩阵

表5 因子得分系数矩阵④

2.5评价模型

上表5的因子得分系数矩阵是主成分分析的最终结果,通过该系数矩阵可得各主成分值,也可将所有主成分表示为各变量的线性组合,由表5得主成分表达式:

F 1=-0.007*Z X1+0.159Z X2+0.057*Z X3+0.096*ZZ X4-0.101*Z X5+0.08*Z X6-0.041*Z X7-0.025*Z X8+0.161*Z X9+0.123*Z X10+0.154*Z X11+0.147*Z X12+0.158*Z X13

F 2=0.253*Z X1-0.012*Z X2+0.134*Z X3+0.189*Z X4+0.125*Z X5+0.161*Z X6+0.22*Z X7+0.219*Z X8-0.023*Z X9-0.031*Z X10+0.004*Z X12+0.013*Z X13

F 3=-0.064*Z X1-0.235*Z X2+0.507*Z X3+0.16*Z X4+0.149*Z X5+0.22*Z X6-0.322*Z X7-0.258*Z X8+0.065*Z X9+0.372*Z X10-0.222*Z X11-0.171*Z X12-0.17*Z X13

这里,F 1为第一主成分即生活状况因子;F 2为第二主成分即综合实力因子;F 3为第三主成分即固定资产投资因子。Z xi(i=1,2,3,……16)表示标准指标变量,利用SPSS中的Descriptive-compute计算得到。

以每个主成分对应的特征值占所提取主成分总的特征值之和的比例作为权重计算主成分综合模型:

F=0.45672*F 1+0.29879*F 2+0.09223*F 3

即可得到主成分综合模型:

F=0.066*Z X1+0.047*Z X2+0.112*Z X3+0.115*Z X4+0.004*Z X5+0.104*Z X6+0.017*Z X7+0.030*Z X8+0.072*Z X9+0.081*Z X10+0.044*Z X11+0.053*Z X12+0.060*Z X13

最后,根据主成分综合模型即可计算综合主成分值,并对其按综合主成分值进行排序,即可对各地区进行综合评价比较,结果如表6。

表6 21个县(市)各主成分得分及排名

2.6 结果分析

从表6可看出,人民生活状况处在前三位的是苏北县、阿克塞县和肃南县,积石山县、东乡县和临夏县处在倒数三位,两个地级市临夏市和合作市分别为第九、第十位,人民生活状况差距比较大,城镇可支配收入和农村人均年纯收入的极差分别达到4 199元和5 078元;综合经济实力最强的为临夏市、永靖县和肃南县,最弱的依次为阿克塞县、碌曲县和迭部县,国内生产总值的极差达到16.38亿元;固定资产投资最好的为肃南县、肃北县和永靖县,最少的为积石山县、临潭县和东乡县。从综合竞争力来看,肃南县、肃北县、永靖县、天祝县、临夏市排在前5位。和政县、卓尼县、积石山县、临潭县和东乡县的综合竞争力最弱。

3.结论与建议

3.1 经济发展水平低,工业化、城市化进程缓慢

甘肃省民族地区2007年总人口为319.88万人,其中非农业人口占16.43%,低于全省非农业人口占总人口20%的水平,全省民族地区地方人均财政收入193元,远远低于323元的全国民族地区的人均水平,更低于482元的全省平均水平。因此,甘肃省民族地区应加快民族地区工业化和城市化水平,不断提高地方财政收入和人民生活水平,以增强经济发展水平。

3.2 公共基础设施和经济发展的必备条件欠缺

综合主成分中,固定资产投资的贡献率是所有指标中最高的,达到11.5%,说明固定资产投资在甘肃省民族地区的经济发展中具有重要的作用。因此,加大基础设施建设投资,将为甘肃省民族地区经济发展提供基础性条件。

3.3 各州县经济发展不均衡

从三个主成分和综合主成分可以看出,生活状况竞争力最强的肃北县的人均GDP是临夏县的21.13倍,综合实力最强的临夏市是阿克塞县的5.87倍,综合竞争力最强的肃南县是东乡县的1.3倍。城乡差距也很大,平均达到3 639元,差距最大的张家川县达到4 759元。因此,各县市应根据自身特色,积极发展特色优势产业,提高城乡收入水平,这是促进甘肃省民族地区经济发展和缩小城乡收入差距的当务之急。

注 释:

①林海明.主成分分析与因子分析详细的异同和SPSS软件.此文获中国统计学会“泰钢杯”全国优秀统计论文奖。

②宇传华.SPSS与统计分析.电子工业出版社.2007.12第486页.

③2008年《甘肃省统计年鉴》,21个县市政府工作报告及甘肃省统计局网站www.gstj.省略/.

④因子得分系数矩阵:初始因子载荷矩阵除以主成分相对应的特征值开平方根,在SPSS16.0中自动执行.

参考文献:

[1]李子奈.计量经济学[M].高等教育出版社,2000:3.

[2]宇传华.SPSS与统计分析[M].电子工业出版社.2007:12.

[3]宋志刚,谢蕾蕾,何旭洪.SPSS16实用教程[M].人民邮电出版社,2008:6.

[4]何丽双,林木西.县域经济竞争力主成分分析评价―以辽宁省为例[J].商场现代化.2007,(06).

[5]左欣艳.基于主成分分析的2006年区域经济竞争力综合评价[J].安徽农学通报.2008,(16).

[6]王芳.主成分分析与因子分析的异同比较及应用[J].统计教育.2003,(05).

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文

上一篇:对区域经济发展指标体系问题的若干评价 下一篇:河南省财政社会保障支出与经济增长的关系分析