广东城市经济状况的主成分分析

时间:2022-07-06 03:57:31

广东城市经济状况的主成分分析

摘 要:用主成分分析法选择十九项经济指标,综合分析广东省的二十一个城市的数据,构建经济评价方程式,比较了城市间的发展状况,并进行了排名。

关键词:区域经济;主成分分析;广东城市比较

中图分类号:F29

文献标识码:A

文章编号:1672-3198(2010)04-0079-02

1 引言

主成分分析是一种简化数据结构的方法,通过对变量的样本数据的分析寻找出多个变量间的线性关系,并综合出为数更少的变量来反映原来的多个变量所包含的信息,可以达到数据降维的目的。

地理可以决定经济,这句话有一定的道理。广东省位于中国的南大门,整体地形是东西向长度大于南北向长度,沿海城市很多,因此,在国家开放经济的号召下,成为最先发展的区域。然而,广东本省内的经济也不均衡,珠江三角的城市的经济增长速度明显比其它地区要快。衡量城市的发达程度有一系列的指标,本文从评价广东省的二十一个中心城市的经济总量、结构和社会层次的角度出发,选择了十九个指标,运用SPSS软件中的主成分分析工具,综合出几个关健因子,比较各城市的发展状况。

2 模型准备

本文选择了十九个指标,分别为X1地区生产总值,X2第一产业生产总值,X3生产总值增长速度,X4第三产业比重,X5人均工业总产值,X6人均地区生产总值,X7地区人均财政一般预算收入,X8客运量,X9邮电业务总量,X10出口额,X11各市外商投资企业进口额,X12固定资产投资额,X13土地面积,X14人口密度,X15高中招生人数,X16卫生工作人员数,X17工业科技人员数,X18职工平均工资,X19城乡居民储蓄存款余额。

求解主成分有两种方法,第一是由协方差矩阵出发,提取累计方差最大的前几个主成分,第二是由相关系数矩阵出发,提取特征值大于1的主成分。当变量的数据相差较大时,为防止主成分分解趋向方差大的变量,将数据标准化并求相关系数矩阵做主成分分析是更好的选择。

求得的主成分的因子得分将为Yi=eiX*=Piλ2X*,其中,X*为对应某个样本的标准化数据;Pi为原变量X*1,X*2,…,X*p在第i个主成分上的负荷量构成的向量,λi是相关系数矩阵R的第i个特征值。我们可以确定各主成分的经济意义,以相对方差贡献率作为权重,得主成分线性函数,用来计算所有的样本在这几个主成分上的得分,并给样本排名。

3 实证研究

首先将二十一个城市的数据标准化,求解十九个变量数据的相关系数表,再由相关系数表求出特征值并以特征值从大到小的顺序确定主成分的累积贡献率。

从主成分的贡献率的计算结果可以看出,前三个主成分解释了所有变量的约86%的信息,用这三个因子概括所有十九个变量能够起到降维而不破坏数据的有效性的作用。

为进一步划分各主成分因子所代表的变量指标,对主因子的负荷矩阵作方差极大化旋转得到新的因子负荷矩阵:

提取方法:主成分分析法。旋转法:具有Kaiser标准化的正交旋转法,旋转在7次迭代后收敛。

作方差极大化旋转使得的主成分因子与变量间的相关程度更加明显,第一主成分在地区生产总值、第三产业比重和人均地区生产总值等变量上得分较高,这些变量能反映经济的发达程度;客运量、邮电业务总量和固定资产投资额能显示出经济的活力。一般来说,经济总量越大,则地区人均财政一般预算收入越高,职工平均工资和城乡居民储蓄存款余额也是与人均GDP成正比的。高中招生人数、卫生工作人员数和工业科技人员数,反映了城市的公共设施的完善度。我们可以将第一主成分因子称为经济总量因子。

第二主成分在第一产业生产总值、人均工业总产值、土地面积、人口密度、各市外商投资企业进口额和出口额这六个变量上的得分较高,通过观察可以看出,这几个变量都是与工业发展有联系的,因此,将第二主成分命名为外向型工业化因子,这也与它和第一产业生产总值成反比这个事实相符。

第三个因子仅由生产总值增长速度这一个变量决定,同时系数符号为负,这表明,生产总值增长速度变量与其它的变量是相互独立的。联系相关系数矩阵中生产总值增长速度与第三产业成反比,与土地面积成正比的现象,用经济后发优势的理论解释,当经济起步的水平较低的时候,更容易有快的提高。我们称其为经济潜力因子。

要得到样本数据关于三个因子的得分,综合量Y由因子的累积贡献率作为权重值加权得:Y=(51.592%/(51.592%+26.127%+7.73%))×经济总量因子+(26.127%/(51.592%+26.127%+7.73%))×外向型工业化因子+(7.73%/(51.592%+26.127%+7.73%))×经济潜力因子,应用样本数据计算得:

城市广州深圳佛山东莞茂名湛江清远肇庆江门惠州

经济总量因子2.333422.804750.888211.15981-0.4131-0.45836-0.57882-0.48825-0.27802-0.23741

外向型工业化因子-0.53582-0.625830.1743-0.14585-0.227790.15411-0.162040.638390.07470.17938

经济潜力因子0.017440.5747-0.23327-0.614821.36950.258670.39893-0.535713.356770.66518

综合得分2.271.150.650.560.130.07-0.02-0.12-0.14-0.16

排名12345678910

聚类分组2233111141

中山梅州珠海韶关汕头河源揭阳阳江汕尾云浮潮州

0.2236-0.636930.31219-0.5496-0.16404-0.70101-0.59822-0.6455-0.64041-0.76852-0.56377

1.3637-0.34325-1.05484-1.612811.57423-1.40625-0.42639-0.744380.61052-0.20862

-0.73089-1.44103-0.14406-0.57048-1.07238-0.05847-0.34712-0.84545-0.11016-0.26725

-0.2-0.24-0.25-0.26-0.33-0.37-0.45-0.49-0.55-0.63-0.64

1112131415161718192021

31314144444

由图表看出,广州依然是省内经济状况最佳的城市,其分值远高于其它地区,深圳、佛山和东莞一直保持着比较高的经济增长,这也能由排名看出。令人感到意外的是,茂名、湛江和清远这几个粤北山区的城市,它们的经济排名比珠江三角的江门、中山和珠海等地靠前。这或许是因为,近年茂名等市工业化的速度很快,同时有大量的引入外资。

本文应用聚类分析法,将二十一个城市归入四类。从两种方法的比较结果大体相符来看,所构造的三因子模型能描述各市的经济状况。广州和深圳拥有扎实的经济社会基础,领先于其它城市;佛山、东莞、中山和珠海都属于珠三角较发达的地区,虽然中山和珠海的排名下降,它们仍然具有不可忽视的优势;茂名、湛江等八个城市,地理位置不同,可有一些共同点,就是近海和山区经济的条件,在经济的结构和发展模式上,也有相似之处。江门、汕头等市,整体经济水平在全国仍然算是比较高的,大部分是沿海的,有可能是缺乏活力,使其位列广东省下游。

4 结论

主成分分析法不仅能降低处理数据时的计算量,也能通过构造线性函数模型,使众多不同类型的样本被标准化而放在一起比较,用于判别和预测分析等。

因为广东的经济增长很快,城市也处于积极变化中,本文以市为单位并不能反映推动经济的所有因素,在选择变量的过程中还缺乏其它类的数据,这也影响到研究的准确性,然而主成分分析作为一个有用的工具,为我们提供了更宽的研究思路。

参考文献

[1]柯惠新,沈浩.调查研究中的统计分析法\[M\].北京:中国传媒大学出版社,2005.

[2]赵莹雪.广东省县际经济直辖市发展研究\[J\].经济地理,2003,(7).

[3]胡伟平.广东地级市中心城市主成分聚类分\[J\].热带地理,1994,(12).

[4]林海明.如何用SPSS软件一步算出主成分得分值\[J\].统计与信息论坛,2007,(9).

[5]广东统计年鉴编辑委员会.广东统计年鉴-2008\[M\].北京:中国统计出版社,2008.

上一篇:城乡一体化社会保障体系建设的理论支持研究 下一篇:广东省教育发展水平和经济增长的灰色关联分析