应用主成分分析和聚类分析进行省区产业发展实力排序

时间:2022-09-08 06:47:47

应用主成分分析和聚类分析进行省区产业发展实力排序

摘要:本文通过我国各省区烟草产业发展实力排序和主要影响因素分析。利用多元统计分析的主成分分析和聚类分析方法,借助计算机软件,依据《中国工业统计年鉴2007》提供的我国各省区烟草产业多项经济指标数据,进行特征提取,计算出标准化了的原始数据的各主成分和我国各省区烟草产业发展实力按主成分以特征值贡献率为权重求和的综合评分,实现综合评分排序和在欧氏空间聚类,展示影响我国各省区烟草产业发展的主要影响因素,依据经济学原理提出相应的政策建议。

关键词:主成分分析;烟草产业;排序;比较优势

一、主成分分析

利用主成分分析方法,借助matlab软件,对我国各省区烟草产业发展实力进行排序,分析其主要影响因素和各省区比较优势,提出相应的政策建议,是一个尚未系统研究的有价值的课题。本文进行这一工作。

二、材料与方法

1 材料和仪器

采用《中国工业统计年鉴2007》提供的我国各省区烟草产业发展统计数据。

2 方法

(1)将我国各省区烟草产业的9项指标作为样本数据,建立原始数据矩阵。

(2)在MATLAB7.1工作界面上依次求取原始矩阵的标准化矩阵、相关系数矩阵、特征向量(主成分系数)、特征值、各特征值对应的贡献率和累计贡献率、各样本主成分得分、各样本以特征值贡献率为权重按主成分得分求和的综合评分、依综合评分对各样本排序、以主成分空间欧氏距离对各样本聚类。

(3)根据主成分系数与原始指标的对应关系分析各主成分的经济意义、根据各样本的各主成分得分分析各省区经济发展实力的主要影响因素

三、结果与讨论

1 运行结果

计算机运行结果的部分示例数据如图、表。

2 对结果的解释

根据主成分系数与原始指标的对应关系分析各主成分的经济意义:第1主成分系数都比较大:0.33~0.34,说明第1主成分综合反映了各个原始指标的信息;第l主成分的贡献率比较大:0.9522,说明第1主成分所包含的原始数据的信息量占总信息量的极大比例,这一个主成分就能够充分地体现原始数据9个量的信息,从而实现了我国各省区烟草产业发展实力指标体系的降维。

根据各样本的各主成分得分分析各省区经济发展实力的主要影响因素:从我国各省区烟草产业综合评分排序结果,可以看出:云南、湖南、上海、江苏、湖北、河南、广东、浙江这八个省区,是我国烟草产业发展实力最为强劲的主力。它们各具其比较优势:在原始数据指标所张的9维欧氏空间中离原点的距离最远,但有不同的侧重。通过聚类分析也可以显示这一事实(左图)。

3 对结果的经济学分析和政策建议

(1)根据比较优势理论和专业化分工理论,各省区的烟草产业发展应当加强交流合作:

(2)根据降低交易费用原则,各省区的烟草产业发展应当进行制度创新。

上一篇:FDI对我国服务业内部结构影响机理 下一篇:中国新能源行业发展现状分析