基于因子分析和聚类分析的山东省区域经济发展研究

时间:2022-07-10 09:01:28

基于因子分析和聚类分析的山东省区域经济发展研究

[摘要]建立区域经济发展评价指标体系,以山东省17个市为样本,运用因子分析进行实证分析,提取出经济水平与生活水平因子、产业增长水平因子两个主因子,并基于因子得分矩阵对17个市进行聚类分析,结果表明,综合经济实力因子处于主导地位,东西部地区经济发展存在较大差异。

[关键词]区域经济;因子分析;聚类分析

[DOI]1013939/jcnkizgsc201714128

1引言

2014年山东省经济保持较快增长,GDP突破594266亿元,比上年增长76%,经济总量稳居全国第三,人均GDP为60879元,相当于全国平均水平的13倍。尽管大部分指标优于全国平均水平,但由于经济基础、自然基础等方面的原因,区域经济发展仍存在较大差异。对山东而言,缩小地区间经济发展水平的差距对提高山东省整体经济实力至关重要。[1]

关于如何度量地区经济发展水平和差异,以往的研究通常采用人均国民收入或人均GDP。史瑞芳以人均国内生产总值作为测度指标,运用标准差和离差系数分析了山东省区域经济差异。但是使用单一指标评价只能反映地区经济发展的某一方面而非整体。目前,虽已有前人采用聚类分析等多元指标评价体系对山东省区域经济发展进行分类,但其指标计算过于烦琐,且现今山东省各县经济发展水平已发生较大变化,分析结果与现在情况偏差较大,有所欠缺。论文以山东省17个地市为样本,建立区域经济指标评价体系,根据2015年山东省统计年鉴,运用因子分析和聚类分析对区域经济发展水平进行研究,根据山东省现在的经济水平,按各市的经济发展情况进行分类,避免了人为因素的干扰,希望通过对各市经济状况的定量化分析,缩小各市之间的经济差距,促进山东省经济的平衡发展。

2方法原理

21因子分析

因子分析属于多元统计分析中处理降维问题的统计方法。它通过对变量之间关系的研究,找出能反映原始变量绝大多数信息的综合指标,而综合指标之间彼此不相关,这样就可以根据专业知识和指标所反映的含义对综合指标给予命名,实现降维的目的,简化问题的复杂性。

设观测变量为x=(x1,x2,…,xp),因子模型的一般表达形式(基于相关系数)记为:

22聚类分析

聚类分析是根据事物本身的特性研究个体分类的多元统计方法,原则将属性相同或相似的样品归为一类,使同一类中的个体有较大的相似性,不同类中的个体差异较大。系统聚类法是聚类分析中应用较多的方法,其基本思想是:开始时,将n个样品各作为一类,第一步先将距离最近的两类合并成一类,再重新计算这一新类与其他类的距离;重复进行两个最近的类的合并,直到合并成一大类为止。[2]

按照类与类之间距离的计算方法不同,聚类分析可以分为很多种,本文采用的是组间连接。

3实证检验

31指标选取

根据2015年山东省统计年鉴,以山东省17个地级市作为样本,从经济发展规模、工业生产规模、地区经济效益、人民生活水平等方面选取了11个经济指标:地区生产总值X1(亿元);第三产业增加值X2(亿元);工业增加值X3(亿元);公共财政预算收入X4(万元);邮电业务总量X5(亿元);卫生技术人员数X6(人);医院年床位数X7(张);交通旅客客运量X8(万人);社会消费品零售总额X9(亿元);入境旅游外汇收入X10(万美元);就业人员工资总额X11(亿元)。

32相关性检验

运用SPSS统计软件对17个地市的数据进行处理,因为各指标之间的量纲存在很大差别,所以在进行相关性检验前先对数据进行标准化处理,以消除量纲差异所造成的影响。

因子分析要求原有变量之间存在较强的相关关系,否则无法提取出能反映原始变量各类信息的少数几个因子,所以在M行因子分析前,需先检验变量间的相关性。本文通过KMO检验和Bartletts的球形度检验看数据是否适合做因子分析,其结果见表1。

由表1可知,Bartletts球形检验的近似卡方值为277238,自由度为55,Sig趋近于0000

33求因子和因子载荷矩阵

运用SPSS软件对11个指标作因子分析,选用主成分法得初始解。特征根及方差贡献率的结果见表2。

根据特征根大于1,累计方差贡献率大于85%的原则,提取了两个主成分,其累计方差贡献率已达到87432%,说明前两个因子反映了原始变量87432%的信息,具有显著代表性,符合进一步分析的要求。因此,选择前两个因子f1和f2作为评价山东省17个城市经济发展水平的综合指标。采用最大方差法进行因子旋转,得到旋转后的因子载荷矩阵,见表3。

表3反映了主因子与原始变量的相关程度。载荷系数越大,该指标与因子的相关性越强,也就意味着因子反映了该指标更多的信息。第一个因子(f1)主要与地区生产总值、公共财政预算收入、邮电业务总量、卫生技术人员数、医院年床位数、社会消费品零售总额、就业人员工资总额的载荷系数较大有关,主要解释了这几个变量,载荷值均在09以上,集中反映了城市经济实力的信息,故将其命名为“经济与生活水平因子”;第二个因子(f2)主要与第三产业增加值、工业增加值有关,主要解释了这两个变量,载荷值均在08以上,反映了城市的产业发展水平,故命名为“产业增长水平因子”。[3]

34计算因子得分及排名

用回归法计算出各因子得分函数的系数,见表4。

根据因子得分系数矩阵和原始变量的标准化值,可计算出各因子得分如下:

公因子f1、f2和综合因子F的得分及排名情况见表5。

从表5中可看出综合得分排名和经济与生活水平因子的排名基本一致,@个因子的方差贡献率达到了68652%,说明经济与生活水平因子很大程度上决定了一个地区的整体经济实力。以青岛市为例,青岛的经济与生活水平因子得分为22228,远远高于其他城市,在经济、卫生、医疗、旅游等方面领先于其他地区,使其综合经济实力遥遥领先。

各城市产业增长速度仍存在较大差异。菏泽、临沂、济宁、德州等整体经济实力中等的城市的产业增长水平因子较大,第二、三产业蓬勃发展,而青岛、济南、烟台等整体经济实力较强的城市第二、三产业增长速度逐渐放慢,淄博、东营、滨州、莱芜等整体实力较弱的城市的第二、三产业增长速度仍旧较慢,这些整体经济实力较弱的城市应加大对工业、服务业的投资力度,政府采取一定的优惠政策,吸引外商投资,提高产业增长速度,带动经济发展。[5]

35聚类分析

根据因子分析中各个市两个主因子的得分数据,利用SPSS软件系统聚类――Q型聚类分析对17个地级市进行分类分析,生成树状图[6](见下图)。

根据上图,论文大致将山东省17市的经济发展情况分为五类,如表6所示。

第一类:青岛,山东省经济发展的中心。青岛地处亚太经济圈和环渤海经济圈的重要部位,拥有良好的港口资源,是世界吞吐量最大的十大港口之一,进出口贸易发达并且青岛环境优美,吸引了国内外大量的游客,为经济发展提供了良好的基础。同时,青岛拥有海尔、海信为代表的一系列知名企业,经济优势明显。

第二类:济南经济排名下滑,潍坊、烟台、临沂、济宁迎头赶上,属经济发展水平较高地区。济南是山东的省会城市,是山东省的政治、文教、科研中心,第三产业优势明显,但无行业领袖,第二产业发展相对疲软,产业结构的层次亟待提升。潍坊、烟台、临沂、济宁近几年来发展迅速,尤其是潍坊、烟台。潍坊地处山东半岛与内陆交通枢纽位置,是山东省“一体两翼”发展战略的主体城市,第一、二、三产业发展迅速,名牌带动战略的实施,使“潍坊制造”实现了由“一枝独秀”向“群峰竞秀”的转变,形成了以海化集团、亚星集团等企业领衔的海洋化工产品基地;以晨鸣集团等企业领衔的纸制品生产基地;以潍柴动力、福田雷沃重工等企业领衔的内燃机、农业装备基地;以孚日家纺、新郎等企业领衔的纺织服装基地。烟台具有良好的港口优势,具有发展对外贸易的良好环境,这为招商引资带动区域发展提供了良好的基础。临沂依托物流业,济宁依托以“三孔”为代表的旅游业,形成自己的经济优势。

第三类:菏泽,第二、三产业发展迅猛,支柱产业尚未形成,属经济发展水平中等地区。菏泽市处于鲁、豫、皖三省交界处,区位优势明显,交通十分便利,同时拥有丰富的石油、煤炭、天然气等自然资源,为第二产业的发展打下了良好的基础。但菏泽虽占据交通要道,却没有形成物流这一新兴产业,同时,菏泽的一些特色产业,例如曹县工艺品、郓城的板材加工业、巨野县煤炭产业链没有得到政府的推动,缺乏相关政策和资金的支持。

第四类:威海、日照、泰安经济发展有待加强,德州、聊城、枣庄、东营从鲁西脱颖而出,皆属于经济实力较弱地区。威海三面环海,风景优美,旅游业和渔业、养殖业蓬勃发展,随着经济全球化的趋势,威海曾经陆域腹地狭小的劣势,正悄悄地发生着改变,威海应抓住契机,发展外向型经济,提升综合实力。[8]日照区位条件优越,处于环黄渤海经济圈、环太平洋经济圈和新亚欧大陆桥经济带的接合部,生态环境优势突出,旅游资源品质较高,但经济基础薄弱,工业化水平低,缺乏知名企业,一定程度上制约了经济的发展。泰安旅游资源丰富,历史底蕴浓厚,但对经济发展起到重要作用的工业、农业等方面欠缺且城市建设水平较低,投资较为单一,一定程度上阻碍了泰安经济的发展。德州、聊城、枣庄、东营全部来自鲁西地区,煤炭等自然资源丰富,为鲁西地区的发展注入了活力,但这四个城市产业发展仍不成熟,生产的多为附加值低的资源密集型和劳动密集型产品。

第五类:淄博、滨州、莱芜经济发展缓慢且水平较低,属经济实力弱的地区。淄博具有资源、区位、交通通信信息产业优势但也面临着支撑传统工业的资源枯竭、城市环境污染严重、第三产业增速慢,产业结构不合理等问题,产业增长水平因子位居第17位。滨州矿产资源丰富,农业,但经济结构发展不合理,第一产业比重过大,工业欠发达,第二、三产业发展缓慢,城市化水平不高。东营石油资源丰富,坐拥胜利油田,重工业发展良好,尤其是石油化工,但与此同时也对城市造成了严重污染,第三产业未得到良好发展。莱芜铁矿石资源丰富,是全国重要的冶铁中心,但产业结构呈“二、三、一”,结构不合理且科技创新能力较弱。

4结论与建议

通对17个地市的经济发展水平指标进行因子分析和聚类分析可以发现,山东经济较为发达、产业增长水平较快的区域位于中东部,而经济比较落后,产业增长水平较低的区域多位于西部。东部地区应以青岛为核心,带动潍坊、烟台、威海、日照等地区。这一区域科技创新能力较强,沿海区位优势明显,开放程度较高,吸引了大量的外资与人才,要充分利用港口,交通的便利,发展对外贸易,引进先进技术和设备,拉动山东省经济增长。中部地区以济南为中心,带动鲁中淄博、泰安、莱芜、临沂等地市的发展,借助济南科技、文教中心的优势,引进先进技术与高科技人才,使产品由低附加值的资本密集型与劳动密集型向高附加值资本密集型与技术密集型转变,提高生产率。西部地区第二、三产业发展缓慢,高新技术产业占比低,经济基础薄弱,但是该地区自然资源较丰富,劳动力成本低,要借鉴济宁与泰安等地区,重视旅游业的发展,打造优质旅游景区,提升旅游竞争力,树立山东良好形象。

参考文献:

[1]史瑞芳山东省区域经济差异分析[J].企业导报,2010(2):155-157

[2]田冰,王东,姬妍,等基于因子分析和聚类分析的安徽省城市综合实力分析评价[J].金属材料与冶金工程,2007,35(4):57-60

[3]山东省统计局山东统计年鉴[M].北京:中国统计出版社,2015

[4]唐林俊,杨虎西部地区经济发展状况的因子分析[J].学术纵横,2008(5):125

[5]于文广,黄玉娟山东省各主要城市综合经济实力分析[J].新世纪论丛,2006(2),288,292

[6]高鑫,许文娟基于因子分析和聚类分析的辽宁省县域经济综合评价[J].农业经济,2010(10):17-18

[7]王庆丰,党耀国,王丽敏基于因子分析和聚类分析的县域经济发展研究[J].数理统计与管理,2009,28(3):495-501

[8]张继军,蒋国洲,黄咏华海南省县域经济竞争力的实证分析[J].海南大学学报:人文社会科学版,2005,23(1):110-114

[作者简介]王艺璇(1995―),女,汉族,山东潍坊人,中国农业大学烟台研究院,学士。研究方向:市场营销,区域经济;李梅芳(1969―),女,汉族,山东冠县人,中国农业大学烟台研究院,副教授,硕士。研究方向:公司理财。

上一篇:北京临空经济发展问题与对策研究 下一篇:基于DPSIR模型与集对分析法的三峡库区水生态安...