基于PP-DEA模型的区域城镇化发展差异的综合评价

时间:2022-07-03 01:55:34

基于PP-DEA模型的区域城镇化发展差异的综合评价

摘要:区域城镇化发展存在差异是客观现象,对这种差异进行科学、理性的评价是城镇化研究的核心内容之一。以安徽省区域城镇化发展差异为研究对象,以基于遗传算法的投影寻踪模型和数据包络分析模型为基础,从静态的发展水平和动态的发展效率两个方面对安徽省区域城镇化发展差异进行了综合评价,并通过构造综合差异指数把安徽省划分成4类城镇化发展水平区,包括高水平区、较高水平区、中水平区和低水平区,为此指出安徽省城镇化发展既要注重提高城镇化发展在资源投入、利用上的效率,又要坚持走提高发展质量和技术含量的内涵型发展之路。研究结果表明:基于PPDEA模型的研究方法可有效克服传统的基于多元统计方法的综合评价技术的不足,能够更科学、更全面地反映区域城镇化发展的差异情况,其能对区域城镇化发展差异研究提供一定的参考价值。

关键词 城镇化发展差异;投影寻踪模型;数据包络分析模型;综合差异指数;安徽省

中图分类号 F291.1 文献标识码 A 文章编号 1002-2104(2012)02-0130-06 doi:10.3969/j.issn.1002-2104.2012.02.021

目前已有的关于城镇化发展区域差异研究基本上是基于多指标的综合评价[1]。就研究的技术路线来说,目前均是城镇化发展水平的面上综合评价,以某一特定年度为研究截面,以该年度的相关截面数据为基础来定量评价区域城镇化的发展差异,本质上是一个城镇化发展水平的静态评价。已有研究虽然取得了较丰富的成果,但从全面把握事物发展的客观规律的目的出发,已有的成果缺乏对区域城镇化发展在资源投入、利用、转化为各项产出的动态差异研究,即缺乏这种静态发展水平背后所反映的动态发展效率的差异。另一方面,就所用的具体技术方法而言,基本上以传统的多元统计方法为主[2-5],如常用的主成分分析法、因子分析法、层次分析法、线性加权求和法、熵值法、不平衡指数法等。这些方法最大的缺点在于当指标数量较多时无法解决所谓的“维数祸根”影响[6],同时高维数据的复杂性、非线性也使得一些传统的多元统计分析方法的效用大大降低。同时随着数据维数的增高,数据的计算量迅速增大,传统的多元统计分析方法很难处理大量的数据。此外,传统的多元统计分析方法用于低维数据分析处理时稳健性较好,但用于高维数据时,稳健性较差[7-8]。因此,在城镇化发展差异研究中迫切需要新的、更为先进的数据分析处理方法。本研究将紧扣区域城镇化发展区域差异的综合评价这一研究中心,以安徽省为研究区,在借鉴和吸收已有研究成果的基础上,采用基于遗传算法的投影寻踪模型、数据包络分析模型等先进的现代数据分析和处理技术,对安徽省城镇化发展的区域差异进行全面、深刻、科学、理性的分析和评价,以期找出安徽省城镇化发展中存在的问题,由此为相关部门的城镇化发展政策制定提供科学的决策支持。

1 技术路线和方法

本研究在已有成果的基础上,把城镇化发展的效率评价引入到综合评价中,总体技术路线包含静态的综合评价和动态的效率评价两大部分。其中静态评价为现代城镇化发展水平测度的经典方法,即基于复合指标法的城镇化发展水平的综合评价法。效率评价则从经济学投入产出的角度来定量测度城镇化发展在资源开发利用上的效率和效益状况。本质上,效率反映了区域城镇化发展的内在能力,其不能直接从统计数据上反映。而静态综合评价则是这种能力的外在表现,是区域运用这种能力所取得的各项发展成果,是可以直接从统计数据上所反映。已有研究基本上是对外在表象的评价,尚缺乏对内在能力以及外在成果和内在能力是否匹配方面的客观评价。而只有对这两个方面进行综合评价才能更为全面、客观地揭示区域城镇化发展水平的差异。在具体的技术方法上,则采用现代先进的数学分析模型,包括在静态综合评价中采用基于遗传算法的投影寻踪模型,在效率评价中采用基于数据包络分析模型的效率评价模型,进而再把两个模型的计算结果进行综合,从而得到一个能全面反映区域城镇化发展的综合差异指数。具体的研究技术路线如图1所示。

1.1 投影寻踪综合评价模型

投影寻踪分析模型(Projection Pursuit,PP)是当今数据分析处理、数据降维研究的前沿领域[8]。PP基本思想就是把高维数据通过某种组合投影到低维子空间上,对于投影到的构型,采用投影目标函数来描述投影暴露评价对象集中同类的相似性与异类的差异性结构,寻找出使投影目标函数达到最优即最能反映原高维数据的结构和特征的投影值,从而实现数据降维并成功克服高维数据的“维数祸根”所带来的严重困难,达到研究分析高维数据结构特征的目的[9-10]。一般的,投影寻踪方法包括如下步骤[11]:

(1)设各指标值的样本集为{x*(i, j)|i=1~n,j=1~p},其中x*(i, j)为第i个样本第j个指标值,n、p分别为样本个数和指标数目。

(2)构造投影指标函数Q(a)。PP方法就是把p维数据{x*(i, j)|i=1~n,j=1~p}综合成以a ={a(1),a(2),a(3),...a(p)}为投影方向的一维投影值z(i):

z(i)=∑pj=1a(j)x(i,j)(1)

然后根据 {z(i) | i = 1~n}的一维散布图进行分类。式中a为单位长度向量。综合投影指标值时, 要求投影值z(i)的散布特征为:局部投影点尽可能密集,最好凝聚成若干个点团;而在整体上投影点团之间尽可能散开,这样能够最大限度暴露和揭示原始高维数据由差异性和相似性构成的结构特征。因此,投影指标函数可以表达成:

Q(a)=SzDz(2)

式中,Sz为投影值z(i)的标准差,Dz为投影值的局部密度,即

Sz=∑ni=1(z(i)-E(z))2n-1(3)

Dz=∑ni=1∑nj=1(R-r(i, j))u(R-r(i, j))(4)

式中:E (z)为序列{ z (i)|i =1~n}的平均值;R为局部密度窗口半径,它的选择既要使包含在窗口内的投影点的平均个数不能太少,又不能使它随着n的增大而增加太高,R可根据实验来确定,一般可取值0.1Sz;r(i, j)表示样本之间的距离,r(i, j)=|z (i)-z(j)|;u (t)为一单位阶跃函数,当t≥0时,其值为1,当t

(3)优化投影指标函数。当各指标值的样本集给定时, 投影指标函数Q (a)只随着投影方向a的变化而变化。不同的投影方向反映不同的数据结构特征,最佳投影方向就是最大可能暴露高维数据某类特征结构的投影方向,因此可以通过求解投影指标函数最大化问题来求解最佳投影方向。

最大化目标函数:Max:Q(a)=SzDz

约束条件:s.t.∑pj=1a2(j)=1

这是一个以{a(j)|j=1~p}为优化变量的复杂非线性优化问题,用传统的优化方法很难处理。在此采用模拟生物优胜劣汰与群体内部染色体信息交换机制的遗传算法(Genetic Algorithm, GA)来解决其高维全局寻优问题。遗传算法借用了生物遗传学的观点,通过自然选择、遗传、变异等作用机制,有效地解决了高维、非线性复杂问题和多目标函数的全局寻优问题[11]。在PP模型中把投影指标函数Q (a)作为目标函数,利用遗传算法求其最大值,把各个指标的投影a(j)作为优化变量,通过运行遗传算法即可求得最佳投影方向a(j),进而求得各个样本的z(i)值。对z(i)进行大小排序,即可完成一次客观的综合评价。

1.2 效率评价模型

从本质上看,区域城镇化发展也是一种经济活动,是区域投入各种资源获得各种产出的过程,投入和产出构成了区域城镇化发展的主轴。基于上述观点,研究运用数据包络分析(Data Envelopment Analysis, DEA)模型对区域城镇化发展的效率进行研究,从而揭示出区域城镇化在发展效率上的差异。DEA是一种新的系统分析评价方法,是评价具有多投入和多产出决策单元效率的一种非常有效的方法。DEA效率包括综合效率、技术效率和规模效率,当三个效率值均为1时为综合有效,否则为无效。具体的DEA原理可参见文献[12]。

2 案例研究

2.1 研究区概况

安徽地处华东、长江三角洲腹地,是我国东部襟江近海的内陆省份,有17个地级市,总面积13.96万km2。近年来安徽城镇化发展面临难得的历史机遇,安徽是国家“中部崛起”战略的关键省份,是沿海与内陆的“中转站”,而皖江城市带的推出和实施更使安徽发展上升为国家战略层面。然而应看到安徽省城镇化发展的基础弱,底子薄,层次不齐,进展不一,和周边发达省份相比,安徽省城镇化发展水平较低。

2.2 静态评价

研究采用复合指标法来测度安徽省区域城镇化发展的静态水平,计算样本为安徽省的17个地级市,数据为2008年17个地级市的各项指标数据。综合考虑和借鉴国内外常用的区域城镇化水平综合测度的指标体系研究成果,遵循指标体系构建的各项科学原则,本研究把经济城镇化、人口城镇化、社会生活城镇化、景观空间城镇化四个方面作为四个约束层指标,在其约束下又设计了可操作的具体指标,从而构建了相对全面的安徽省区域城镇化发展水平综合测度的指标体系,具体如表1所示。

2.201 95,此时对应的15个指标的最佳投影方向a值如表1所示。由表1可知,在经济城镇化的四个指标中,二产产值占GDP比重的a值为最大为0.355 7,其次为人均GDP,a值为0.251 7,地均城镇固定资产投资a值为0.000 1,而三产产值占GDP比重的a值为最小,这反映了四个指标对经济城镇化的客观贡献大小,进而说明安徽城镇化的过程迫切需要工业化的配套,需要城镇化、工业化共同发展和齐头并进。其他指标同理。总体上看,在所有15个指标中,社会生活城镇化的四个指标的a值均较大,四个指标的平均a值为0.363 7,远高于经济城镇化、人口城镇化和景观空间城镇化的平均a值。这说明在安徽省城镇化发展区域差异中,社会生活城镇化具有最大的贡献,也即17个地级市在社会生活城镇化层面上的区域差异最大,其次是人口城镇化、经济城镇化和景观空间城镇化。利用公式(1)计算得到安徽省17个地级市的城镇化发展水平的静态评价的综合得分,整理后如表2所示。

上一篇:粮食补贴政策与农户非农就业行为研究 下一篇:负外部成本内部化约束下的煤炭开采税费水平研...