基于MATLAB主成分分析的北京市耕地面积变化影响因素研究

时间:2022-05-27 10:41:33

基于MATLAB主成分分析的北京市耕地面积变化影响因素研究

摘 要:在充分理解主成分分析法的基础上,使用MATLAB实现计算过程,选取五大类17个社会经济指标,提取出前两个主成分,建立主成分回归模型。研究发现,人口增长、城市化加快、农业结构调整是耕地面积减少的主要原因,同时发现第三产业的迅猛发展对耕地面积增加具有正向促进作用。控制人口与促进第三产业持续快速稳定健康发展,是减缓北京市耕地面积过快减少的有效措施。

关键词: 耕地;主成分回归模型;主成分分析法;MATLAB;北京

中图分类号:F323.2 文献标识码:A DOI编码:10.3969/j.issn.1006-6500.2011.06.019

Study on Influencing Factors for Cultivated Land Loss in Beijing City with PCA MATLAB

LI Xu1, MA Hui-lan2

(1. College of Management, Xinjiang Agricultural University, Urumqi, Xinjiang 830052,China; 2. College of Economics and Commerce, Xinjiang Agricultural University, Urumqi, Xinjiang 830052,China)

Abstract: The cultivated land loss occurred in Beijing city in the past 10 years of new century, this paper chosed 17 socioeconomic factors , which divided into 5 classes, extracting front 2 principle components and building PCA regression Model, above all based on complete comprehension of principle component analysis. The study revealed that, population roar and urbanization with agricultural restructuring were the main factors for cultivated land loss, meanwhile, rapid development of tertiary industry made a good effect for cultivated land increment. Controlling the population scale and accelerating tertiary industry were effective measurements to slow down the cultivated land loss.

Key words: cultivated land; PCA regression model; principle component analysis; MATLAB; Beijing

耕地是不可再生的稀缺资源,是人类赖以生存的根本保障。耕地不仅具有农业生产功能,而且是北京生态系统中非常重要的有机组成部分,是宜居城市重要的生产性绿色空间。随着北京城区不断扩张和人口增加,北京市耕地面积一直持续的减少,改革开放三十年间全市耕地面积平均每年减少0.66×104 hm2,2000─2008年间年平均减少1.08×104 hm2。2008年中央制定的《全国土地利用总体规划纲要(2006─2020年)》确定北京市耕地保有量到2010年为22.6×104 hm2,到2020年为21.47×104 hm2,2020年基本农田保护面积18.67×104 hm2。未来伴随人口与经济增长,北京市土地供需矛盾将会日益尖锐,影响北京市耕地面积变化的因素有很多,既有社会经济方面的影响,也有农业产业内部调整方面的影响,并且还要考虑到政府相关政策的影响。本研究结合北京市的实际情况,选取五大类17个指标分析影响2000─2008年北京市耕地面积变化的主要社会经济因素,在充分理解主成分分析法原理的基础上,使用MATLAB 7.7.0实现相关的计算过程,分析得出2000─2008年北京市耕地面积变化与其他社会经济因素之间的相互关系。

1 研究区概况

北京市位于华北平原的西北角,地处华北平原向黄土高原和内蒙古高原的过渡地带,总面积164.11×104 hm2,占全国国土总面积的0.17%。西部和北部为山地,占全市的62%;中部和南部为平原,占38%。北京市行政区划现辖16个区县,习惯上划分为城区(含东城和西城2区)、近郊区(含朝阳、丰台、石景山和海淀4区)和远郊区县(包括门头沟、房山、通州、顺义、昌平、大兴、平谷、怀柔8区和密云、延庆2县)。北京市的耕地主要分布在近郊区和远郊区县的平原地带,昌平、房山、门头沟、密云等半山区和山区地带耕地面积相对较小。北京市2000─2008年之间耕地面积由329 248 hm2下降为231 688.2 hm2,同期人均耕地面积由0.0 241 hm2减至0.0 137 hm2,即截止到2008年年底人均耕地面积已经下滑为0.0137 hm2。

2 主成分分析法原理

主成分分析法应用在北京市耕地面积变化相关因素分析中的模型原理为:首先,以年份时间序列收集各种指标因素数值,假设这些指标因素都对耕地面积变化产生影响,则有n个年份样本(n=年份数量),每个样本有m个变量(m=指标因素数量,X1,X2,…,Xm),建立n×m阶的指标数值矩阵F,即

(1)

其中,Fj表示第j个指标在各个年份样本的数值形成的n阶列向量,Fij表示Fj在第i年份的数值。

其次,将指标数值矩阵F中的每一个元素Fij(i=1,2,3,…,n;j=1,2,3,…,m)进行标准化处理。数值标准化是为了消除不同指标数值之间不同单位、不同数量级的影响,便于指标数值之间的综合分析,标准化之后的指标数值平均值等于0,标准差等于1。数据标准化的方法有很多,但目前还没有通用的固定方法,本研究选取应用较多的偏差法作为本文的标准化方法[2],公式为:

(2)

其中,Mj 、Sj分别表示指标因素矩阵F第j列向量的平均值和标准差。原始数据标准化之后的新矩阵记为B,即n×m阶B=(Bij)n×m。

第三,通过坐标变化手段,将含有m个指标因素的Bj(j=1,2,3,…,m)做线性变化,转化为一组相互无关的综合变量Z1,Z2,Z3,…Zm,

(3)

Z1,Z2,…,Zm分别称为原始指标变量的第一,第二,…,第m主成分,其中Z1在总方差中占的比例最大,综合原始指标变量的能力最强,包含的信息量最大,其余主成分在总方差中占的比重依次减少,即Var(Z1) ≥Var(Z2)≥…≥Var(Zm)。l=(lij)m×m(i,j=1,2,…,m)为标准化后的矩阵B的相关系数矩阵的特征值所对应的特征向量构成的矩阵,且■l■■=1(i=1,2,…m)(4),即主成分公式右侧各项系数平方之和为1。

3 影响北京市耕地面积变化指标的选取

影响耕地面积变化的各种因素按其属性可以分为两大类:自然因素和社会因素。

3.1 自然因素

自然因素包括气候、水文、地质、地貌、大气、植被等因素。一般来说,自然变化是一个缓慢的过程。在一个比较短的时间内(10 a),影响北京市耕地面积变化的自然环境是比较稳定的,或变化十分微小可以忽略其影响。

3.2 社会因素

由于耕地面积变化与社会因素之间的关系非常复杂,故选择代表北京市社会经济发展状况的指标时应尽量全面,但选择的指标太多又会导致分析问题的难度加大。本研究依据SMART原则,即简单性(Simplicity)、可测性(Measurability)、获得性(Availability)、可靠性(Reliability)和时效性(Time-based),结合北京市的具体情况,参考前人研究[3-5]的基础上从《北京统计年鉴》选取17个指标,概括为5个对耕地变化构成影响的方面,Y为耕地面积(104 hm2)。

4 主成分分析模型的MATLAB计算实现

在主成分分析的计算过程中,从头至尾都涉及矩阵、数列运算,而MATLAB是一款完全面向矩阵运算的强大数值分析软件,它包含有内容十分丰富的函数库,可以组合或调用这些函数完成各种计算过程。目前,主成分分析计算大多是依靠统计软件SPSS,其优点是简单快速,但这不利于研究者深入的理解模型原理,并且无益于改进模型使之更具有针对性。

MATLAB实现过程如图2,其中corrcoef是函数库中用于计算列向量相关系数矩阵的函数,主成分Zi贡献率公式:

5 影响北京市耕地面积变化指标主成分分析

5.1 主成分的确定

经过如图2步骤的运算,得到相关系数矩阵corr的特征值及对应的方差贡献率、累计方差贡献率。

第一主成分的特征值为15.44,能够解释总变异的90.8%,即第一主成分包含了原始信息量的90.8%,第二主成分的特征值为1.14,解释了总变异的6.7%,前两个主成分的累计方差贡献率超过了97%,说明前两个主成分已经能够反映17个指标的97%以上的信息。另外,提取的主成分原则上要求各指标因子的公因子方差(主成分载荷值的平方和)尽可能接近,如果某一指标因子的公因子方差与其他公因子方差相比数值过小,则说明这一评价因子在提取的主成分中信息损失较大,可考虑增加主成分的数目[6]。表3显示各个公因子方差都大于0.9且相互比较接近。再者,根据确定主成分的一般原则:特征值≥1或累计贡献率≥85%,综合衡量确定主成分的个数为2,提取前两个主成分。

5.2 主成分与原始指标之间的相关关系分析

主成分载荷是主成分与原始指标之间的相关系数,该数值(绝对值)越大则该主成分的代表性越强,所包含的信息量越大。表3中,下划线标注的载荷显示了都大于0.9的数值,由表2、表3分析得到主成分与各指标之间的相互关系,第一主成分的方差高达90.8%,集中了除粮食总产量之外的所有指标大部分信息,主要体现为社会总体发展对耕地面积变化的影响,而第二主成分只与粮食总产量呈高度正相关,其它各载荷绝对值均未超过0.5,故第二主成分很好的概括了粮食总产量信息,主要体现为粮食产出对耕地面积变化的影响。

5.3 主成分回归模型的建立

主成分分析通过构造原始指标的线性组合,得到一组互不相关且能够反映原始指标大部分信息的新变量。从其中挑选前几个变量作为自变量,进行多元线性回归分析,可以在解决原始指标多重共线性问题的同时保持了原始变量的大部分信息。基本过程为:将前两个主成分(Z1、Z2)代替原自变量(各指标)进行多元回归分析[7],应用MATLAB中regress()和stepwise()函数得到的结果相同,回归模型如下:

Y=25.613 3-0.713 9Z1+1.724 4Z2

从回归结果看,判定系数与相关系数为R2=0.899 7、R=0.948 5,说明模型总体拟合效果很好,同时表示这五大类17个自变量对因变量Y的解释程度达90.0%,且通过F检验(F=26.918 4)与t检验(t1=-6.135 3和t2=4.024 3),P=0.001 0

从Y与Z1、Z2的模型来看,Z1表示社会总体发展对耕地面积呈负相关关系,Z2表示粮食产出与其呈正相关关系,为便于确定各指标与耕地面积变化的相互关系,将2个主成分经线性变换建立各原始指标与耕地面积的经验公式。

将主成分Z1、Z2转化为原指标变量,得到因变量Y与原始指标X1、X2、…、X17的线性回归方程:

Y=61.003 4-0.153 3X1-0.094 2X2-0.651 9X3+0.006 2X4-0.248 2X5-0.153 1X6-0.335 7X7-0.023 7X8

-0.291 9X9+1.583 8X10-0.191 1X11-0.196 8X12-0.072X13-0.288X14-0.255 4X15-0.038 3X16-0.062 5X17

从最终的回归结果可以看出,只有X4(人均地区生产总值)和X10(粮食总产量)对Y(耕地面积)具有正向相关关系,其它指标均与Y(耕地面积)呈反向促进作用。其中,人口与城市化、综合经济水平、非农产业发展水平对耕地面积变化的负向影响作用最大,原因在于伴随着人口的增长、城市化进程加快、非农产业的蓬勃发展需要更多的土地,尤其是城市近郊区和交通要道附近的耕地转换为其它用途,包括居住用地、商业办公用地、交通仓储用地等,城市化水平提高1个百分点会导致北京市耕地面积减少6 500 hm2,其次,金融机构人民币贷款每增加1亿元北京市耕地面积将减少3 400 hm2等。人均地区生产总值对耕地面积增长起正向促进作用,虽然增长弹性只有0.62%,效果甚微,但正向促进作用这一点很特殊 [8]。究其原因,第三产业产值占北京市地区生产总值的比重较大,自1994年第一次超过第二产业达到48.9%,此后比重仍处于不断递增之中,第三产业的发展不必需占用大面积耕地,并且因其(软件业、咨询业)高附加值对第二产业有挤出效应,新世纪2009年比2000年比重增加10.7个百分点,达到75.5%,又鉴于同期北京奥运对全市产业结构的影响更加促进了第三产业的发展,所以北京市人均地区生产总值对北京市耕地面积增长具有正向促进作用。农业发展水平对耕地面积变化的影响也较为显著,一方面,在耕地面积持续减少的不利条件下农业科技投入为粮食增收做出了很大的贡献,提高了农业劳动生产率;另一方面,针对农业的财政支出、科技投入的增加,农业现代化水平提升迅速,近年来北京市大力推动都市型现代农业发展[9-10],使农业不仅可以获得农产品收入,还具有休闲、观光、娱乐、教育、创意等非传统收入,受比较利益的影响导致耕地在农业内部转换为采摘果园、垂钓鱼塘、农业观光园、农业主题公园等等其他利用形式,转变耕地利用方式追逐更高的物质收益。

7 结论与不足

通过以上对2000─2008年北京市耕地面积变化与诸多社会经济指标的主成分分析,可得出以下的结论与不足。

(1)北京市耕地面积减少的主要原因在于人口、城市化和农业结构内部调整。作为一个仍将持续的影响因素,人口增加与城市化加快必然推动建设用地占用耕地数量的增加,一方面满足新增人口的居住需求,另一方面又导致生活配套服务设施占用耕地数量的增加,如引起学校、交通、绿地、商贸、工矿等等用地的扩张。都市型现代农业带给农民比单纯耕地产出更高的收益,也促进耕地转向其他农业用途而造成面积减少。第三产业的发展,一方面可以吸纳比工业更多的从业人员,减少工业发展占用耕地数量的增加,另一方面,受政府 “退二进三”政策的推动,北京市新增大型工业项目少之又少,这些都对耕地面积增加具有正向促进作用。因此,控制人口和促进第三产业发展并举,是有利于减缓耕地面积减少速率的有效举措。

(2)2000─2008年,正是北京从申奥到成功举办奥运会的时间,奥运场馆的建设、奥运对社会经济的带动,进而对北京市耕地面积变化的影响因缺少相关的数据而没有在此讨论,这是本研究的不足,留待以后有条件再深入研究。

参考文献:

[1] 北京市统计局,国家统计局北京调查总队.北京统计年鉴2010[M].北京:中国统计出版社,2010.

[2] 俞立平,潘云涛,武夷山.学术期刊综合评价数据标准化方法研究[J].图书情报工作,2009,53(53):136-139.

[3] 吴佩林,鲁奇,王国霞.近20年来北京市耕地面积变化及其相关社会经济驱动因素分析[J].中国人口资源与环境,2004,14(3):109-116.

[4] 岳禧庆,黄朝禧.武汉市耕地资源动态变化及驱动力研究[J].天津农业科学,2011,17(3):58-62.

[5] 王海鸿,马琼,付士波,等.西北干旱半干旱区耕地面积变化与人口、经济发展的相关关系研究[J].干旱区资源与环境,2011,25(1):74-80

[6] 冯长春,侯玉亭.城镇土地评价中主成分分析法的应用[J].中国国土资源经济,2007(7):27-32.

[7] 辜子寅.基于主成分回归模型在江苏省农民增收研究中的应用[J].统计教育,2009(4):21-25.

[8] 吴业,杨桂山,万荣荣,等.苏州市耕地面积变化的社会经济驱动力差异性分析[J].地理与地理信息科学,2007,23(2):75-80.

[9] 苗润莲,蔚晓川,张红.北京都市型现代农业发展现状分析及对策建议[J].北京农业,2011(3):9-11.

[10] 王振如,钱静.北京都市农业、生态旅游和文化创意产业融合模式探析[J].农业经济问题,2009(8):14-18.

上一篇:农业社会化服务渠道选择及其满意度研究 下一篇:基于Panel Data 模型的天津郊区城镇化对农民收...