FASOM神经网络农业技术水平差距分析

时间:2022-05-11 07:27:49

FASOM神经网络农业技术水平差距分析

农业技术是促进农业综合生产力和竞争力的战略因素,是提高农业生产力和实现农民生活富裕的重要保证。通过对我国省际农业技术水平差异的定量评价,不仅可以把握我国农业技术水平的空间格局及区域差异,还可以正确理解农业技术水平区域差异的内在机理及成因,从而为指导区域农业优化发展提供现实依据。

1农业技术水平及其评价方法

1.1农业技术水平

关于农业技术水平,广大学者从不同领域、不同角度进行了理论和实践探讨[1-3,5]。陈天佑、王红伶等认为,农业技术水平存在广义和狭义之分,是农业内部各要素如固定资产、流动资金、劳动力投入的集中体现,但是区域自然条件、农业基建投资对区域农业技术水平也有一定的影响。黄晓潮、程为国认为,农业技术水平是反映一个地区或者区域利用自然和社会条件创造财富能力的综合效应,是可以度量的。徐慧娜认为,农业技术进步水平受各种因素的影响,但社会经济因素起主要作用。王武科、李同升等认为,农业技术水平是地区农业发展的综合反映,集中体现在技术投入水平、基础水平、外部影响力、技术产出水平、技术效率水平5个方面。综上所述,农业技术水平是区域农业发展的综合体现,是区域内外各要素共同作用的结果。它既是一个时间的概念,又是一个动态变化的概念,并直接影响区域农业发展和农业综合生产能力。

1.2农业技术水平评价方法

目前,国内关于农业技术水平测度的方法主要有以下几种:①生产模型。这类方法依据技术进步、技术水平提高与经济增长的关系,从生产模型出发,推导出广义技术水平的实用测度模型[2-3];②超函数技术模型。这类方法运用描述超技术的超函数的概念,并把各个地区的技术与超技术作对比,具体反映各个地区与超技术的差距及各个地区之间的差距[4];③多指标综合评价模型。这种方法主要采用主成分分析法、因子分析法、聚类分析法、综合指标体系法,对描述对象的多项指标、信息加以汇集,用数学方法处理后,从整体上评测区域的农业技术水平[1,5,6]。从现有的研究来看,生产模型和超函数技术模型等的定量分析限于农业内部诸要素,而对影响农业技术水平的社会经济因素则缺乏严格的计量检验;多指标综合评价模型固然是一种较好的评价方法,但是其在评价区域农业技术水平时也存在一些问题,如需要行业专家对问题的各层权重赋值,因而不同程度地存在人为干扰。此外,距离法得出的分类结果也有可能存在局部差异。基于上述原因,本文引入FA-SOM神经网络模型,其不仅很好地集成了因子分析法可对多指标进行简约化处理,消除原始数据信息冗余的特性,而且继承了自适应神经网络非线性、无教师自组织、自学习的特点,较好地避免了主观性和局部分类偏差。

2农业技术水平评价指标体系

对农业技术水平评价指标体系,不同的学者从各自不同的研究视角进行了探讨[1-7]。在已有研究的基础上,本文依据科学性、系统优化、通用性、实用性的原则,综合分析及取舍,选取农业技术投入水平、产出效率、产出水平、基础水平及外部整体支农环境5个方面来构建农业技术水平综合评价指标体系,见图1,且各个原始量化指标在同类评价体系中采用频度均达3次以上,使得该综合评价体系具有较好的典型性和代表性。

(1)农业技术投入水平。农业技术水平的高低与区域农业技术的投入大小密切相关,是区域内外各农业生产要素投入的结果。一般而言,农业技术的投入愈大,农业技术水平的增幅就越高。这里用电力投入指数、非农固定资产投资指数、中高级劳动力指数来衡量。

(2)整体支农环境。良好的支农环境是促进农业技术水平提高的有力保障,其集中体现在区域支农政策、农业投资等几个方面。这里采用农业投资指数、农户投资指数、固定资产投资指数3个指标来刻画。

(3)产出效率。农业产出效率是区域农业技术水平的重要体现。通常,农业技术水平越高,各要素投入产出的效率就越高。该指标通过机械化效率、土地产出效率、劳动力产出效率、柴油使用指数4个小指标来综合衡量。

(4)基础水平。区域农业技术水平在某一时间段上是恒定的,但在时间序列上则是动态的。它反映了过去一个时期区域农业的生产基础累积情况,也是体现农业技术水平的一个重要方面。这里用农业劳动力指数和生产性固定资产拥有量来表示。

(5)产出水平。农业产出水平是农业技术水平提高的最终体现,用于衡量农业技术的产出能力。本文采用产量增幅指数来衡量区域农业产出水平。

3FA-SOM神经网络模型的构建

3.1FA-SOM神经网络模型构建原理

因子分析作为一种常用的多元统计分析方法,可以从众多可观测的“变量”中,概括和推论出少数不可观测的“潜变量”,目的在于用少量的因子去概括和解释大量的观测事实,并建立起最简洁、基本的概念系统,以揭示事物之间的本质联系[8]。神经网络的全称是人工神经网络(ArtificialNeuralNetwork,ANN),它由大量简单的基本元件———神经元相互连接,通过模拟人类大脑神经处理信息的方式,进行信息并行处理和非线性转换。由于其具有独特的类似于人脑的学习和识别能力,因而在社会生活的许多领域得到了广泛的应用。FA-SOM神经网络模型集成了因子分析和自适应神经网络模型的优点,其网络结构由一个输入层和一个竞争层构成,输入层与竞争层之间实现全互连接,有时竞争层各神经元之间还实行侧抑制连接(见图2)。它以无教师教学的方式进行网络训练,具有自组织的特性。在训练过程中,它不需要期望值,而是根据输入数据的属性来调整权重,进而完成向环境学习、自动分类和聚类等任务。目前,相关改进的模型已经被成功引入到农业研究领域,并取得了一定的实效[10-12]。但即便如此,因子分析和自适应特征映射神经网络相结合应用于农业技术水平评价仍未见有报道。自组织特征映射网络的基本原理、学习算法、计算步骤可参见文献[9],在此不作赘述。

图2自组织特征映射网络结构

3.2FA-SOM模型构建步骤

3.2.1数据来源及标准化

数据来源于2003—2008年历年《中国农村统计年鉴》、《2008中国统计年鉴》以及《2008中国农业统计年鉴》,数据具有真实性和可靠性。由于地区的部分数据缺失,为不影响最终分析结果,故将作为特殊区域对待,暂不进行统计分析。此外,台湾、香港、澳门等地区也未在统计之列。依照前述指标体系,采集相关数据,对原始数据样本集作标准化处理,标准化公式如下:χ*ij=χij-χjsj其中χj和sj(j=1,2…11,12,13)为j项指标观测值(样本)的均值和(样本)标准差。

3.2.2公共因子提取

对处理后的变量进行因子分析,由于前5个公共因子的累积方差贡献率达到88.491%,基本包含了所有变量的信息,故提取前5个公共因子。从表1可以看出,第一因子对电力投入水平、非农投资指数、中高级劳动力负荷较大;第二因子对农业投资水平、固定资产累积指数负荷较大;第三因子对劳动力产出效率、机械化投入水平负荷较大;第四因子对劳动力投入水平、生产性固定资产拥有指数负荷较大;第五因子对产量增幅指数负荷较大。因此,可以定义5个因子为农业技术投入水平、农业技术外部支农环境、农业技术产出效率、农业技术基础水平、农业技术产出水平。

3.2.3自组织特征映射网络数据样本

由因子载荷矩阵和因子权重计算出全国各省区的各因子得分和综合得分(见表2),并把这6个指标的数据集作为自适应特征映射神经网络的数据样本。

3.2.4自组织特征映射网络结构设计

首先,利用函数newsom导入标准化之后的数据,创建一个自适应特征映射网络,确定网络的输入模式为:pk=(pk1,pk2,…,pkn)k=1,2,…30,n=6即共有30组样本向量,每个样本向量包含6个元素。输入层的神经元个数为6个,而竞争层神经元的个数取决于30个地区最终被分为几类。为使最终分类结果尽量接近客观事实,故分别取3类、4类、5类进行学习,并选取较优者。然后利用训练函数Train和仿真函数sim对网络进行训练并仿真。在MATLAB7.0软件中应用神经网络工具箱(NNTool),选取网络类型Self-organizingmap,通过排列训练学习速率取默认值0.1,拓扑函数设置为hex-top,距离函数设置为link-disk,调整阶段的学习速率取默认值0.02,排列阶段的学习次数设为1000次,调整阶段的学习速率为0.02,调整阶段邻域半径取默认值1.0,训练误差为0.001,设置训练次数为10、100、500、1000次,观察其分类性能。结果显示,经过100次的训练以后,网络误差达到设定的精度,分类已比较稳定。经过比较分析,当结果分为5类时网络分类结果最接近实际情况,故将其作为最终采纳结果并通过ARCGIS9.2将分类结果以图的形式表现出来(见图3)。

图3农业技术水平省际差异

4农业技术水平省际差异及其特征分析

4.1总体特征分析

(1)由图3不难看出,中国农业技术水平呈现“少数领先、多数集中、整体偏低且内部差异较大”的特征。就全国范围而言,除北京、浙江、天津、上海、山东、广东等少数地区综合得分较高外,其它省区的综合得分都较低,且有18个省区的综合得分为负值,反映出我国农业技术进步水平整体偏低且内部差异较大,广大中西部地区农业技术水平亟待提高。五类结果分别集中了2、3、5、7、13个地区,尤其是三、四、五类分别集中了5、7、13个地区且同类间区域相对集中,说明三、四、五类地区农业技术水平集中且共性较大,内部差异性较小。

(2)从图3还不难看出,中国农业技术水平的另一特点是:农业技术水平的区域差异在空间格局上具有较强的梯度性,大体呈现为“中西部地区—北部干旱与半干旱地区—东部沿海地区—东部特大城市区域”梯度逐步提高的趋势。这与既往的研究结论相类似,又表现出部分差异。这一特征的形成机理虽然有其有固有的地理因素,但是更主要的还是由社会经济因素引起的。

(3)同理,位于相似区位的区域具有一定的相似性,反之则表现出一定的差异性。从聚类结果来看,各类型区域具有明显的区位趋同性,且相邻类别区域具有较强的地理邻近性。一、二、三类地区无一例外地分布在经济较为发达的东部地区,而其它类别则广泛分布在经济较为落后的中西部地区。

4.2局域特征分析

为了详细探讨各类地区之间农业技术水平的差异,根据表3将我国30个地区分为5类,结合表2,表3所示的各类别城市的6项综合指标平均值即反映各类别区域之间存在明显的差异。

(1)第一类地区包括北京、上海两个地区,其共同特征是我国最发达的区域,在技术投入、外部影响力、产出水平和综合得分4个方面,均超过全国其它区域。这两个区域经济高度发达,基础好、底子厚,社会经济活动的联动性很强,区内中高级劳动力、非农投资等都能维持在较高的水平,因而使其农业技术呈现出较高的产出水平。

(2)第二类地区包括江苏、浙江、广东3个地区,其共同特征是均位于经济发达的东部,具有较高的农业技术投入水平,农业技术综合得分、农业技术产出效率和基础水平的得分也较高,虽然与第一类地区相比有一定的差距,但是与其它地区相比,却有相对明显的优势。这3个省区均是沿海开放地区,市场机制比较成熟和完善,拥有较高的中高级劳动力水平,虽然外部的支农水平较低,但是依旧能维持较高的农业技术效率。

(3)第三类地区包括天津、河北、辽宁、福建、山东5个地区,其共同特征是均位于经济较为发达的东部,具有良好的区位优势,农业的产出效率和外部整体支农环境也较好,但是在技术投入、基础水平、产出水平和农业技术综合得分方面却没有比较优势。其中辽宁、天津等地虽然具有较好的整体支农环境,但是其优势并没有很好地显现出来,因而,与前两类相比依旧有一定的差距。

(4)第四类地区包括内蒙古、吉林、黑龙江、海南、青海、宁夏、新疆7个区域,其共同的特征是均位于我国的北方,拥有丰富的耕地资源,且地势平坦开阔,相比其它区域而言,它们拥有较高的农业生产性固定资产。宁夏、新疆等地虽然地域辽阔,拥有较多的耕地资源,但是受区域农业人口素质等各方面的影响,其农业技术水平较为落后。

(5)第五类地区包括山西、安徽、江西、河南、湖北、湖南、广西、重庆、四川、贵州、云南、陕西、甘肃13个地区,其共同特点是都位于相对落后的中西部地区,在技术投入、支农环境、农业技术综合得分上明显落后于全国其它地区,在产出效率、基础水平和产出水平上也处于劣势。其中,湖南、广西、云南等地虽然农业劳动力的投入水平较高,但是其生产性固定资产的拥有水平却不甚理想,相对较差的自然地形条件,难以为区域农业技术水平的提升提供必要的支持。

5结语

(1)应用FA-SOM神经网络模型对我国30个省区的农业技术水平进行了聚类分析,并将其分成五类,第一类地区包括北京、上海两个地区;第二类地区包括江苏、浙江、广东3个地区;第三类地区包括天津、河北、辽宁、福建、山东5个地区;第四类地区包括内蒙古、吉林、黑龙江、海南、青海、宁夏、新疆7个区域;第五类地区包括山西、安徽、江西、河南、湖北、湖南、广西、重庆、四川、贵州、云南、陕西、甘肃13个地区。

(2)应用FA-SOM神经网络对我国农业技术水平省域差异进行了评价,利用因子分析法对多指标进行了简约化处理,并充分利用网络的自适应、自学习特点,既克服了传统评价的主观随意性,又较好地反映了系统的非线性特点,使得网络具有较强的泛化能力,不失为一种有效的评价方法。

上一篇:公路日常养护专题调研报告 下一篇:服务业比重偏低调研报告