神经网络反向传播原理范文

时间:2023-10-30 17:12:16

神经网络反向传播原理

神经网络反向传播原理篇1

关键词:BP 神经网络 解析 理论

中图分类号:TP391 文献标识码:A 文章编号:1674-098X(2016)09(a)-0090-03

因为具有非常强的非线性,人们在学习BP神经网络时,往往会忽略它的动力学机制和数学运算细节,而只关注于调用相关函数,盲目地用于解决一些实际问题。这个问题成为了阻碍神经网络理论发展和应用的关键所在。该文将从基本理论、算法步骤、梯度下降算法的实现、BP神经网络的解析算例4个方面进行论述。这有助于从事人工智能算法研究或希望应用神经网络算法解决实际问题的初学者,更准确和更全面地理解神经网络理论。

1 基本理论

神经网络是一种非常重要的人工智能算法[1]。BP神经网络是最常用的神经网络算法,是误差反向传播(Error Back Propagation)神经网络的简称,是一种按误差逆传播算法训练的多层前馈网络[2,3]。

BP算法的基本思想是训练过程由信号的正向传播和反向传播两个过程组成的。当信号正向传播时,输入样本从输入层传入,经隐层逐步处理后,传向输出层。如果在输出层中实际输出值与期望输出值不符,则转入误差的方向传播过程,并依此往复。

误差的反向传播是将误差输出给隐层,再向输入层反传。在整个反传过程中,误差分摊到各层的所有单元,从而得到各层单元的误差信号,并以此作为修正各单元权值的依据。权值不断修正的过程,也就是网络接受学习和训练的过程,当神经网络的输出误差减小到某个可接受的程度,或进行到预先规定好的学习次数时,整个计算过程终止。

2 BP神经网络的算法步骤

(1)神经网络参数的初始化:给各连接权值分别赋一个区间(-1,1)内的随机数,设定误差函数的数学表达式E,给定计算精度和最大学习次数M;

(2)随机选取第k个输入样本及对应的期望输出:

(3)计算隐层各神经元的输入和输出;

(4)计算输出层个神经元的输出(神经网络的总输出);

(5)利用神经网络期望输出和实际输出,计算误差函数对输出层的各神经元输出误差的偏导数

(6)利用神经网络输出值关于隐层到输出层的连接权值的偏导数;

(7)同理,求得网络输出误差关于输入层与隐层权值的偏导数;

(8)利用和来修正两种连接权Tki和;

(9)计算全局误差E,并判断网络误差是否满足精度要求。当误差达到预设精度或学习次数大于设定的最大迭代次数,则结束程序;否则,返回第(3)步,选择下一个学习样本及对应的期望输出,进入下一轮学习。

3 梯度下降算法的实现

结合梯度下降算法[4]的实现过程,我们以BP神经网络为例,详细介绍神经网络的原理和实现过程。

对于一个n维值函数而言,若采用梯度下降算法计算其极小值,需要选择一个初始点,如果该点对应的非极小值,则必须对进行修正,并得到。

重复上述过程,在计算得到(x2,y2),直到第n步。当或时,结束循环,并输出(xn,yn)。

极小值点的计算精度由η的取值决定。

4 BP神经网络算法的解析算例

对于BP神经网络而言,其实现过程与极小值问题的梯度下降算法的本质是一致的,区别之处只在于对初始点坐标的调整^程。在梯度下降算法中,初始点的调整是正向的,即由初始点坐标决定调整方向(该点处的负梯度方向);在BP神经网络中,初始点(初始权值)的调整是反向的,即由误差函数关于各权变量的导数,对权值进行调整。

再举一个关于BP神经网络的简单例子,给定神经网络的拓扑结构图如图1所示,其中,输入层具有两个神经元A和B,隐层具有两个神经元C和D;输入样本为A=0.3,B=0.6,初始权值为:AC=0.1,BC=0.8,AD=0.5,BD=0.4,CE=0.4,DE=0.6。

可见,经调整的权值可以用输出的全局误差减小,往复这个迭代过程,我们将得到最佳的权值。

参考文献

[1] 李成.神经网络系统理论[M].西安电子科技大学出版社,1990.

[2] 戚德虎.BP神经网络的设计[J].计算机工程与设计,1998,19(2):48-50.

[3] Hecht-Nielsen R.Theory of the backpropagation neural network[J].Harcourt Brace &Co.,1992,1(1):593-605.

神经网络反向传播原理篇2

关键词:宏观经济;预测模型;BP神经网络;非线性

中图分类号:TP183;F015 文献标识码:A

文章编号:1006-4311(2009)11-0088-03

0引言

利用经济指标的准确预测是国家对宏观经济正确调控的必要前提。但经济系统,特别宏观经济系统是非常复杂的系统,广泛存在着非线性、时变性和不确定作用关系;而在计量经济学理论基础上建立的各种宏观经济模型,大都是线性模型,很难把握宏观经济系统中的非线性现象,必然导致经济预测的误差加大。学者们因此对各种线性模型做了不少改进,如建立分段线性模型、参数时变线性模型等,但结果并不理想。于是人们寻求一些非线性工具进行宏观经济建模。而神经网络具有并行计算、分布式信息存储容错能力强、自适应学习功能等优点,在处理复杂的人工智能和非线性问题上显示了优越性。

1基于BP神经网络的预测模型

BP(Back-Propagation)神经网络结构是前向的多层网络,含有输入层节点、输出层节点和一层或多层的隐层节点,同层的各神经元之间互不连接,相邻层的神经元则通过权值连接。当有信息输入BP神经网络时,信息首先由输入层节点传递到第一层的隐层节点,经过特征函数(人工神经元)作用之后,再传至下一隐层,这样一层一层传递下去,直到最终传至输出层进行输出。其间各层的激发函数要求是可微的,一般是选用S型函数。最基本的BP神经网络包括输入层,隐层,输出层这三层节点的前馈网络,其结构如图1所示。

BP神经网络使用一组样例对网络连接权值进行学习训练,每个样例都包括输入及期望的输出。在正向传播过程中,首先将训练样例的信息输入到网络中,输入信息从输入层经隐层节点逐层计算处理后,传至输出层。在计算处理过程中,每一层神经元的状态只影响下一层神经元的状态,如果在输出层得到的结果不是所期望的输出,那么就转为反向传播。反向传播把误差信号沿原连接路径返回,并按照一定原则对各层神经元连接权值进行适当修改,直至第一个隐层;这时再开始进行正向传播,利用刚才的输入信息进行正向网络计算。如果网络输出达到了误差要求,则学习过程结束;如果达不到误差要求,则再进行反向传播的连接权值调整。这一过程不断往复,直到网络正向计算输出结果达到误差要求为止,学习就告结束。网络训练结束后,在用于求解实际问题时就只须使用正向传播。

2具体应用

2.1 样本获取

神经网络建模关键之一是网络训练样本的选取。在模式识别征抽取是一个重要环节,抽取稳定且有效的特征是识别系统成功的关键。神经网络建模也就是对系统进行模式识别,神经网络中的特征抽取也就是样本的选取,包含原始数据收集、数据分析、变量选择及数据预处理;只有经过这些步骤后,才能对神经网络进行有效的学习训练。训练样本质量直接影响网络应用效果,应根据实际情况选取合适的能表达对象全面特征的样本,好的训练样本能提高网络学习速度和效果,并提高网络泛化能力。建立本预测模型时选取样本,首先是建模必须建立在一个基本固定的环境下; 其次是样本选取应涵盖系统特征的信息,要能够包含在控制中的输入输出特征,能给神经网络提供较为全面的边界信息。本模型旨在对西安市14个指标2008年的数值进行预测:GDP、全社会固定资产投资、居民消费价格指数、零售总额、工业增加值、财政收入、财政预算、可支配收入、农民人均纯收入、城镇新增就业人数、进出口总额、出口、外商直接投资、工业出厂价格指数。在排除各年可能发生异常情况下,用各指标前几年数据预测紧接着下一年的各指标数据。

2.2 神经网络模型结构

网络训练前,为了神经网络的逼近和收敛,均将样本归一化到0-1 之间。最大训练次数2000次,神经网络学习率按经验选取一般在0.001和0.1之间,隐含层结点的选取采用多次试凑法。

神经网络反向传播原理篇3

[关键词]人工神经网络湖南人均GDP预测

GDP反应某地区在核算期内生产活动的最终成果及衡量国民经济发展规模、速度、结构、效益的代表性指标,也是制定经济发展战略目标的主要指标。湖南省作为中部的一个省份,通过对“十一五”期间湖南省人均GDP的预测,可以分析全省的劳动量、资本量和技术知识的存量,利用GDP的存量功能,可以获得资源与要素的信息,并据此推算湖南省的经济增长的潜力,从而有利于政府部门制定更合理的经济政策。

一、问题的分析与模型的建立

经济预报是一个复杂的非线性系统,且系统的内部时时刻刻在发生变化,我们希望能够建立一个参数随预测环境的变化而改变的非线性模型,国内外对经济的预测进行了大量的研究,提出了许多预测的方法,其中神经网络被认为是一种较好的非线性预测方法,尤其是BP神经网络。BP神经网络结构简单,非线性处理能力却很强大。

1.BP网络模型

BP网络是一种单向传播的多层前向网络,其结构如图1

BP网络是一种具有三层或三层以上的神经网络,包括输入层、中间层(隐层)和输出层。上、下层之间实现联接,而每层神经元之间无联接。当一对学习样本提供给网络后,神经元的激活值,从输入层经各中间层,向输出层传播,在输出层的各神经元获得网络的输入响应。接下来,按照减少目标输出与实际值的误差的方向,从输出层经过各中间层逐层修正各联接权值,最后回到输入层,这种算法称为“误差逆传播算法”,即BP算法。随着这种误差逆传播修正不断进行,网络对输入模式响应的正确率也不断上升。

图1为常用的三层BP网络结构,如果输入层、隐含层和输出层的单元个数分别为n、q、m,则该三层网络可表示BP(n,q,m),利用该网络可实现n维输入向量Xn=(X1,X2…Xn)到m维输出向量Ym=(Y1,Y2…Ym)T的非线性映射。m,n根据具体问题确定,而隐含层单元数q的确定尚无成熟的方法,一般可设定不同的q值,根据训练结果进行选择。网络结构BP(n,q,m)确定后,网络参数包括输入层第i单元到隐含层第j单元的权重Wij(i=1...n,j=1...q),隐层第i单元到输出层第k单元的权重Wiko(j=1...q,k=1...m);隐含层第j单元的激活阈值(j=1...q)及输出层第k单元的激活阈值(k=1...m),以上权值和阈值的初值在网络训练之前随机生成;假设共有p个训练样本,输入的第p个训练样本信息首先向前传播到隐含层单元上,经过激活函数f(u)的作用得到隐含层的输出信息: (1)

激活函数f(u)采用s(0,1)型函数,即 (2)

隐含层的输出信息传到输出层,可得到最终输入结果为

BP算法的基本思想是学习过程由信号的正向传播与误差的反向传播两个过程组成。以上过程为网络学习的信息正向传播过程;如果网络输出与期望输出存在误差,则将误差反向传播,误差的反射传播是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,以误差信号作为修正各单元权值的依据,可以利用(4)来调节网络权重和阈值。

其中为W(t)次训练,η,α分别为比例系数和动量系数,E为误差平方和反复运用以上两个过程,一直进行到网络输出的误差减少到可接近的程度或进行到预先设定的学习次数为止()。

通常,经过训练的网络还应该进行性能的测试,测试的方面就是选择样本向量,将其提供给网络,检验网络对其分类的正确性,测试样本向量中应包括今后网络应用过程中可能的主要典型模式;样本可以直接测取得到,也可以通过仿真得到,在样本数据较少或者较难得到时,也可以通过对学习样本加上适当的噪声或按照一定的规则插值得到,总之,一个良好的测试样本集中,不应该包括和学习完全相同的模式。

2.BP神经网络在经济预报模型中的应用

采用神经网络进行经济预测,以湖南省1978~1999年的经济数据作为训练样本,2000年~2004年GDP进行预测仿真试验。

GDP预测指标体系就包含第一产业(x1)、第二产业(x2)、第三产业(x3)。在考虑诸年数据的可比性,在应用神经网络之前,采用如下方法对数据环比处理:

式中,x为指标的环比值;y为指标的原始数据值;w为物价指数,t和t-1分别代表当年度和上年度。采用BP神经网络进行预测,即用上一年的经济数据作为输入,下一年的GDP作为输出。因此GDP预测模型可以描述为:

y1=f(x1(t-1),x2(t-1),x3(t-1))

设置L―M算法BP神经网络的计算误差为10-4,最大计算步数为10000,计算结果见图2:

预测的结果见下表

从表中预测的结果,可以看出,模型拟合得到的数据与真实值是比较吻合的,预测的效果比较好,完全能满足实际应用的需要。如果我们对神经网络训练的精度作更高的要求,还可进一步降低预测的误差。

参考文献:

[1]Martin T.Hagan.神经网络设计.机械工业出版社,2005

[2]王振龙:时间序列分析.中国统计出版社.2003

[3]伍卫国:数值方法和Matlab实现与应用.机械工业出版社,2004

[4]飞思科技产品研发中心:神经网络理论与MATLAB7实现.电子工业出版社,2005

神经网络反向传播原理篇4

关键词:脱硫脱硝;BP神经网络;反向传播;预测

中图分类号:X73文献标识码:A文章编号:16749944(2014)07021303

1技术背景

煤炭燃烧产生的烟气中,含有大量的氮硫氧化物,这些氧化物直接排放到空气中,会导致酸雨等自然灾害的发生。因此,各国都在积极研究烟气脱硫脱硝技术。目前最新的技术是采用臭氧的强氧化性对烟气中的NO进行处理,使之溶解于水,降低烟气中的氮硫氧化物。

现有的技术对于臭氧的添加采用的是PID控制,此控制技术经过多年的发展,已经相对成熟。其控制设备简单,控制思路清晰,但在控制过程中也存在很多问题,比如对于大惯性环节控制滞后,震荡过度等问题。在添加臭氧的过程中,通过检测烟气输入端的氮硫氧化物的摩尔量,利用反应方程式计算理想状态下需要的臭氧摩尔量,然后再通过检测通入碱性废水中和前的NOx,SO2的浓度,完成PID调节,改变臭氧的添加量。

在添加的过程中,因为影响臭氧添加量的各个因素之间是非线性的,所以无法进行单一的线性补偿,导致臭氧添加量过大或者过少。过大会造成添加臭氧的浪费,过小会使烟气反应不完全,导致烟气排放不达标,所以本发明的目的就是根据历史数据对臭氧的需求量建立预测模型,通过数据的分析,预测臭氧的消耗量,以达到减少浪费或者减少烟气不达标的情况。

人工神经网络是利用计算机模拟人脑的结构和功能的一门新学科[1],能够利用自身的优良处理性能,解决高度非线性和严重不确定性系统的复杂问题,在此适合进行对臭氧需求量进行预测,所以提出建立一个三层BP神经网络预测模型,使用改进的算法进行训练,并对烟气脱硫脱硝中臭氧需求量的预测的方法[2]。

2BP网络及动量梯度下降算法

BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出的,一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,并且无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input layer)、隐含层(hide layer)和输出层(output layer)。

网络学习规则又称为 学习规则,对于给定的一组训练模式,不断用一个个训练模式重复前向传播和误差反向传播过程,各个训练模式都满足要求时,则说明BP网络已学习好了。从网络学习的角度来看,网络状态前向更新及误差信号传播过程中,信息的传播是双向的,但是不意味着网络层与层之间的结构也是双向的。

BP神经网络能够以任意精度逼近任何非线性连续函,使得其特别适合于求解内部机制复杂的问题,即BP神经网络具有较强的非线性映射能力;其次BP神经网络具有高度自学习和自适应的能力。还有泛化能力,即BP神经网络具有将学习成果应用于新知识的能力。容错能力:BP神经网络具有一定的容错能力,即使系统在受到局部损伤时还是可以正常工作(图1)。

从(2)式可看出,如果比例系数μ=0,则为高斯-牛顿法;如果μ取值很大,则LM算法接近梯度下降法,每迭代成功一步,则μ减小一些,这样在接近误差目标的时候,逐渐与高斯-牛顿法相似[4]。高斯-牛顿法在接近误差的最小值的时候,计算速度更快,精度也更高。由于LM算法利用了近似的二阶导数信息,它比梯度下降法快得多,实践证明,采用LM算法可以较原来的梯度下降法提高速度几十甚至上百倍。另外由于[JT(w)J(w)+μw]是正定的,所以(2)式的解总是存在的,从这个意义上说,LM算法也优于高斯-牛顿法,因为对于高斯-牛顿法来说,JTJ是否满秩还是个潜在的问题。

在实际的操作中,μ是一个试探性的参数,对于给定的μ,如果求得的 能使误差指标函数 降低,则E(w)降低;反之,则μ增加。用(2)式修改一次权值和阈值时需要求n阶的代数方程(n为网络中权值数目)。LM算法的计算复杂度为O(n3/6),若n很大,则计算量和存储量都非常大。然而,每次迭代效率的显著提高,可大大改善其整体性能,特别是在精度要求高的时候[5]。

3臭氧脱硫脱硝需求量的预测

以BP神经网络模型为原始模型,建立一个三层BP神经网络预测模型,使用改进的算法进行训练,并对烟气脱硫脱硝中臭氧需求量的预测[6],主要步骤分析为以下几个方面。

(1)根据生产工艺流程,臭氧将难溶于水的NOx,SO2等氮硫氧化物氧化成易溶于水的高价氧化物,通过碱性废水进行中和,同时脱硫脱硝的目的。通过分析可知,影响臭氧需求量的主要因素是:烟气的流速,反应前烟气中氧气的浓度,反应中管道内的平均氧气浓度,反应管道中臭氧与SO2的摩尔比,臭氧与NOx的摩尔比,气体在反应管道中的停留时间,碱性废水吸收液的温度,碱性废水吸收液中碱离子的浓度和烟气的温度等因素。在此,选取以上影响因素作为BP神经网络模型的输入变量,通入的臭氧的流速作为输出变量。

在建立BP神经网络模型过程中,隐含层节点数对BP神经网络预测精度有较大的影响,节点数太少,网络不能很好地学习,需要增加训练次数,训练的精度也受影响;节点数太多,训练时间增加,网络容易过拟合[7,8]。最佳隐含层节点数的选择可参考如下公式。

4结语

改进的BP网络预测模型,对同时脱硫脱硝臭氧需求量进行预测,训练算法采用动态自适应学习率的梯度下降算法,能够更快的进行训练,预测误差也较小,预测值有很好的利用价值;通过对臭氧需求量的预测,能够实时的根据工况自动改变臭氧的添加量,既能满足脱硫脱硝的技术要求,同时也可以降低臭氧的需求量,降低企业成本,提高公司效益。本文只是设计了方法,结果需要经过试验进行验证,并进行改进。

参考文献:

[1] 吴昌设.基于人工神经网络的电网日负荷预测研究[D].杭州:浙江大学,2011.

[2] 姜成科.基于遗传算法的神经网络在大坝变形预报中的应用 [D].大连:大连理工大学,2008.

[3] 刘晓悦,姚乐乐,聚类分析在超短期电力负荷中的应用[J].河北联合大学学报:自然科学版,2013,35(3):74~80.

[4] 沙瑞华.基于神经网络的水电机组动载识别研究[D].大连:大连理工大学,2005.

[5] 黄豪彩,杨冠鲁.基于LM算法的神经网络系统辨识[J].组合机床与自动化加工技术,2003(2):6~8.

[6] 冯居易,郭晔.基于LM算法的石油期货价格预测研究[J].技术经济与管理研究,2009(5):19~21.

[7] 项灏,张俊.一种改进的量子遗传模拟退火算法及其在神经网络智能故障诊断中的应用[J].机床与液压,2012.40(13):196~200.

[8] 李欣,程春田,曾筠.基于改进量子遗传算法的过程神经元网络训练[J].控制与决策,2009,24(3):347~351.

神经网络反向传播原理篇5

关键词:网络传播文化转向 选择性坼裂 身体乌托邦 精英意识 大众立场

作者欧阳友权,中南大学文学院院长、教授、博士生导师、网络文学研究基地首席专家。(长沙:410083)

所谓文化转向,是指文化发展方向出现了异于既有文化逻辑的预设道路,别开生面地创生一种新的文化理念和文化形态。从网络传播的角度看,文化转向是网络传媒形成的对于文化发展内容及其方向的影响,这种影响将深刻地改变既有的文化格局,重绘这个时代新的文化地图。

选择性坼裂:从现代走向后现代

虽然我们不能简单地说,诞生于后现代文化空间中的网络传播就必然具备后现代文化气质,进而天然传播后现代文化精神,但网络传播之所以成为促进现代文化转向后现代文化的主要动力,的确与网络传播自身拥有的特征密切相关。

与传统传播方式相比,网络传播第一个突出的特征是交互性,以此打破了传统传播的单向性;第二是多元性,它可以让多种声音共享一个Internet平台;第三是价值中立性,即多元主体的交流与兼容,造就了多元观念的冲撞和相互承认局面;第四是自主性,传播主体的自由选择强化了主体的自控机制和自主决策能力;第五是个体性,网络空间的自由选择加剧了大众的分化,无数个体组成了网络“蛛网覆盖”的无穷节点。从网络传播的诸种特征看,这似乎是一个有利于自由和民主实现的理想空间,是一个人类长久企盼的文化乌托邦。然而,文化的发展道路从来没有这般平坦,文化的复杂性就在于它总是和它的对立面相伴相生,从而给人们提供更多的困惑而不是最终解决方案。从交互性中我们看到了即时满足带来的理性监督空缺;从多元性中我们看到了伦理价值及其判断的失准失依;从价值中立中我们看到了文化的虚无主义深渊;从自主性中我们看到了对一切合法权威的拒绝和摒弃;从个体性中我们看到的则可能是公共意识的消解……网络传播与其说在传播某种确切无疑的文化信念,不如说是在传播人类长久的文化疑惑,一个个潜隐在传统理论体系和冥想深处的质疑变成了公开张扬的文化现实问题。网络传播中存在的文化症候似乎正是后现代文化存在的基本特征。加拿大后现代主义学者琳达,哈琴就曾指出:“后现代主义是一个既使用又滥用、既设置又、向埋藏于建筑学、文学、绘画、雕塑、电影、录像、舞蹈、电视、音乐、哲学、美学理论、精神分析、语言学或史学中的诸种纯粹观念发起挑战的矛盾现象。”伊格尔顿也曾针对后现代性问题写道:后现代性是一种思想风格,它质疑客观真理、理性、同一性和客观性这样的经典概念,质疑普遍进步或人类解放,不信任何单一的理论框架、大叙事或终极性解释。与这些启蒙时代的规范相左,后现代性认为世界充满偶然性、没有一个坚实的基础,是多样化、不稳定的;在它看来,这个世界没有一个预定的蓝图,而是由许许多多彼此不相连的文化系统和解释系统组成……

伊格尔顿的话正是网络传播中文化裂变表征的阐释,矛盾、困惑和相对主义精神似乎已是网络传播和后现代文化不可摆脱的文化标签,而其根由则是由现代文化产生和导致的。尽管关于现代文化失落和颓败的复杂原因人们总是众说纷纭,但基本上较为公认的说法是,两次世界大战,尤其是二战所引发的对于理性及其社会机制的彻底怀疑是导致现代文化被反思乃至最终遭到背弃的根本原因。因为战争的空前残忍与邪恶,战前、战后暴露的工业社会逻辑及其解决之道的匮乏无力,使人们不得不怀疑从来都被奉为至上的理性(人文和技术)是否[!]拥有人们赋予它的那种神圣能力,理性及其文化制度乃至在理性文化体制中发展成熟的工业社会本身是否可以继续交给现性执掌?于是,理性的文化地基开始崩塌,并纷纷碎裂为思想的残片,漂浮在困惑弥漫的人类上空。 但后现代文化并未像以往的文化一样,沿着理性的二元对立思维路径走到非理性的道路上去对理性展开拯救行动,因为后现代在摒弃理性的同时也摒弃了非理性道路:从文化历史的角度看,理性和非理性的对证两极常常会平衡人们对于理性或非理性的质疑,因此,理性的时代主流中常常潜伏着非理性的力量,而理性的时代之后常常是非理性的拯救方案的隆重登场。正是基于理性和非理性的联体存在特征,现代文化之后的文化便不是理性和非理性二元对证之间的线性选择,而是超越二元的多元呈现。超越二元的多元呈现从概念上容易理解和把握,运用到对现实文化环境的分析却是一个艰难的课题。也就是说,当一个文化问题不能在既有的文化思维框架中继续被深度思考时,这个文化问题就变成了一个不断漂浮的文化符号,一旦这个文化符号可能指向“这”也可能指向“那”时,它可能就什么也无法指向,最终只能自我指涉。于是后现代文化抛弃现代文化的深度阐释模式、中心概念观念、确定性分析手段、严肃性话语目标乃至不断创新的思维逻辑程式后,同时也就放弃了通过深度/平面、中心/边缘、确定/漂浮、崇高/世俗等传统的文化生产方式面对自身的文化困境,它只能在深度/平面、中心/边缘、确定/漂浮、崇高/世俗之间寻求生存空间,在各种“间性”(如主体间性)杂糅的话语中悬隔文化本身,让各种话语通过“无法”达致“有法”的境界。

后现代文化何以质疑现代确定性的文化概念,形成“间性”(主体间性等)当道的文化风格?伊格尔顿指出,后现代的“物质基础”是“资本主义的新形式”,诸如瞬息万变的、非中心化的技术领域,消费社会和文化工业。这种新的物质环境造成了传统的制造业被服务业、金融业和信息产业取代,也促成了传统的以阶级为核心的政治领域向各式各样的(基于族裔、性别、社区等)“身份认同的政治”转化。伊格尔顿的阐释表明,随着“资本主义”的发展,一种固态的物质世界观丧失之后,物质世界也就从静走向了动(就像经典物理学走向了现代物理学),而动态的物质世界必然带来动态的精神世界观的确立,资本主义社会从此便建立在一个物质和精神观念双重流动的认识论系统之上。可以说,这种流动的世界观是后现代文化形成的至关重要的原因,因为没有了恒定的对象,也就没有了确定性的文化原则,也就没有了思维的二元基点可以依赖,一切事物都在动态的呈现中丧失所谓的本质和特征。理论阐释的确如此,但我们的现实问题是,究竟是哪些日常的东西直接让所 有的人感受到了这个世界的变动不居,而不仅仅是物理学家和哲学家这样一些深入物质和精神结构内部的精英分子?

要逃离理论的抽象,只能回到理论生产的空间。后现代社会常常被称为信息社会,因为后现代文化基本上是在那种不同于传统的信息生产、组织、传播和影响的社会环境中成长和发展起来的。任何文明社会均离不开信息和信息传播,何以后现代社会就能够独占“信息”语词?这固然与从来没有一个社会像信息社会那样充满巨量的信息并依赖于这种信息有关,但显然,信息社会的本质在于它改变了信息的存在和发展方式。首先,它使信息的线性存在方式发展成为立体化的网状结构——人们不仅能够通过磁带、光盘、硬盘存储信息,通过电话、传真、电视、手机等传输信息,而且可以通过计算机加工信息,人类还从来没有能够像现在这样图、文、影、音一体化地进行过信息传播;其次,它使分散孤立的信息汇集成实时交互的系统,人们可以在任何时候、以任何方式获得各种工作、教育、娱乐、消费等资源的共享,人们在全球知识、文化共享的过程中,强化人的活动功能,扩大着人的活动范围,扩展和深化人与自然界之间的关系以及人与人之间的社会联系与交往;再次,它使信息的含义空前广大,信息是知识,信息是财富,信息也是力量,信息还是一种文化,掌握信息也就等于掌握了人、社会及其通往未来的钥匙。正因为后现代社会的信息中包含着丰富的非传统语义,所以后现代文化事实上就是一种依托于新的信息传播特别是网络传播而构建起来的文化,这种文化包含着充分的信息传播特征。当我们把信息社会、后现代社会、网络传播和后现代文化联系起来时,我们会突然明白,后现代文化的转向不仅是一种文化观念、文化思维的转向,而且是一种文化生活方式的转向,这种转向根植于日常生活中人们时时接触的信息,是信息的疯狂流动让人们感受到了一个稳定世界的失去,是信息的巨量传播让人们怀疑既有价值观的局限和简陋,是信息的丰富涌现刺激了人们的多元需求和欲望,是信息的民主和共享局面让人们渴望打破一切界限进入一个后现代的文化狂欢广场……

总之,从现代向后现代的文化转向绝非后现代取代现代那么简单,那种线性的时间观正是后现代首先要抛弃的认识论。文化转向也只是意味着我们获得了一种观察文化发展的窗口。窗口总是可变的,观察的对象却从来只有一个,那就是人类自身。网络文化的现代与后现代转型与转向,正是在这个过程中悄然出现并逐渐完成的。

身体的乌托邦:从尊崇理性到张扬感性

无论是政治决策还是技术创新,无论是意识形态体系还是人们的行为方式,理性都依然是现实社会组织的文明基石和人类基本的行为准则。但在思想文化序列中,网络传播下的观念变化让理性的地位显而易见地出现下降,至少不再能起绝对支配的作用。在后现代的“五反”思想范式描述中,无论反本质主义、反权威主义、反启蒙主义,还是反本体/主体论神学、反形而上学,根本的核心都在于反对单一的理性霸权,颠覆理性对于人类行为的至高控制。历史地看,在理性的进化历程中,感性从来都被视为是一种相当原始的对象领域,是一个没有思想、逻辑、稳定性的文化半成品,如果没有理性的规约或指导,感性永远只能是原始的、粗鲁的、蒙昧的和呆滞的本能反应,因此理性对待感性及其源泉总是持忽略与遗忘的态度,甚或采用压抑和删减的手法把感性作用降到最低,感性原罪般地成为人人必欲除之而后快的“文化阑尾”。然而网络传播却砸碎了这条枷锁,释放出感性的巨大能量,张扬了感性的文化地位,从而形成第二个引人注目的文化转向——从尊崇理性走向张扬感性。

感性源自感官,感官源自身体,感性本质上就是身体所处时空的心身体验。每个身体所处的时空位置决定身体拥有不同的感受和体验,这种感受和体验是人对自身认同的重要源泉。正因为如此,后现代的理论家像巴特、布迪厄、巴赫金、福柯都强调身体的理论意义和价值,把它和阶级、党派、主体、权力、社会关系、文化暴力、意识形态、美学和生产方式等范畴相提并论,伊格尔顿甚至宣称:“对身体的重要性的重新发现已成为新近的激进思想所取得的最重要的成果之一”。事实正是这样,读不懂身体文化学,也就很难读懂巴特和福柯,也很难理解后现代语境中的网络文化转向。网络时代的身体文化学,或者说身体的政治学,是从“身体化”和“非身体化”两个相互关联的概念出发阐述身体的文化价值的。首先,“身体化”是工业技术革命的结果,技术正在把人类身体的模拟物呈现为日益复杂的应用工具并放置到社会空间,用电子机械的强大功能来塑造、挤压人的性情、心味和能力,造成对人自身身体的侵犯和遮蔽。“身体化”的机器政治学告诉我们,我们必须回到自身粗糙的感官,进入活生生的感性经验,才能为日益增多的非人的机器身体增添生命的灵气,否则,机械真的会取代人成为地球和生命的主宰。其次,“非身体化”是技术规范约束身体的后果,工业流水线、钢筋水泥标准、商品行销逻辑、直线加方块的都市格局、各种科学的规范和族群管理制度等等,无时不在磨灭身体的原始锐气,使身体屈从于体外逻辑,变自己的身体为异己的身体,最终形成只能通过出售身体达到满足身体的怪异逻辑。比如无数人都在经历的日常生活行程——“工作—休闲一更多的工作一更多的休闲”就典型代表了身体的尴尬体验,身体无论是在工作场所还是在休闲状态都只是一个“不在的在”,一个空洞的能指符号,其自身不仅是被遮蔽的,也是被悬置的。

总之,“身体化”从人出发回到物,“非身体化”从物出发回到物,但无论“身体化”抑或“非身体化”都不是人的身体的解放,而只是身体的沉沦和堕落。身体堕落了,建立在身体之上的世界重构冲动也就自然颓败、堕落了,感性的文化政治理想不复存在。如此局面,对人而言,存在何为?

网络传播得以迅速发展的一个根本原因,就是人类渴望打破各种传统交往禁忌的原始冲动——那种让人人赤诚相见、让人人自由宣泄、让人人选择交往、让人人身体感性充分进发和满足的文化理想。因此网络传播的突出特征就是感性的生存和发展方式成为网络社会的主流价值标准。因为感性,网络话语恣肆、无所顾忌;因为感性,网络空间激情进发、魅力四射;因为感性,网络世界草根欢腾、众神退位;也是因为感性,网络文化精粗杂陈、美丑浑融。无论如何,感性的网络决定网络的感性形象,而这种感性形象反过来又加强着全社会的感性化迁移,从而导致人们纷纷从传统文化规则场域中抽身反顾感性的王国——身在何处人也就在何处,身决定人而不是人决定身,人的故乡原来就在它的原始身体里,感性冲动终于有了翻身解放的那一天,身体从技术的丛林中迎来了自身的文化盛世。在身体当道的时期,人们就不再为某种不能和身体相关的事物激动或兴奋,而总是寻求节日般狂欢的身体感受,那些位居五湖四海的身体,那些不断碰撞、摩擦、展示和吸引的身体,那些充满暴力或温柔、攻击或守卫的身体……身体的景观构成文化的景观,数字化生存就是感性的生存。也就是说,人们事实上是在通过身体构筑不同于工业化、技术化和理性化塑造人类自身的感性文化景观。这样的景观年复一年通过各种形式仪式般再现,满足的是人们对于最原始身体的渴望——即使思想也要经过身体的检验,看清身体在思想中的位置才能接受思想对于人生的规划。乌纳穆 诺早已指出,“感到自己存在,这比知道自己的存在具有更大的意义”。因为“知道”是一种可以通过逻辑说服的后果,总是存在“真”“伪”之别,而“感到”是一种源自肉身的体验和心灵的感悟,没有“真”“伪”之别只有“诚”“信”与否,何况没有“感到”的“知道”还真不能称之为真知道,因为只有感觉到了的东西我们才能真正理解它。

身体凸显,感性化思想的风行表明,网络时代的文化宣言首先就是感性的宣言,是一种全盘清除文化传统中清教主义残渣的最后行动,是一种现实利害关系超越理想观念关系的文化转型。与感性的高扬相关,网络时代的文化发展呈现出感官化的总体倾向。因为感官化易于被理解为化,所以感官化是一个危险的符号,但感官化本身并不必为这种危险负责,因为感官化的文化任务是在人类自由解放的理念上不断前进的期望能指,它指向着人的全面肯定和全面肯定后的人的生存局面。因此感官化的对立面是人性进化过程中各种非人化的文化规则或系统。从这个意义上说,感官化的理想目的地和马克思的人的全面发展实现的伟大预言是相一致的。今天,感官化的文化影响已经随处可见,从文学到艺术的表现领域,感官冲击,尤其是视觉化的感官冲击已经是基本的美学原则。由于视觉和感官天然的接近性,视觉的文化地位上升,而文字的重要性迅速下降,视觉美学已经几乎压倒思想逻辑成为文学艺术的表达中心。另一方面,伴随感官化潮流的是泛审美文化的崛起,个人化的生命体验、私人空间的时空淤积物以及世俗生活的方方面面都在以美学的名义对纯粹诗意进行全盘改写,文化工业的功利追求和时尚消费的趣味追求正成为泛审美文化的逻辑支柱,大量言说肉身化的世俗宣言在互联网上大行其道,庶几成为网络文化的主打。

无论理性化还是感性化的文化发展道路,都不是一个新鲜的文化议题。人类似乎总是徘徊在理性文化和感性文化之间,没有最终的答案。对于网络传播凸显的感性文化,我们固然可以采用历史的各种探索或既有结论进行阐释,但我们依然要记住的是,正如后现代文化不是一种二元对立的文化,理性和感性之间的关系也绝非简单地彼此取代,因而感性狂欢的人文主义价值尺度不能被感官的放纵淹没和,网络传播的感性的价值和意义依然在于它牢记以人为中心,为人服务,在信息的海洋中不断打捞人的属性,赋予人的生命以鲜活,赋予人的存在以尊严,赋予人的文化以永恒。如此,属于人的本性的感性才是真感性,真感性中的人才是人的真正雏形。这也是我们从网络文化中看到的感性的意义。

观念的祛魅:从精英意识到大众立场

在一个非大众化的时代,文化下移从来是一个历久而弥新的话题。在精英化的古典时代,文化走向大众从来只能是部分知识分子的私人理想,他们最好的文化收获也只是通过精英身份的自觉掩饰从大众中吸收某些有益成分,抑或通过自身的文化修养把大众推荐给或提升至精英群体,并最终实现大众的“被精英化”或部分“被精英化”。20世纪的大部分空间中,文化下移不仅是左翼知识分子的重要话题和活动,而且是中国共产党人的重要文化使命。但此间长久不能解决的问题是:到底要知识分子“精英化大众”,把大众提升到精英的水准,让他们获得精英的荣宠身份,还是要“大众化精英”,让所有人都大众起来?当年就说过,知识分子不干净,“最干净的还是工人农民,尽管他们手是黑的,脚上有牛屎,还是比资产阶级和小资产阶级知识分子都干净”。他倡导知识分子精英们“把自己的思想感情来一个变化,来一番改造。没有这个变化,没有这个改造,什么事情都是做不好的,都是格格不入的”。无论从哪一方面看,精英的大众化都会有值得自豪的成就和难以释怀的遗憾,这不仅是传统“民本”意识的反映,也是社会变革中文化革新的需要。纵观这段历史,我们会十分明显地发现,文化道路问题常常是一个事关政治正确的大问题,文化发展和文化立场的变化从来都不单纯是一个“文化”问题,其中都浸润着意识形态或隐或显的干预。无论精英立场还是大众意识,都是一种价值观,一种时代旌旗上猎猎飘动的旗语,其观念的合理性只能放在时代潮流的合理性之上去反思和追问。

网络的产生源于实用,即源于信息传播与沟通,网络的这种原初功能似乎一直沿袭下来,并成为网络传媒的重要特征。很多人上网也是基于实用理性,是利用网络的便利完成现实中做不到或不容易做到的事情。因为网络有用,所以网络的商业化发展速度也特别惊人,短短数年间便如火如荼形成气候,俨然一派新经济的先锋气象;网络的广泛商用进一步促成了其实用消费性特征,网络聊天、大小论坛乃至众多社区里充满各种情绪化或锋芒性的思想言论,它们和传统的杂志、报纸甚至是电视传媒比起来,难免显得浅薄、无聊、古灵精怪以及缺乏严肃性。如果把网络传播纳入文化传播的系统中作一番考察,网络传播促进的似乎只是大众文化,而绝非精英文化。问题在于,网络传播似乎也从未纠缠过自己的文化身份,谈论自己的文化归属,它只是按照实用的路线不断调整着自己的脚步,满足网民的需求,红红火火地热闹在自己的空间:但是网络空间毕竟也是现实的一部分,所以网络传播尽管没有明确的文化定位,仍然以自己的内容和形式成就了自身的文化特性,这个特性就是世俗的大众文化平台,是都市大众的文化广场。精英的文化也许没有下移到网络空间,大众的世俗口味却早早登陆网络,乡野趣味变成了灯红酒绿的市民消闲广场。正如有学者所言:“在网络传播时代,文化从经典进入非经典和反经典,使口语写作超过了书面语写作的价值,日常生活感成为这个时代的合法性标志。”

表面上看,大众文化似乎就是大多数人的文化趣味,但全球数以亿计的网民和全球数十亿的居民比较而言也不能算大多数,因此,这里的大众并不单纯是一个数量组合,而是一个文化质量层面的命名。作为一个语义含混复杂的语词,不同的思想体系就有不同的大众说法。与精英相对的大众就是百姓、愚民、庶民或草根;与意识形态相关的大众常常和人民、群众、劳苦大众相连;社会学的大众常常指同质的人、平均的人,众多而质同;哲学家眼中的大众,常常和单面人、孤独的人相关,发育不全又最容易成为文化工业的俘虏;传播学把大众看成是分散的个体,互不相连也不相关,是庞杂的大多数。在很大程度上,传统的大众概念都是精英的对立面,不管其定位态度是肯定还是否定,只要文化被强化其精神审美的一面,大众就难以摆脱非精神审美的拘牵,而被定位于较低的精神维度。 ( ) 本质上说,大众传播是一种可以打破时空限制而让文化得到更为广泛传播的技术形式,不同的人在不同的地域和不同的语境中国共产党享同一种文化,其所复制的对象也从传统的有限区域中解脱出来,实现文化产品的批量化生产,这不仅增加了作品的数量,而且拓宽了作品的文化审美接受面。但是无论报纸还是电视、广播等大众传媒都是一种较为容易控制的对象,因而大众传播理论上的无界限传播落实到实践上,只有等到网络传播的出现才真正成为可能,网络传播的这种无界限传播特征为大众文化的阐释打开了一扇新窗口——网民并非底层人土,严格说来,美国的网民应该属于中产阶级大众,中国的网民由于年轻人居多,过去总是被归类为知识分子阶层的。这样的网络原住民构成表明,大众并非在精神的审美价值传播和接受上存在障碍,不是因为无知才成为大众,而是因为不屑所以选择大众的文化精神。这样说来,网络传播时代的大众文化是一种整个社会文化价值取向转型的信标,它向世界表明,一种彻底告别传统精英文化价值观念的文化时代已经降临,一种回到个体、回到生活、回到感性的文化追求已经在网络中形成并逐渐扩散成为整个社会的文化价值观。如此一来,从精英到大众的转折就不是孤立的个人政治决定,而是全盘的文化整体迁徙。

网络传播的大众究竟指向何种文化语义?第一是文化差异弥平。如果说精英文化强调差异、区别、对立、界限、悬殊,那么大众文化就是以无差异、无区别、无对立、无界限、无悬殊作为根本。大众像一个熔炉,不断凝聚、消融各种文化元素,提供一个全球化的共同文化平台。你可以说这是一个想像的幻觉、大众的乌托邦,但大众通过肯德基、哈根达斯、耐克、奔驰、LV、壳牌、韩流乃至企鹅、北极熊的多元杂烩烹制,的确在为世界创造一种通用的文化语言,而不是精英的地域化差异对话机制。第二是价值中立语境。由于大众文化的价值认知一向较低,所以它们常常背负着“俗、浅、差”的骂名,到底精英和大众之间是领导和被领导、决定和被决定、吸收和被吸收的关系,还是在结构、功能、价值诸方面均完全不相同的两种文化现象?如果是前者, 我们显然很难回答为何大众文化从来没有被精英文化强大的批判声音吓倒并取消其存在的合法性;如果是后者,我们就必须深入到大众文化的结构、功能中去寻找答案。通过对大众文化的解剖,我们发现,大众文化的主体构成其实就是生活本身,大众文化的传播实际上就是大众生活过程的再现,大众在生活中积淀自己习俗、惯例、规则和行为系统的同时,也就形成了自身的文化,因此大众文化不是为解释生活而创造的意义系统,不是从生活的阐释和反思中把生活分裂成可传承和不可传承的两部分,因而大众文化事实上并不拒绝精英文化中能为我所用的成分,也不固守习以为常的文化习惯。时移世变,大众文化的这种价值中立使它成为一个兼容并包的体系,一个让文化和生活协调一致的时空区域。第三是俗世审美救赎。所谓俗世就是油盐酱醋茶包围的日常生活内容,尽管这个内容伴随人类数千年,但没有在审美的层面被关照过。俗世审美原则的崛起,原因在于俗世愈来愈被认同为一个人性的空间,一个较少被技术理性和商业功利态度污染和干涉的对象,俗世里存在着人的真性情。俗世的美学崛起当然也与文化和非文化、审美和非审美之间的价值弥平关系密切,杰姆逊就曾感叹地说:“在19世纪,文化还被理解为只是听高雅的音乐,欣赏绘画或是听歌剧,文化仍然是逃避现实的一种方法。而到了后现代主义阶段,文化已经完全大众化了,高雅文化与通俗文化,纯文学与通俗文学的距离正在消失”。既然距离消失,界限摒除,文化和审美的神圣叙事消亡,俗世便没有不崛起的理由。

神经网络反向传播原理篇6

关键词:人工神经元网络;BP神经网络;matlab;识别分类

中图分类号:TP391.41文献标识码:A文章编号:1007-9599 (2010) 16-0000-02

Artificial Neural Network Application on Face Classification

Liang Xiaoli

(Heilongjiang Radio&TV University,Harbin150080,China)

Abstract:In the face recognition technology is developing continuously,people not limited to recognize the human face,but the main emphasis on the accuracy and efficiency of face recognition.

Face recognition is divided into three steps,face detection,feature extraction,recognition category,identification and classification of the methods in which the decision of whether to correctly identify the human face.BP neural network with forward propagation and back propagation characteristics,so as to ensure the accuracy of classif-

ication,Therefore,the main author of this article how to MATLAB,the BP neural network used in face recognition classification.

Keywords:Artificial neural network;BP neural network;Matlab;

Recognition category

人工神经元网络,又称为神经元网络,它是对人脑的简化、抽象和模拟,反映了人脑的基本特性神经元网络是由大量处理单元广泛互连而成的网络。神经网络研究的是模拟人脑信息处理的功能,从人脑的生理结构出发来研究人的智能行为。是依托于数学、神经科学、物理学、计算机科学及工程等学科的一种综合性技术。

一、人工神经网络的分类

我们可以对人工神经网络进行如下分类:

(一)单层的前向神经网络

这里所说的单层前向网络是指拥有单层的神经元是,作为源节点个数的“输入层”被看作是一层神经元,“输入层”是不具有计算功能。

(二)多层的前向神经网络

多层前向神经网络与单层前向神经网络的差别在于:多层的前向神经网络和单层前向神经网络的隐含层个数不同,在多层的前向神经网络中完成计算功能的节点被称为隐含单元(隐含神经元)。由于隐层的数量不同,使网络能进行更高序的统计,尤其当输入层规模庞大时,隐层神经元提取高序统计数据的能力便显得非常重要。

(三)反馈网络

反馈网络指在网络中最少含有一个反馈回路的神经网络。反馈网络中包含一个单层神经元,在这一层中的所有的神经元将自身的输出信号反馈给其他所有神经元作为输入。

(四)随机神经网络

随机神经网络是在神经网络中引入了随机概念,每个神经元都是按照概率的原理在工作,这样每个神经元兴奋或抑制具有随机性,其概率取决于神经元的输入值。

(五)竞争神经网络

竞争神经网络最显著的特点是它的输出神经元之间相互竞争以确定胜出者,胜出者指出哪一种原型模式最能代表输入模式。

二、神经网络的学习

神经网络的学习又被称为训练,所指的是通过神经网络所在外界环境的刺激下调整神经网络的参数,使得神经网络以一种调整好的方式对外部环境做出反应的过程。从环境中学习和在学习中提高自身性能是神经网络最有意义的特征了。

学习方式可分为:有师学习和无师学习。有师学习又称为有监督学习,在学习时需要给出指导信号(又可称为期望输出或者响应)。神经网络对外部环境是未知的,但可以将指导信号看作对外部环境的了解,由输入―输出样本集合来表示。指导信号或期望输出代表了神经网络执行情况的最佳结果,即对于网络输入调整网络参数,使得网络输出逼近期望的输出值。无师学习包括强化学习与无监督学习(可以被称为自组织学习)。在强化学习中,对输出的学习是通过与外界环境的连续作用最小化完成的。

三、BP神经网络

BP(Back Propagation)神经网络,就是指包含信息正向传播和误差反向传播算法的学习过程。输入层的每一个神经元负责接收来自外界的输入信息,并传递给中间层中的每一个神经元;中间层的各个神经元是内部信息处理层,负责信息变换,可以设计为单隐层或者多隐层结构;最后隐含层传递到输出层的信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不相符时,进入误差的反向传播阶段。误差通过输出层作用于输入层,按误差梯度下降的方式分别修正各层权值,逐渐向隐含层和输入层反传。多次的经过信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也就是神经网络学习训练的过程,此过程一直进行到网络的输出误差减少到可以被接受的程度,或者达到预先设定的学习次数才会停止。

四、实验过程及结果

本文中假设已经用奇异值分解得到人脸特征点的数据,每个人脸划分为五部分,每部分又得到5个特征值,所以也就是25个的特征值。本文采集了50个人人脸,每人采集10张不同姿态下的照片,也就是500张照片,对这些照片进行人脸检测并进行奇异值分解,得到每张照片对应的25个特征值,从每人10张照片中随机抽出5张用于训练出不同的姿态下的人脸,另外的5张用作测试样本。

(一)实验过程

由于数据过长,本文只以2个人,每人2张照片作为的训练样本数据为例来说明。

第一步:训练样本(每人25个特征值),在p是一个25行,4列的矩阵,每一列代表一个人的25个特征值,属于一个样本;列数4表示样本总数;

p=[ 7.4264 9.0728 7.9825 9.5632;

7.5719 7.8115 6.5564 7.8561;

12.8074 12.7073 12.4536 11.5423;

9.0284 10.3744 8.7569 9.9965;

7.0083 9.0284 7.1254 8.8876;

1.2597 2.1578 1.3556 3.0112;

0.6896 0.7835 0.7859 0.9658;

0.7814 0.8818 0.7568 0.8213;

1.0248 1.6783 1.1542 1.5234;

1.0112 1.0248 0.9568 0.9652;

1.0427 1.0813 1.0425 0.9568;

0.5970 0.5886 0.5968 0.5889;

0.4928 0.5969 0.3569 0.6012;

0.6438 0.6417 0.6589 0.5612;

0.3563 0.6438 0.2534 0.6689;

0.4474 0.4235 0.4568 0.4236;

0.2483 0.2282 0.2253 0.2259;

0.3633 0.4616 0.3102 0.4556;

0.3383 0.4167 0.3561 0.3456;

0.3130 0.3383 0.3302 0.3359;

0.3378 0.3313 0.3219 0.3569;

0.1916 0.1767 0.1564 0.1952;

0.2356 0.3422 0.2355 0.3012;

0.2088 0.3268 0.1958 0.3568;

0.1858 0.2088 0.0956 0.1968;];

第二步:目标输出矩阵

因为就两个人,所以采用一位二进制编码就可以,在这里定义第一类样本的编码为0;第二类样本的输出编码为1。

t=[0 1 0 1];

第三步:使用MATLAB建立网络结构

net1=newff(minmax(p),[25,9,1],{'tansig','tansig','hardlim'},'traingdm');

说明:[25,10,1]表示该网络的输入结点为25个值,输出结果为1为二进制编码的值,中间层由经验公式 (rnd为0-1之间的随机数),所以本文选取5-15之间数分别作为隐含层的神经元个数,得出的结论是9的收敛速度最快。

第四步:对网络进行训练

[net1,tr]=train(net1,p,t);

第五步:保存网络

save aa net1

则文件会以aa.mat的格式保存,保存了训练好的网络以及权值。

第六步:输入测试样本

先加载上一步中保存好的网络,本实验中只输入一个测试样本,下面的数据代表测试样本的特征值,共25个。

load aa.mat

p1=[7.8115;0.7835;0.5886;0.2282;0.1767;1.0197;0.7896;0.6814;1.1238;1.1114;0.9427;0.5970;0.4569;0.5438;0.4563;0.1983;0.4632;0.3383;0.3130;0.4377;0.1817;0.2256;0.2088;0.2854;0.2812];

第六步:网络仿真

a=hardlim(sim(net1,p1)-0.5)

(二)实验结果

根据上述实验过程,得出的结果是:

下图是执行了10次中的一次算法模拟情况。

Elapsed time is 0.469seconds

网络仿真的输出结果是:a=0

本文中测试的数据来源于训练样本中输出为0的样本,识别结果正确。换了10个测试样本,其中识别正确的是6个,也就是正确率大约在60%。

然后,采用相同的办法,在实验中把训练样本由每人两个不同姿态下的样本增加到了3个,也就是输入向量的p由4列增加到6列,其他的均不变,网络的训练时间为0.471 seconds。还是使用上面的10个测试样本,其中识别正确的达到了8个,正确率提高到了80%左右。

在样本量扩大到250时,这些样本是来自于,50个人,每人拍摄10张不同姿态下的照片,也就是500张,然后从其中随机的取出每个人对应的5张照片作为训练样本,然后再把从剩余的250张作为测试样本,进行测试。输入结点数为250,每个结点对应的特征向量为25;输出值用二进制的编码表示,由于后面要实现的人脸识别系统中要应用在一个只有50人的环境下,所以采用二进制编码6位就够了,但是为了系统的可扩展性,所以采用7位二进制编码来设计输出结点的值,bp网络就是25维输出7维输出。此时测试的250个数据中只有一组数据是错误的,原因是照片中的人嘴和鼻子被口罩遮住了。

样本量增加后网络训练到一个样本测试仿真所有的时间是1.936seconds。

五、小结

本文介绍了基于BP神经网络的人脸识别分类方法,先用matlab设计了一个模拟程序,然后不断的增加训练样本中同一人样本的样本数,训练后用10个人分别测试两个网络的正确率,当同一人的样本数增加到3时,正确率由60%提高到了80%。可以证明网络训练样本的增加有利于提高识别的正确率。把在上一章中采集到的50个人所对应的500张照片作为标准样本库,从中随机取出250张作为训练样本,然后设定输出值,输出的值应该有50类,采用二进制的编码构成,然后再实用剩余的250张照片作为测试样本,进行测试。

实验后的得出的结论是当训练样本数增加到5个时,测试数据才没有遮挡的情况下,可以达到100%的正确识别率。

神经网络反向传播原理篇7

【关键字】 灰色理论 BP神经网络 预测模型

一、引言

随着大数据时代的到来,BP神经网络预测模型已成为学术界研究的热点,并应用到多领域中。BP神经网络具有很好的非线性逼近以及自学习的能力,可高精度拟合预测值,但是,由于很多系统存在不确定性,传统的BP神经网络将原始时间序列直接作为输入值,而原始时间序列中具有很大的随机性和不确定性,使得神经网络在预测结果中,存在较大偏差。解决此问题的有效方法是将原始时间序列经过灰色理论进行白化处理,过滤掉数列中的不确定性和随机性等灰色特性,再将白化处理后的结果作为BP神经网络的输入。

二、灰色预测理论研究

根据研究对象的特性可将其分为白、灰、黑三类,该分类取决于研究者对系统信息的掌握程度,是基于认识程度而言,具有相对性。其中白色系统信息完全明确,黑色系统信息完全缺乏,而灰色系统是介于白色系统和黑色系统之间,其信息具有不充分、不完全的特性。灰色预测为灰色系统最典型的应用,在样本数据量较少、预测结果具有一定的随机性时,灰色理论是应用最为广泛的,克服了系统周期短和数据不足的矛盾。对于样本少、贫信息的不确定性系统[1]而言,由于原始数据毫无规律可循,因此灰色理论首先将原始时间序列进行累加,使其具有递增规律,然后对其进行拟合,最终将累加数据进行还原。其具体原理如下所示:设原始时间序列为累加为时间序列为,累加后是单调不减时间序列,可见,一般累加可将非负的任意无规律数列转换为单调不减数列。根据该时间序列,建立白化方程并得到方程的解。所得即为的估计值,但是由原始数列累加变换所得,因此,还需对估计值进行累减处理,最终即为所求预测值。

三、BP神经网络理论研究

BP神经网络是一种具有连续传递函数的前馈神经网络,其训练方法是误差反向传播算法,常用的为梯度下降法[2]。以均方误差最小化为目标不断修改网络权值和阈值,最终能高精度地拟合数据。BP神经网络模型结构分为三层,第一层为输入层,输入值为预测系统的主要影响因素的定量值;第二层为隐含层,每个神经网络模型至少包含一个隐含层,为了计算方便,本论文中采用一个隐含层进行预测;第三层为输出层,输出即为系统的预测结果,输出可为一个或多个,本文采用一个输出模式。设输入层的输入值为,隐含层的神经元值为,输出层的神经元值为。输入层神经元与隐含层神经元的权值为,隐含层神经元与输出层神经元的权值为。隐含层神经元的阈值为,激发函数为,输出层神经元的阈值为,激发函数为。在神经网络进行训练时,分为两个方向:信息正向传递和误差反向传播。在信息正向传递的过程中,隐含层每个神经元通过该神经元的阈值、其与输入层各神经元的权值及输入层各神经元本身的值的结合,在本层激励函数的作用下取得。神经网络经过以上的正向信息传递,将M维向量的N个样本数据作为输入,计算出隐含层神经元的值,最后计算出实际输出值。利用其与期望输出值T可计算出均方误差。将所得MSE沿原来正向信息传递的路径逐层反向传递,依据输出的MSE计算出各层的,并将作为依据,更新各连接的阈值和权值,此时误差反向传递完毕。网络模型反复进行信息正向传递和误差反向传递着两个过程,直到MSE达到标准或小于标准ε。

四、灰色神经网络预测模型的建立

由于灰色系统具有明显的不确定性,因此用灰色模型先将原始输入数据进行累加,使其具有明显的指数特性,并对其进行白化即用微分方程对其进行拟合预测。对于有N个参数的灰色神经网络的微分方程为:

其中,xi(1)(i=2,3,...,N)为系统输入值,xi(1)为系统输出值。记微分方程系数为

将GM(1,N)的输出值作为神经网络的输入值,即可得到灰色神经网络模型。

总结和展望:由于现实世界中的系统很多属于灰色系统,在对未来数据的预测过程中,仅凭传统的BP神经网络预测存在很大的偏差。而本文提出的灰色神经网络预测模型可以有效地过滤系统中的灰色特性,并充分发挥灰色理论和BP神经网络各自的优势,二者取长补短,使得最终对灰色系统的预测更加准确。但值得注意的是在神经网络预测的过程中,采用的梯度下降法只能找到局部最有值[3],无法准确获取全局最优。可在以后的预测模型研究中考虑加入遗传算法等对此模型进行优化。

参 考 文 献

[1] 刘金英. 灰色预测理论与评价方法在水环境中的应用研究[D].吉林大学,2004.

[2] 汪镭. 人工神经网络理论在控制领域中的应用综述[J]. 同济大学学报,2001-29-3:357-361.

神经网络反向传播原理篇8

【关键词】BP神经网络;房地产风险;预警模型;构建

受美国房地产次贷危机的影响,我国的上海、北京、杭州等城市近年来不同程度地出现“房地产泡沫”现象。自今年年初以来,许多大中城市的房价开始出现跌落现象,房地产空置率上扬,融资渠道阻塞,继而引发整个金融市场出现紊乱。针对房地产风险危害的严重性,越来越多的学者把目光投向金融风险预测的研究中,力求通过对金融环境早期的预测、分析、鉴定,对金融市场各因素的变化情况透析,为未来经济现象作出前景预测,有效地规避潜在的金融风险。针对房地产风险预警模型的研究,先后有房地产景气指数模型(侍得广,2004)、自回归条件异方差模型(王慧敏,1998)和自回归滑动平均模型法、基于概率模式分类法、判别分析模型,以及我们这里要阐述的人工神经网络模型等。

1神经网络模型的界定

国际著名的神经网络研究专家,第一家神经计算机公司的创立者与领导人Hecht—Nielsen给人工神经网络下的定义就是:“人工神经网络是由人工建立的以有向图为拓扑结构的动态系统,它通过对连续或断续的输入作状态相应而进行信息处理。”现代意义上对神经网络(特指人工神经网络)的研究一般认为从1943年美国芝加哥大学的生理学家W.S.McCulloch.和W.A.Pitts[1][2]提出M-P神经元模型开始,到今年已经六十多年了。自20世纪80年代以来,我国也逐渐掀起了研究神经网络的热潮,关于它的学术研究会议层出不穷。人工神经网络(ArtifialNeuralNetwork,简称ANN)又称为连接主义的人工智能或连接机制模型,是基于人们对人脑组织结构及运行机制的认识基础上所建立的仿真系统,即对自然或生物神经网络若干基本特征的模拟。人工神经网络将已观测到的数据作为输入向量,通过大量的样本模式试验该网络,从而得到不同的输出值,确定不同的输出阈值。大量样本模式试验好的神经网络即可作为一种预测工具。近年来,我国学者不断地把神经网络技术运用于经济预测和信用风险评估中,特别是对于信用风险的预测有着很好的实证研究基础,预测的精度也相对较高。由于神经网络模型可以被理解为一个多输入、单输出的非线性结构,比较适合处理房地产风险预警机制中输入数据量大、输入指标体系关联度复杂、输出表示形式单一的特点要求,因此,基于神经网络的房地产风险预警模型的研究浮出水面。

根据网络的连接结构,人们把神经网络分为前馈或前向(Feed-forward)型网络和反馈(Feedback)或回归(Recurrent)型网络。前馈型网络结构可以被理解为网络中的各个神经元接受前一层的输入,并把信息传输给下一层,即第i-1层的输出只与第i层的输入相连,输入与输出的节点与外界相连,其他中间层称为隐层。而反馈型网络的所有节点均可接受输入,并输出信息。

BP神经网络(Back-PropagationNetwork)是包含输入层、输出层和隐层的反向传播神经网络。通过反向的传播来校对预测的精确度。人们习惯上把BP神经网络称为多层神经网络,即通过多层次的连接权值修正的算法。该模型是一种多层网络的“逆推”学习算法。其基本思想是,学习过程由信号的正向传播与误差的反向传播两个过程组成。在正向与反向的传播过程中,对各权值和阈值进行自动的修正,直至达到稳定。

2BP神经网络在房地产风险预警中的优势体现

2.1由于神经网络是由大量的神经元相连所构成的网络,因此该网络具有高速的信息处理功能;面对房地产信息数据的变化,能够较快、较准确地进行数据的输入、反馈处理,得出相应的输出信号。

2.2在信息处理过程中,神经网络具有自身的适应调节功能,此功能可以避免人为经验知识和一些规律的影响,对于人为因素作用较强的权重可以弱化并修正其产生的误差。

2.3它是一种非线性的处理单元,加之整个的网络存储信息容量巨大,其对信息的处理不需要进行事前的假设;既有不确定性信息处理功能。

2.4面对环境信息复杂、推理规则不明确以及知识背景不清晰的各种情况,神经网络有能力判别、处理复杂的非线性关系问题和连续函数。当然,也可以识别、处理并归纳出在复杂的金融危机环境下对房地产业的发展前景进行一个较为准确、客观的判断。

3基于BP神经网络的房地产风险预警模型的构建体系

3.1基于BP神经网络的房地产风险预警模型的结构。

鉴于BP模型的双向传播原理,运用于房地产的预警机制中,要首先保证正向传播与反向传播的正常运行。首先,在正向输入过程中,要确认BP模型的输入指标。所采用的指标均能直接或间接地反映出房地产业的发展现状,并且指标的变化趋势能预测房地产业的发展前景。通过设置的网络结构和前一次迭代的权值和阈值从网络的输入层相后续的隐层及输出层输出。其次,在隐层的设置中,原则上具有足够多的隐含层能使可测函数更逼近真实。但是,对“足够多”具体定义为多少,这个还很难确定。对于比较复杂的非线性逼近问题,通常采用两层隐含单元的网络结构。最后,反映在输出的预警方式设置,要求预警方式简洁、明了,可以通过直观的信号反应或数据显示来表达一定的预警信息。特别需要提出的是,在输入指标确认的基础上,要进行大量的数据取证,以确定不同指标的权值。当然,权值的最终确定还需要BP模型的反向修正过程,不断地对权值和阈值进行修改,从最后一层向前计算设置的各权值对总误差的影响,以此作为修正的依据。最终在两个过程反复交替不断修正中误差达到最小化,权值和阈值也得到最终的确定。

3.2基于BP神经网络的房地产风险预警模型的输入指标确定。

在我国房地产发展的20多年历史中,有关房地产的统计指标虽然还存在许多不完善的地方,但进入90年代以后,反映房地产业发展的指标体系越来越完善。商品住宅销售面积、竣工面积、销售价格等指标建立起来了,同时,人均居住面积、非农业人口比重、城市人均可支配收入等指标也反映出房地产业的发展情况。除此之外,房地产开发投资金额、商品房施工、竣工、销售、空置面积等均对房地产的未来发展前景产生影响,也是其预警模型中重要的输入指标。有数据显示,随着本次金融危机的渗透,我国商品房空置面积已达到1.36亿平方米,同比增长15.3%,增幅比1-10月提高2.2个百分点。其中,空置商品住宅7084万平方米,同比增长22.9%。显而易见,商品房的空置面积也是房地产金融预警模型中必不可少的指标之一。

此外,地产公司的资金流信息也是我们关注的热点。有数据显示,当前地产公司普遍面临经营性现金流持续恶化和财务费用上升等问题。统计显示,2008年前三季度,86家房地产公司经营活动产生的现金流量净额为-371.87亿元;而前年同期,这一指标是-228.85亿元,同比减少143亿元。同时,2008年三季度,主流地产公司平均短期资金剩余为1.82亿元,而2007年三季度为18.41亿元;平均长期资金剩余为-35.91亿元,2007年三季度为-13.78亿元,可见,受金融危机的影响,地产公司长期与短期资金剩余都大幅度减少。

房地产业的资金来源情况直接影响其经营状况。据报道,2007年万科、保利、招商等13家开发商利用资产价格上涨之机从银行取得借款637亿元,增发融资196亿元。两项合计,13家开发商共圈钱833亿元,资产负债率呈现上升趋势。在如此高的资产负债率运营机制下,一旦开发商的资金链得不到充足的保证,必然会对房地产业造成极大的潜在危机。

综合上述,房地产金融预警模型指标主要包括三部分内容。其一,主要涉及地产业资金经营状况指标,包括企业的资产负债率指标、现金流指标、企业利润总额等指标。其二,主要涉及地产信息及大众购买需求情况,包括商品房销售面积、竣工面积、销售价格等指标;人均居住面积、城市人均可支配面积等指标。其三,主要涉及地产业与国民生产总值之间的比较,也就是更直观地反映地产业在当前经济环境中的地位和作用,包括地产业增加值与增加值占GDP比重、房地产增加值的增长速度指标、商品房投资额与GDP值相关系数指标等。

3.3基于BP神经网络的房地产风险预警模型的预警表示方法。

由于房地产预警系统的研究还处于初级阶段,对于警戒区间的界定还没有出台一个完善的方案。这里我们可以借鉴叶剑平、谢经荣主编的《房地产业与社会经济协调发展研究》中所介绍的系统化方法,引入多数原则、半数原则、少数原则、均数原则、人数原则和负数原则。由此,为了更直观地反映出预警的信号指示,我们把房地产预警模型的预警信号指示中增设了多个临界值。本房地产预警模型共设立四个临界值,分别为0、33%、50%、67%和85%,并赋予它们相对应的输出变量,即0、1、2、3、4。

通过此房地产预警模型所显示的不同输出变量,我们可以清晰地预测房地产的风险情况。当输出变量小于等于零时,则说明房地产业经营状况正常;如果输出变量介于零到1(含)之间,说明此时的房地产业经营状况出现波动;如果输出变量介于1到2(含)之间,说明房地产业出现轻度的金融风险;如果输出变量介于2到3(含)之间,说明房地产业存在中度风险;如果输出变量大于3,此时的房地产金融风险为重度险情,需要格外的关注。

4基于BP神经网络的房地产预警模型的未来拓展方向

在基于BP神经网络的房地产风险预警模型的构建中,我们不难发现,由于模型中变量太多,相关函数的确立相对复杂,都在不同程度上影响模型预警的精确度。当模型的影响因素较多且较模糊,或难以用复杂的函数式精确地预测结果时,由美国自动控制专家L.A.Zadeh提出的“模糊”理论将有可能作为BP神经网络模型的后续发展领域。

模糊控制理论是一种非线性的、智能控制理论。它的特点是擅长处理模糊信息和模糊变量,经过模糊逻辑处理,使控制器能够根据人的直觉和经验,得到控制结果。我们可以想象,人们是通过各种感官系统对外界的信息做出模糊的判断,并对判断的结果做出“好”、“坏”、“高”、“低”、“冷”、“热”等模糊的结论。也就是说人们通过已有的经验知识,对一些模糊的信息进行分析判断,从而完成模糊的结论,最后,人们又将模糊的结论转化为具体的控制信号,以完成当前具体的控制任务。这也就是模糊控制理论的基本操作思路。

模糊控制理论的引入对当前所建立的基于BP神经网络的房地产风险预警模型具有两大明显的改进:其一是模糊控制理论在没有精确的函数模型情况即可实现人工智能化的模糊控制,其输出的表达方式简单明了;其二是该控制理论不易受参数的变化而变化。针对基于BP神经网络的房地产风险预警模型数学模型难以获取、房地产动态特性不易掌握的特点,引入模糊控制理论将很好地规避以上缺点。

该系统有多种传感器,根据检测到的人均住房需求量、房地产价格、房地产销售收入和国内生产总值等,通过模糊脱离进一步决定预警的时间、方式和强度等。显然,此系统是一个多输入多输出的控制系统。

当然,模糊控制理论也有对房地产预警模型难于操纵的一面。模糊控制理论对操作人员的控制经验和相关知识要求较高;模糊控制中的稳定性问题还没有很好的解决途径。

5结束语

随着BP神经网络在实证领域研究的不断深入,基于BP神经网络的房地产风险预警模型的构建将从理论走向实践,真正对房地产金融风险起到预警作用。当然而该模型的构建还存在有若干有待完善的地方:需要修正的时间较长;模型中各输入指标权值的调整容易受阻;在正向与反向的训练过程中,由于该网络误差函数为多维空间的曲面,其底部是最小值点,以致于使训练无法逃出这一局部极小值。但是,不管怎样,基于BP神经网络的房地产预警模型必然会以它不可阻挡的优势在实践领域得到运用与完善。

参考文献

[1]许力.智能控制与智能系统[M].北京:机械工业出版社,2007.2

[2]焦扬等.BP神经网络模型的预测精度分析[J].

[3]谭刚.房地产的周期波动与景气指标[J].住宅与房地产,1996(12)

[4]陈万铭.关于建立房地产金融风险宏观监控指标体系的思考[J].中国房地产金融,2004(2)

上一篇:农村房屋现代设计范文 下一篇:保险公司合规知识培训范文