反向传播神经网络基本原理范文

时间:2023-10-30 11:27:18

反向传播神经网络基本原理

反向传播神经网络基本原理篇1

关键词 BP神经网络 数据挖掘 最速下降法 函数逼近 模式识别

中图分类号:TP391 文献标识码:A

1研究背景

BP神经网络是一种多层的前馈网络而且它的学习算法是一种误差逆向传播算法。BP神经网络是目前研究最为成熟、应用最为广泛的人工神经网络模型之一。由于其结构简单、可操作性强、具有较好的自学习能力、能够有效地解决非线性目标函数的逼近问题等优点,因此被广泛应用于自动控制、模式识别、图像识别、信号处理、预测、函数拟合、系统仿真等学科和领域中。

2 BP神经网络原理

2.1概述

BP神经网络是一种反向传播误差算法然后训练的一个多层前馈网络,简称为BP算法,它应用在已被开发出来的神经网络中,到目前为止是应用最为广泛的网络模型之一。BP神经网络可以学习并且存储非常多的输入模式与输出模式之间的映射关系,却无需在学习和存储前事先揭示并描述输入输出间的映射关系的一种数学方程。它使用最速下降法,通过对输出误差的反向传播,获得不断调整网络连接权系数和阈值的信息,最终使神经网络的平方误差最小,达到期望要求。

2.2 BP神经网络结构

BP神经网络模型是一个三层网络,它的拓扑结构可被划分为:输入层、输出层、隐含层。其中输入层与输出层具有更重要的意义,因此它也可以为两层网络结构(把隐含层划入输入层或者把隐含层去掉)。每层都由许多简单的能够执行并行运算的神经元组成,这些神经元与生物系统中的那些神经元非常类似,但其并行性并没有生物神经元的并行性高。BP神经网络是一个前馈网络,因此它具有前馈网络所具有的特性:相邻两层之间的全部神经元进行互相连接,而处于同一层的神经元不能进行联接。

2.3 BP算法原理

BP神经网络的基本原理是把一个输入矢量经过隐含层的一系列变换,然后得到一个输出矢量,从而实现输入数据与输出数据间的一个映射关系。输入信息的正向传播,以及输出误差的反向传播,构成了 BP网络的信息循环。BP算法根据输出误差来修改各神经元连接的连接权系数,其目的是使输出误差达到预计范围内。BP网络需要实际输出与期望输出之间的误差来确定是否要修改神经元连接的连接权系数。其中,期望输出便是该网络意义上的“导师”。BP网络具有对称性的网络结构,在输出端的每一个处理单元基本上都具有一个相同的激励函数。

BP算法由正向传播和反向传播两部分组成。在正向传播过程中,输入信息从输入层经隐层单元处理后,传至输出层。每一层神经元的状态只影响下一层神经元的状态。如果在输出层得不到期望输出,就转为反向传播,即:把误差信号沿连接路径返回,并通过修改各层神经元之间的连接权值,使误差信号最小。

具体的算法步骤可概括如下:

第一步,选取初始权值、阈值。

第二步,重复下述过程直至满足性能要求为止:

(1)对于学习样本P=1到N

①计算每层各节点j的输出yj,netj和的值(正向过程);

②对各层从M层到第二层,对每层各节点反向计算%]j(反向过程);

(2)修改权值

具体推导过程见参考文献4。

3基于BP神经网络设计的实例

3.1函数逼近

我们设计一个简单的BP网络,实现对非线性函数的逼近。通过改变该函数的参数以及BP网络隐层神经元的数目,来观察训练时间以及训练误差的变化时间。将要逼近的非线性函数设为正弦函数,其频率参数k可以调节。假设频率参数k=2,绘制此函数的曲线。如图1。

(1)网络建立:用MATLAB编程建立BP网络结构,为二层BP神经网络。隐层神经元数目n 可以改变,暂时设为n=10,输出层有一个神经元。网络训练采用Levenberg-Marquardt算法trainlm。

分析:因为建立网络时,权值和阈值的初始化是随机的,所以网络输出结果很差,根本达不到函数逼近的目的,并且每次运行的结果也有所不同。

(2)网络训练:在MATLAB里应用train()函数对网络进行训练之前,需要预先设置训练参数。将训练时间设置为50,训练精度设置为0.01,其余参数用默认值。

(3)网络测试:对于训练好的网络进行仿真,绘制网络输出曲线,并与原始非线性函数曲线相比较,结果如下图2。

由此可看出,得到的曲线和原始的非线性函数曲线很接近。这说明经过训练后,BP网络对非线性函数的逼近效果非常好。

(4)讨论分析:改变非线性函数的频率和BP网络隐层神经元的数目,对于函数逼近的效果有一定的影响。网络非线性程度越高,对BP网络的要求越高,则相同的网络逼近效果要差一些;隐性神经元的数目对于网络逼近效果也有一定的影响,一般来说隐形神经元数目越多,则BP网络逼近非线性函数的能力越强,同时网络训练所用的时间相对来说也要长一些。

参考文献

[1] 闫志忠.BP神经网络模型的改进及其应用研究[D].吉林大学,2003.

[2] 李友坤.BP神经网络的研究分析及改进应用[D].安徽理工大学,2012.

[3] 吴昌友.神经网络的研究及应用[D].东北农业大学, 2007.

[4] 贺清碧.BP神经网络及应用研究[D].重庆交通学院 重庆交通大学,2004.

反向传播神经网络基本原理篇2

关键词:BP神经网络 卡尔曼滤波 数据融合

一、引言

数据融合是指对来自多个传感器的信息进行融合,也可以将来自多个传感器的信息和人机界面的观测事实进行信息融(这种融合通常是决策级融合)。提取征兆信息,在推理机作用下.将征兆与知识库中的知识匹配,做出故障诊断决策,提供给用户。在基于信息融合的故障诊断系统中可以加入自学习模块.故障决策经自学习模块反馈给知识库.并对相应的置信度因子进行修改,更新知识库。同时.自学习模块能根据知识库中的知识和用户对系统提问的动态应答进行推理。以获得新知识。总结新经验,不断扩充知识库,实现专家系统的自学习功能。

多传感器数据融合是20世纪70年代以来发展起来的一门新兴边缘学科,目前已经成为备受人们关注的热门领域。多传感器数据融合是一门新兴技术,在军事和非军事领域中都碍到了广泛应用、多传感器数据融合技术汲取了人工智能、模式识别、统计估计等多门学科的相关技术,计算机技术的快速发展以及数据融合技术的成熟为数据融合的广泛应用提供了基础。

多传感器信息融合状态估计是多传感器信息融合学科的一个重要分支。多传感器数据融合的基本原理就像是人脑综合处理信息的过程一样,它充分利用多个传感器资源,通过对各种传感器及其观测信息的合理支配与使用,将各传感器在空间和时间上的互补与冗余信息依据某种优化准则组合起来,产生对观测环境的一致性解释和描述。目前有两种常用的信息融合方法:一种方法是状态融合方法,另一种方法是观测融合方法。状态融合方法又可分为集中式kalman滤波[1]和分散式kalman滤波。集中式kalman滤波虽然在理论上可获得全局最优融合状态估计,但这种方法计算量大,且容错性能差,而分散式kalman滤波信息融合能克服这些缺点,但这种方法是局部最优的,因此基于此思想我们可以利用BP神经网络来提高融合精度。

BP(Back Propagation)神经网络[2],即误差反传误差反向传播算法的学习过程,由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。

BP神经网络是模拟人脑的信息处理机制而构造出来的一种并行信息处理模型,它有分布式存储和联想记忆功能,具有较强的自适应性和自组织性,具有任意的非线性映射能力,能被用来对两个估计模型的输出结果进行有效的分析和综合,提高估计的精度和可靠性。

二、模型描述

带有观测噪声的三传感器雷达跟踪系统:

状态 , ,和分别为在时刻 处运动目标的位置、速度和加速度, 为第 个传感器对位置的观测,为与 相关的白噪声。

kalman滤波按矩阵加权融合准则算法是基于L个传感器观测已知它的 L个无偏估计 ,即,

设已知估计误差 的方差阵和协方差阵 ,,, ,其中E为均值号,T为转置号,问题是寻求X的按矩阵加权无偏融合估计, ,

其中加权阵 为 矩阵,在线性最小方差意义下,应选择加权阵极小化融合估计误差的分量均方和J,,

它等价于

按矩阵加权融合准则算法既是对L个传感器经kalman滤波器得到的状态求得加权矩阵 使得性能指标J最小。

基于加权思想,对以上的三传感器雷达跟踪模型建立BP神经网络,三传感器的输出作为网络的输入,网络的输出与模型的状态数据比较后反向传播对各层神经元权值进行修改,直到输出层与模型状态的误差达到期望误差。由于本次实验模型简单,对其采用两层BP网络,隐层神经元采用Sigmoid型激活函数,输出层采用线性激活函数。在使用网络前需要对网络进行训练,本次实验设置训练时间为50个单位时间,训练目标设置为误差小于0.2。

三、仿真分析

以下给出个状态在各种方法下的仿真结果:

图1、图2为三个传感器的测量值经kalman平滑器估计后的的状态1经BP神经网络融合后的值和理想状态的对比图。从图中可以看出经神经网络融合后对状态1的估计精度有了进一步的提高。而且训练速度也非常迅速,大约10步左右就能达到要求的误差。

图3、图4为三个传感器的测量值经kalman平滑器估计后的的状态2经BP神经网络融合后的值和理想状态的对比图。从图中可以看出经神经网络融合后对状态2的估计精度有了进一步的提高。而且训练速度也非常迅速,大约20步左右就能达到要求的误差。

图5为比较加权融合后的稳态误差方差阵的迹和三个传感器的稳态平滑误差方差阵的迹,可以明显看出经融合后的精度明显高于局部平滑的精度。由于设置的神经网络的误差目标为0.2,通过训练后目标误差能达到要求,因此经神经网络融合后的状态估计精度要大大高于经加权矩阵融合估计的精度。

四、结论

本文利用BP神经网络对来自经不同噪声污染的传感器的测量信息进行处理,完成机动检测,并与卡尔曼滤波器相结合构成一个性估计器,对目标进行估计。这种估计方案可以利用神经网络的函数逼近能力对来自各传感器的充信息加以充分利用,在改善估计性能的同时又保持估计滤波的计算结构尽可能简单。

参考文献:

[1]邓自立. 最优估计理论及其应用――建模、滤波、信息融合估计.

[2]杨行峻、郑君里. 人工神经网络与盲信号处理.

[3]matlab7.0辅助神经网络分析与设计.

反向传播神经网络基本原理篇3

关键词:神经网络法 测井资料 变质岩 岩性识别

中图分类号:P631.84 文献标识码:A 文章编号:1672-3791(2013)02(b)-0096-01

测井在石油勘探中的作用和地位正在日益提高,测井参数值的差异主要取决于岩性。由于井下地质构造的复杂性和测井参数分布的模糊性,对于一组特定的测井参数值,它就必然对应着地层中的某一种或某几种岩性。以往常用的人工解释方法大多依赖于人的经验,难以准确地反映测井资料与地层岩性的非线性映射关系,识别精度有限[1]。本文在总结前人利用神经网络进行火成岩、沉积岩以及碳酸盐岩的岩性识别基础上,分析岩心和测井参数对应特征的基础上,从各类岩石中读取能够代表岩样的测井参数值,确定岩性与测井参数对应关系[2],利用神经网络方法来对变质岩进行岩性识别。

1 神经网络方法

(1)神经网络方法处理测井解释的原理。神经网络的处理单元是与大脑中神经细胞结构相类似的节点,这些节点通过不同强度相互连接起来。每个神经元操作时,都对输入信号乘以一个权值,再对加权后的输入求和。神经网络岩性识别模型是利用岩心分析资料和测井响应值,选择神经网络训练样本,经网络设计、网络学习、训练得到识别岩性的神经网络模型,然后利用网络模型来根据测井曲线识别岩性。

(2)神经网络结构的设计。在现有神经网络学习算法中,误差反向传播 (Back—Propagation)[3]是目前使用最为广泛的神经网络模型,它因通过网络反向传播误差而得名。反向传播由两步组成:信息前馈和误差反向传播。其实质就是调节各层的权值使网络学会并记忆住学习样本集。训练过程由正向过程(计算节点误差)和反向过程(调整连接权值)两部分组成。本文所用的网络由输入层、一个隐层和输出层组成。

选择一定测井曲线形态特征,作为输入向量,并用与此对应的岩性作为输出向量,组成训练对。多个训练对组成样本集,建立起一系列与实际地质状况相对应的测井相特征。可见,神经网络是一个非线性系统,它可以把具有i个分量的输入量(如测井曲线)转换成一个具有k个分量的输出矢量(如岩性)。网络经训练好后,可以用来根据其他地层信息曲线确定岩性。

应用实例如下。

本次研究选择了辽河油田几口取心井的补偿中子(CNL)、补偿密度(DEN)和(DWSI)4条测井曲线作为研究对象,建立一个4×4×3的网络,输入为DEN、CNL和DWSI等测井曲线的特征值,输出为混合花岗岩、混合片麻岩和角闪岩的岩性。

为了验证所建立模型的正确性,选择了另外6个已知岩性的样本作为训练好的神经网络的测试数据,识别结果见表2。根据变质岩岩性识别结果的统计可知,样本实际岩性与期望输出值完全一致,准确率为100%。

2 结论

由验证结果分析,神经网络来进行变质岩测井岩性识别,方法简单易操作,准确率高。相比于其他传统的岩性识别方法,神经网络方法是以自身特有的样本学习能力获得识别模式,从而克服了模糊数学法、灰色聚类法和多元统计法的缺陷。这为测井资料地质解释提供了一个全新的方法,对于探寻和鉴别含油气地产的精确性,在油气资源开发领域具有实用意义。

参考文献

[1] 赵杰,李春华.基于神经网络的两种岩性识别方法的研究[J].科学计算与信息处理,2009,309:138~140.

[2] 于代国,孙建孟,王焕增,等.测井识别岩性新方法——支持向量机方法[J].大庆石油地质与开发,2005,24(2):93-95.

反向传播神经网络基本原理篇4

关键词:网络传播文化转向 选择性坼裂 身体乌托邦 精英意识 大众立场

作者欧阳友权,中南大学文学院院长、教授、博士生导师、网络文学研究基地首席专家。(长沙:410083)

所谓文化转向,是指文化发展方向出现了异于既有文化逻辑的预设道路,别开生面地创生一种新的文化理念和文化形态。从网络传播的角度看,文化转向是网络传媒形成的对于文化发展内容及其方向的影响,这种影响将深刻地改变既有的文化格局,重绘这个时代新的文化地图。

选择性坼裂:从现代走向后现代

虽然我们不能简单地说,诞生于后现代文化空间中的网络传播就必然具备后现代文化气质,进而天然传播后现代文化精神,但网络传播之所以成为促进现代文化转向后现代文化的主要动力,的确与网络传播自身拥有的特征密切相关。

与传统传播方式相比,网络传播第一个突出的特征是交互性,以此打破了传统传播的单向性;第二是多元性,它可以让多种声音共享一个Internet平台;第三是价值中立性,即多元主体的交流与兼容,造就了多元观念的冲撞和相互承认局面;第四是自主性,传播主体的自由选择强化了主体的自控机制和自主决策能力;第五是个体性,网络空间的自由选择加剧了大众的分化,无数个体组成了网络“蛛网覆盖”的无穷节点。从网络传播的诸种特征看,这似乎是一个有利于自由和民主实现的理想空间,是一个人类长久企盼的文化乌托邦。然而,文化的发展道路从来没有这般平坦,文化的复杂性就在于它总是和它的对立面相伴相生,从而给人们提供更多的困惑而不是最终解决方案。从交互性中我们看到了即时满足带来的理性监督空缺;从多元性中我们看到了伦理价值及其判断的失准失依;从价值中立中我们看到了文化的虚无主义深渊;从自主性中我们看到了对一切合法权威的拒绝和摒弃;从个体性中我们看到的则可能是公共意识的消解……网络传播与其说在传播某种确切无疑的文化信念,不如说是在传播人类长久的文化疑惑,一个个潜隐在传统理论体系和冥想深处的质疑变成了公开张扬的文化现实问题。网络传播中存在的文化症候似乎正是后现代文化存在的基本特征。加拿大后现代主义学者琳达,哈琴就曾指出:“后现代主义是一个既使用又滥用、既设置又、向埋藏于建筑学、文学、绘画、雕塑、电影、录像、舞蹈、电视、音乐、哲学、美学理论、精神分析、语言学或史学中的诸种纯粹观念发起挑战的矛盾现象。”伊格尔顿也曾针对后现代性问题写道:后现代性是一种思想风格,它质疑客观真理、理性、同一性和客观性这样的经典概念,质疑普遍进步或人类解放,不信任何单一的理论框架、大叙事或终极性解释。与这些启蒙时代的规范相左,后现代性认为世界充满偶然性、没有一个坚实的基础,是多样化、不稳定的;在它看来,这个世界没有一个预定的蓝图,而是由许许多多彼此不相连的文化系统和解释系统组成……

伊格尔顿的话正是网络传播中文化裂变表征的阐释,矛盾、困惑和相对主义精神似乎已是网络传播和后现代文化不可摆脱的文化标签,而其根由则是由现代文化产生和导致的。尽管关于现代文化失落和颓败的复杂原因人们总是众说纷纭,但基本上较为公认的说法是,两次世界大战,尤其是二战所引发的对于理性及其社会机制的彻底怀疑是导致现代文化被反思乃至最终遭到背弃的根本原因。因为战争的空前残忍与邪恶,战前、战后暴露的工业社会逻辑及其解决之道的匮乏无力,使人们不得不怀疑从来都被奉为至上的理性(人文和技术)是否[!]拥有人们赋予它的那种神圣能力,理性及其文化制度乃至在理性文化体制中发展成熟的工业社会本身是否可以继续交给现性执掌?于是,理性的文化地基开始崩塌,并纷纷碎裂为思想的残片,漂浮在困惑弥漫的人类上空。 但后现代文化并未像以往的文化一样,沿着理性的二元对立思维路径走到非理性的道路上去对理性展开拯救行动,因为后现代在摒弃理性的同时也摒弃了非理性道路:从文化历史的角度看,理性和非理性的对证两极常常会平衡人们对于理性或非理性的质疑,因此,理性的时代主流中常常潜伏着非理性的力量,而理性的时代之后常常是非理性的拯救方案的隆重登场。正是基于理性和非理性的联体存在特征,现代文化之后的文化便不是理性和非理性二元对证之间的线性选择,而是超越二元的多元呈现。超越二元的多元呈现从概念上容易理解和把握,运用到对现实文化环境的分析却是一个艰难的课题。也就是说,当一个文化问题不能在既有的文化思维框架中继续被深度思考时,这个文化问题就变成了一个不断漂浮的文化符号,一旦这个文化符号可能指向“这”也可能指向“那”时,它可能就什么也无法指向,最终只能自我指涉。于是后现代文化抛弃现代文化的深度阐释模式、中心概念观念、确定性分析手段、严肃性话语目标乃至不断创新的思维逻辑程式后,同时也就放弃了通过深度/平面、中心/边缘、确定/漂浮、崇高/世俗等传统的文化生产方式面对自身的文化困境,它只能在深度/平面、中心/边缘、确定/漂浮、崇高/世俗之间寻求生存空间,在各种“间性”(如主体间性)杂糅的话语中悬隔文化本身,让各种话语通过“无法”达致“有法”的境界。

后现代文化何以质疑现代确定性的文化概念,形成“间性”(主体间性等)当道的文化风格?伊格尔顿指出,后现代的“物质基础”是“资本主义的新形式”,诸如瞬息万变的、非中心化的技术领域,消费社会和文化工业。这种新的物质环境造成了传统的制造业被服务业、金融业和信息产业取代,也促成了传统的以阶级为核心的政治领域向各式各样的(基于族裔、性别、社区等)“身份认同的政治”转化。伊格尔顿的阐释表明,随着“资本主义”的发展,一种固态的物质世界观丧失之后,物质世界也就从静走向了动(就像经典物理学走向了现代物理学),而动态的物质世界必然带来动态的精神世界观的确立,资本主义社会从此便建立在一个物质和精神观念双重流动的认识论系统之上。可以说,这种流动的世界观是后现代文化形成的至关重要的原因,因为没有了恒定的对象,也就没有了确定性的文化原则,也就没有了思维的二元基点可以依赖,一切事物都在动态的呈现中丧失所谓的本质和特征。理论阐释的确如此,但我们的现实问题是,究竟是哪些日常的东西直接让所 有的人感受到了这个世界的变动不居,而不仅仅是物理学家和哲学家这样一些深入物质和精神结构内部的精英分子?

要逃离理论的抽象,只能回到理论生产的空间。后现代社会常常被称为信息社会,因为后现代文化基本上是在那种不同于传统的信息生产、组织、传播和影响的社会环境中成长和发展起来的。任何文明社会均离不开信息和信息传播,何以后现代社会就能够独占“信息”语词?这固然与从来没有一个社会像信息社会那样充满巨量的信息并依赖于这种信息有关,但显然,信息社会的本质在于它改变了信息的存在和发展方式。首先,它使信息的线性存在方式发展成为立体化的网状结构——人们不仅能够通过磁带、光盘、硬盘存储信息,通过电话、传真、电视、手机等传输信息,而且可以通过计算机加工信息,人类还从来没有能够像现在这样图、文、影、音一体化地进行过信息传播;其次,它使分散孤立的信息汇集成实时交互的系统,人们可以在任何时候、以任何方式获得各种工作、教育、娱乐、消费等资源的共享,人们在全球知识、文化共享的过程中,强化人的活动功能,扩大着人的活动范围,扩展和深化人与自然界之间的关系以及人与人之间的社会联系与交往;再次,它使信息的含义空前广大,信息是知识,信息是财富,信息也是力量,信息还是一种文化,掌握信息也就等于掌握了人、社会及其通往未来的钥匙。正因为后现代社会的信息中包含着丰富的非传统语义,所以后现代文化事实上就是一种依托于新的信息传播特别是网络传播而构建起来的文化,这种文化包含着充分的信息传播特征。当我们把信息社会、后现代社会、网络传播和后现代文化联系起来时,我们会突然明白,后现代文化的转向不仅是一种文化观念、文化思维的转向,而且是一种文化生活方式的转向,这种转向根植于日常生活中人们时时接触的信息,是信息的疯狂流动让人们感受到了一个稳定世界的失去,是信息的巨量传播让人们怀疑既有价值观的局限和简陋,是信息的丰富涌现刺激了人们的多元需求和欲望,是信息的民主和共享局面让人们渴望打破一切界限进入一个后现代的文化狂欢广场……

总之,从现代向后现代的文化转向绝非后现代取代现代那么简单,那种线性的时间观正是后现代首先要抛弃的认识论。文化转向也只是意味着我们获得了一种观察文化发展的窗口。窗口总是可变的,观察的对象却从来只有一个,那就是人类自身。网络文化的现代与后现代转型与转向,正是在这个过程中悄然出现并逐渐完成的。

身体的乌托邦:从尊崇理性到张扬感性

无论是政治决策还是技术创新,无论是意识形态体系还是人们的行为方式,理性都依然是现实社会组织的文明基石和人类基本的行为准则。但在思想文化序列中,网络传播下的观念变化让理性的地位显而易见地出现下降,至少不再能起绝对支配的作用。在后现代的“五反”思想范式描述中,无论反本质主义、反权威主义、反启蒙主义,还是反本体/主体论神学、反形而上学,根本的核心都在于反对单一的理性霸权,颠覆理性对于人类行为的至高控制。历史地看,在理性的进化历程中,感性从来都被视为是一种相当原始的对象领域,是一个没有思想、逻辑、稳定性的文化半成品,如果没有理性的规约或指导,感性永远只能是原始的、粗鲁的、蒙昧的和呆滞的本能反应,因此理性对待感性及其源泉总是持忽略与遗忘的态度,甚或采用压抑和删减的手法把感性作用降到最低,感性原罪般地成为人人必欲除之而后快的“文化阑尾”。然而网络传播却砸碎了这条枷锁,释放出感性的巨大能量,张扬了感性的文化地位,从而形成第二个引人注目的文化转向——从尊崇理性走向张扬感性。

感性源自感官,感官源自身体,感性本质上就是身体所处时空的心身体验。每个身体所处的时空位置决定身体拥有不同的感受和体验,这种感受和体验是人对自身认同的重要源泉。正因为如此,后现代的理论家像巴特、布迪厄、巴赫金、福柯都强调身体的理论意义和价值,把它和阶级、党派、主体、权力、社会关系、文化暴力、意识形态、美学和生产方式等范畴相提并论,伊格尔顿甚至宣称:“对身体的重要性的重新发现已成为新近的激进思想所取得的最重要的成果之一”。事实正是这样,读不懂身体文化学,也就很难读懂巴特和福柯,也很难理解后现代语境中的网络文化转向。网络时代的身体文化学,或者说身体的政治学,是从“身体化”和“非身体化”两个相互关联的概念出发阐述身体的文化价值的。首先,“身体化”是工业技术革命的结果,技术正在把人类身体的模拟物呈现为日益复杂的应用工具并放置到社会空间,用电子机械的强大功能来塑造、挤压人的性情、心味和能力,造成对人自身身体的侵犯和遮蔽。“身体化”的机器政治学告诉我们,我们必须回到自身粗糙的感官,进入活生生的感性经验,才能为日益增多的非人的机器身体增添生命的灵气,否则,机械真的会取代人成为地球和生命的主宰。其次,“非身体化”是技术规范约束身体的后果,工业流水线、钢筋水泥标准、商品行销逻辑、直线加方块的都市格局、各种科学的规范和族群管理制度等等,无时不在磨灭身体的原始锐气,使身体屈从于体外逻辑,变自己的身体为异己的身体,最终形成只能通过出售身体达到满足身体的怪异逻辑。比如无数人都在经历的日常生活行程——“工作—休闲一更多的工作一更多的休闲”就典型代表了身体的尴尬体验,身体无论是在工作场所还是在休闲状态都只是一个“不在的在”,一个空洞的能指符号,其自身不仅是被遮蔽的,也是被悬置的。

总之,“身体化”从人出发回到物,“非身体化”从物出发回到物,但无论“身体化”抑或“非身体化”都不是人的身体的解放,而只是身体的沉沦和堕落。身体堕落了,建立在身体之上的世界重构冲动也就自然颓败、堕落了,感性的文化政治理想不复存在。如此局面,对人而言,存在何为?

网络传播得以迅速发展的一个根本原因,就是人类渴望打破各种传统交往禁忌的原始冲动——那种让人人赤诚相见、让人人自由宣泄、让人人选择交往、让人人身体感性充分进发和满足的文化理想。因此网络传播的突出特征就是感性的生存和发展方式成为网络社会的主流价值标准。因为感性,网络话语恣肆、无所顾忌;因为感性,网络空间激情进发、魅力四射;因为感性,网络世界草根欢腾、众神退位;也是因为感性,网络文化精粗杂陈、美丑浑融。无论如何,感性的网络决定网络的感性形象,而这种感性形象反过来又加强着全社会的感性化迁移,从而导致人们纷纷从传统文化规则场域中抽身反顾感性的王国——身在何处人也就在何处,身决定人而不是人决定身,人的故乡原来就在它的原始身体里,感性冲动终于有了翻身解放的那一天,身体从技术的丛林中迎来了自身的文化盛世。在身体当道的时期,人们就不再为某种不能和身体相关的事物激动或兴奋,而总是寻求节日般狂欢的身体感受,那些位居五湖四海的身体,那些不断碰撞、摩擦、展示和吸引的身体,那些充满暴力或温柔、攻击或守卫的身体……身体的景观构成文化的景观,数字化生存就是感性的生存。也就是说,人们事实上是在通过身体构筑不同于工业化、技术化和理性化塑造人类自身的感性文化景观。这样的景观年复一年通过各种形式仪式般再现,满足的是人们对于最原始身体的渴望——即使思想也要经过身体的检验,看清身体在思想中的位置才能接受思想对于人生的规划。乌纳穆 诺早已指出,“感到自己存在,这比知道自己的存在具有更大的意义”。因为“知道”是一种可以通过逻辑说服的后果,总是存在“真”“伪”之别,而“感到”是一种源自肉身的体验和心灵的感悟,没有“真”“伪”之别只有“诚”“信”与否,何况没有“感到”的“知道”还真不能称之为真知道,因为只有感觉到了的东西我们才能真正理解它。

身体凸显,感性化思想的风行表明,网络时代的文化宣言首先就是感性的宣言,是一种全盘清除文化传统中清教主义残渣的最后行动,是一种现实利害关系超越理想观念关系的文化转型。与感性的高扬相关,网络时代的文化发展呈现出感官化的总体倾向。因为感官化易于被理解为化,所以感官化是一个危险的符号,但感官化本身并不必为这种危险负责,因为感官化的文化任务是在人类自由解放的理念上不断前进的期望能指,它指向着人的全面肯定和全面肯定后的人的生存局面。因此感官化的对立面是人性进化过程中各种非人化的文化规则或系统。从这个意义上说,感官化的理想目的地和马克思的人的全面发展实现的伟大预言是相一致的。今天,感官化的文化影响已经随处可见,从文学到艺术的表现领域,感官冲击,尤其是视觉化的感官冲击已经是基本的美学原则。由于视觉和感官天然的接近性,视觉的文化地位上升,而文字的重要性迅速下降,视觉美学已经几乎压倒思想逻辑成为文学艺术的表达中心。另一方面,伴随感官化潮流的是泛审美文化的崛起,个人化的生命体验、私人空间的时空淤积物以及世俗生活的方方面面都在以美学的名义对纯粹诗意进行全盘改写,文化工业的功利追求和时尚消费的趣味追求正成为泛审美文化的逻辑支柱,大量言说肉身化的世俗宣言在互联网上大行其道,庶几成为网络文化的主打。

无论理性化还是感性化的文化发展道路,都不是一个新鲜的文化议题。人类似乎总是徘徊在理性文化和感性文化之间,没有最终的答案。对于网络传播凸显的感性文化,我们固然可以采用历史的各种探索或既有结论进行阐释,但我们依然要记住的是,正如后现代文化不是一种二元对立的文化,理性和感性之间的关系也绝非简单地彼此取代,因而感性狂欢的人文主义价值尺度不能被感官的放纵淹没和,网络传播的感性的价值和意义依然在于它牢记以人为中心,为人服务,在信息的海洋中不断打捞人的属性,赋予人的生命以鲜活,赋予人的存在以尊严,赋予人的文化以永恒。如此,属于人的本性的感性才是真感性,真感性中的人才是人的真正雏形。这也是我们从网络文化中看到的感性的意义。

观念的祛魅:从精英意识到大众立场

在一个非大众化的时代,文化下移从来是一个历久而弥新的话题。在精英化的古典时代,文化走向大众从来只能是部分知识分子的私人理想,他们最好的文化收获也只是通过精英身份的自觉掩饰从大众中吸收某些有益成分,抑或通过自身的文化修养把大众推荐给或提升至精英群体,并最终实现大众的“被精英化”或部分“被精英化”。20世纪的大部分空间中,文化下移不仅是左翼知识分子的重要话题和活动,而且是中国共产党人的重要文化使命。但此间长久不能解决的问题是:到底要知识分子“精英化大众”,把大众提升到精英的水准,让他们获得精英的荣宠身份,还是要“大众化精英”,让所有人都大众起来?当年就说过,知识分子不干净,“最干净的还是工人农民,尽管他们手是黑的,脚上有牛屎,还是比资产阶级和小资产阶级知识分子都干净”。他倡导知识分子精英们“把自己的思想感情来一个变化,来一番改造。没有这个变化,没有这个改造,什么事情都是做不好的,都是格格不入的”。无论从哪一方面看,精英的大众化都会有值得自豪的成就和难以释怀的遗憾,这不仅是传统“民本”意识的反映,也是社会变革中文化革新的需要。纵观这段历史,我们会十分明显地发现,文化道路问题常常是一个事关政治正确的大问题,文化发展和文化立场的变化从来都不单纯是一个“文化”问题,其中都浸润着意识形态或隐或显的干预。无论精英立场还是大众意识,都是一种价值观,一种时代旌旗上猎猎飘动的旗语,其观念的合理性只能放在时代潮流的合理性之上去反思和追问。

网络的产生源于实用,即源于信息传播与沟通,网络的这种原初功能似乎一直沿袭下来,并成为网络传媒的重要特征。很多人上网也是基于实用理性,是利用网络的便利完成现实中做不到或不容易做到的事情。因为网络有用,所以网络的商业化发展速度也特别惊人,短短数年间便如火如荼形成气候,俨然一派新经济的先锋气象;网络的广泛商用进一步促成了其实用消费性特征,网络聊天、大小论坛乃至众多社区里充满各种情绪化或锋芒性的思想言论,它们和传统的杂志、报纸甚至是电视传媒比起来,难免显得浅薄、无聊、古灵精怪以及缺乏严肃性。如果把网络传播纳入文化传播的系统中作一番考察,网络传播促进的似乎只是大众文化,而绝非精英文化。问题在于,网络传播似乎也从未纠缠过自己的文化身份,谈论自己的文化归属,它只是按照实用的路线不断调整着自己的脚步,满足网民的需求,红红火火地热闹在自己的空间:但是网络空间毕竟也是现实的一部分,所以网络传播尽管没有明确的文化定位,仍然以自己的内容和形式成就了自身的文化特性,这个特性就是世俗的大众文化平台,是都市大众的文化广场。精英的文化也许没有下移到网络空间,大众的世俗口味却早早登陆网络,乡野趣味变成了灯红酒绿的市民消闲广场。正如有学者所言:“在网络传播时代,文化从经典进入非经典和反经典,使口语写作超过了书面语写作的价值,日常生活感成为这个时代的合法性标志。”

表面上看,大众文化似乎就是大多数人的文化趣味,但全球数以亿计的网民和全球数十亿的居民比较而言也不能算大多数,因此,这里的大众并不单纯是一个数量组合,而是一个文化质量层面的命名。作为一个语义含混复杂的语词,不同的思想体系就有不同的大众说法。与精英相对的大众就是百姓、愚民、庶民或草根;与意识形态相关的大众常常和人民、群众、劳苦大众相连;社会学的大众常常指同质的人、平均的人,众多而质同;哲学家眼中的大众,常常和单面人、孤独的人相关,发育不全又最容易成为文化工业的俘虏;传播学把大众看成是分散的个体,互不相连也不相关,是庞杂的大多数。在很大程度上,传统的大众概念都是精英的对立面,不管其定位态度是肯定还是否定,只要文化被强化其精神审美的一面,大众就难以摆脱非精神审美的拘牵,而被定位于较低的精神维度。 ( ) 本质上说,大众传播是一种可以打破时空限制而让文化得到更为广泛传播的技术形式,不同的人在不同的地域和不同的语境中国共产党享同一种文化,其所复制的对象也从传统的有限区域中解脱出来,实现文化产品的批量化生产,这不仅增加了作品的数量,而且拓宽了作品的文化审美接受面。但是无论报纸还是电视、广播等大众传媒都是一种较为容易控制的对象,因而大众传播理论上的无界限传播落实到实践上,只有等到网络传播的出现才真正成为可能,网络传播的这种无界限传播特征为大众文化的阐释打开了一扇新窗口——网民并非底层人土,严格说来,美国的网民应该属于中产阶级大众,中国的网民由于年轻人居多,过去总是被归类为知识分子阶层的。这样的网络原住民构成表明,大众并非在精神的审美价值传播和接受上存在障碍,不是因为无知才成为大众,而是因为不屑所以选择大众的文化精神。这样说来,网络传播时代的大众文化是一种整个社会文化价值取向转型的信标,它向世界表明,一种彻底告别传统精英文化价值观念的文化时代已经降临,一种回到个体、回到生活、回到感性的文化追求已经在网络中形成并逐渐扩散成为整个社会的文化价值观。如此一来,从精英到大众的转折就不是孤立的个人政治决定,而是全盘的文化整体迁徙。

网络传播的大众究竟指向何种文化语义?第一是文化差异弥平。如果说精英文化强调差异、区别、对立、界限、悬殊,那么大众文化就是以无差异、无区别、无对立、无界限、无悬殊作为根本。大众像一个熔炉,不断凝聚、消融各种文化元素,提供一个全球化的共同文化平台。你可以说这是一个想像的幻觉、大众的乌托邦,但大众通过肯德基、哈根达斯、耐克、奔驰、LV、壳牌、韩流乃至企鹅、北极熊的多元杂烩烹制,的确在为世界创造一种通用的文化语言,而不是精英的地域化差异对话机制。第二是价值中立语境。由于大众文化的价值认知一向较低,所以它们常常背负着“俗、浅、差”的骂名,到底精英和大众之间是领导和被领导、决定和被决定、吸收和被吸收的关系,还是在结构、功能、价值诸方面均完全不相同的两种文化现象?如果是前者, 我们显然很难回答为何大众文化从来没有被精英文化强大的批判声音吓倒并取消其存在的合法性;如果是后者,我们就必须深入到大众文化的结构、功能中去寻找答案。通过对大众文化的解剖,我们发现,大众文化的主体构成其实就是生活本身,大众文化的传播实际上就是大众生活过程的再现,大众在生活中积淀自己习俗、惯例、规则和行为系统的同时,也就形成了自身的文化,因此大众文化不是为解释生活而创造的意义系统,不是从生活的阐释和反思中把生活分裂成可传承和不可传承的两部分,因而大众文化事实上并不拒绝精英文化中能为我所用的成分,也不固守习以为常的文化习惯。时移世变,大众文化的这种价值中立使它成为一个兼容并包的体系,一个让文化和生活协调一致的时空区域。第三是俗世审美救赎。所谓俗世就是油盐酱醋茶包围的日常生活内容,尽管这个内容伴随人类数千年,但没有在审美的层面被关照过。俗世审美原则的崛起,原因在于俗世愈来愈被认同为一个人性的空间,一个较少被技术理性和商业功利态度污染和干涉的对象,俗世里存在着人的真性情。俗世的美学崛起当然也与文化和非文化、审美和非审美之间的价值弥平关系密切,杰姆逊就曾感叹地说:“在19世纪,文化还被理解为只是听高雅的音乐,欣赏绘画或是听歌剧,文化仍然是逃避现实的一种方法。而到了后现代主义阶段,文化已经完全大众化了,高雅文化与通俗文化,纯文学与通俗文学的距离正在消失”。既然距离消失,界限摒除,文化和审美的神圣叙事消亡,俗世便没有不崛起的理由。

反向传播神经网络基本原理篇5

摘 要:针对目前产品网络质量安全事件频发的现状,本文以“天涯”论坛中“圣元”奶粉的所有帖子为数据源,构建了一个包括输入层、隐含层和输出层的三层BP神经网络。通过筛选,选取发帖单位量、发帖累计量、发帖单位频度、发帖累计频度、回复单位量、回复累计量、回复单位频度、回复累计频度8个指标作为输入层参数,选取安全、轻警、中警、重警、严重警5个预警等级作为输出层参数,利用隐含层的BP神经网络对输入层的质量信息进行计算,得到预警等级。实验证明,BP神经网络能够有效地进行预警,预警结果略低于期望值,预警敏感度还有待加强。

关键词:BP神经网络;网络质量安全;预警

一、问题的提出

质量安全信息出现后,会产生相应的负面结果。将这些事件背后的因果关系提炼出来,应用到现有的质量安全信息,能够推测出可能性结果。质量安全信息预警是政府有效预测质量安全事件并成功阻止其大规模爆发的重要手段(程虹,2013)。想要得到准确、科学的预警结果,必须要有客观、迅速、全面的质量信息源。面对近年来质量安全事件频发的现状,政府除了采取诸如制定更加严格的标准,加大处罚质量违规人员的力度等措施外,对产品从生产、流通到交易的全过程也进行了严密地监管(李酣,2013)。然而由于信息不对称造成的政府监管部门人员的有限性与需要监管产品种类的无限性之间的矛盾,政府监管技术的滞后性与产品技术发展的先进性之间的矛盾,证明无论从信息的客观性、及时性还是全面性,利用监管获取的信息源都难以进行有效地预警(罗英,2013)。大数据时代的到来,为政府有效预警带来了契机。

网络的便捷性、普遍性促使其能够成为质量预警的数据平台。作为大数据时代信息传播的主要平台,网络已经进入了人们的日常生活中。2013年7月的第32次《中国互联网发展状况统计报告》显示,截至2013年6月底,我国网民规模达到591亿,较2012年底增加2 656万人。互联网普及率为441%,较2012年底提升2%资料来源:中国互联网络信息中心,2013:《第32次中国互联网络发展状况统计报告》。。平均不到3人就有1人能够上网,加之手机等移动设备与互联网相连,我们已经生活在一个布满网络的世界。与互联网的紧密联系,使得人们更加倾向于在网络上进行交流和沟通。2013年5月的《2012年事业的进展》白皮书指出,截至2012年底,中国网络微博用户规模为3.09亿。据对中国最有影响的10家网站统计,网民每天发表的论坛帖文和新闻评价达300多万条,微博客每天和转发的信息超过2亿条资料来源:中国人大网,2013:《2012年事业的进民》白皮书。。频繁的信息交流让人们把信息到网上当成一种习惯。当人们习惯于把每天经历、遇到的事情到微博和论坛上时,质量安全信息一定也会成为人们讨论的重点之一。当消费者使用过有质量问题的产品后,这些经历都有可能出现在网络上成为质量安全信息。这些质量安全信息不仅全面反映了种类繁多的产品质量问题,而且能够第一时间在网络上,是任何其它平台无法比拟的。网络质量安全信息是能够对产品质量进行预警的非常宝贵的数据。

网络的虚拟性、完全自由性导致消费者对于网络质量信息的真实性产生怀疑。甚至还有专门从事网络造谣的炒作公司每天散播虚假信息。但是,消费者每次网购时会把其他消费者的评价信息作为衡量产品质量好坏的重要标准。评价信息千差万别,但当某件产品销售量非常大时,个别不同观点的评价会被大数据淹没,主流的评价会成为影响消费者购买动机的直接推动力。对点击率、回复率非常高的帖子进行分析,发现它们具有一个共性:提供大量的诸如图片、新闻链接、视频等能够证明信息真实性的材料。以蒙牛关于“出口比内地产品质量更好”的言论发帖为例,由于楼主提供了新闻截图,引发了接近25万人的点击和3000人的回复。如果说点击量只能说明消费者对此事比较关注,那么回复量则能说明消费者群体之间产生了共鸣。大量点击率和回复率为零的帖子没有提供能够证明其真实性的材料,其信息真实性存在问题,消费者不关注说明帖子的内容并不重要。从两个例子中不难发现,一方面消费者非常信赖网络上的质量评价信息,一方面在网络上发表言论并且想到得到关注时,一定会引用真实材料做信息支撑。同时大数据的特性帮助消费者过滤掉非主流信息和不值得关注的信息。综合三方面的因素可以推出,通过消费者对于网络质量信息的自由和选择,形成网络质量大数据,大数据会将真实的、值得关注的质量信息提供给消费者,将虚假的、不值得关注的质量信息淘汰。

网络信息传播的迅猛性、无边界性使得网络质量信息产生的负面效应不亚于质量事件本身造成的后果,甚至更为严重。网络上存在大量的诸如新浪微博、天涯论坛的虚拟社区。同一位用户可以注册多个虚拟社区,用户在不同的社区拥有不同的网络关系。整个网络由错综复杂的不同关系叠加交织在一起。当用户的网络关系越多时,质量信息一经,会在最短的时间内通过转载、关注的方式无限扩散,酝酿成为网络质量事件。2008年9月16日的三聚氰胺事件一经报导,仅圣元奶粉在天涯论坛的发帖数和回复数分别由前一天的3和16个上升到12和306个,可见网络质量信息传播速度之快难以想象。网络使得质量信息不对称最小化,消费者掌握的信息越多,企业面临的风险越大(中国质量观测课题组,2013)。因此网络质量信息的迅速传播对于企业造成的后果是毁灭性的。三聚氰胺事件通过网络平台让消费者了解到国内奶粉存在严重的质量问题后,全国各地的年轻妈妈们通过网络交流奶粉经验,共享使用奶粉过程中出现的各种问题,最后都义无反顾地选择国外奶粉。经过几年的质量建设工作,国内奶粉市场仍然没有太大的起色。

综上所述,消费者在网络上的信息能够第一时间全面、真实、迅速地反映不同产品的质量,我们能够利用网络质量信息预警。同时由于网络传播的巨大负面效应也要求我们对其预警。因此,消费者在网络平台质量信息之时进行严密监控,掌握信息的传播和发展趋势,提前做好预警工作,避免酿成巨大损失,是十分迫切和必要的。然而,由于网络质量信息纷繁复杂,平台和语言各异,传播迅速,很难找到质量信息的传播发展规律和预警的关键节点,这也是目前关于利用消费者网络质量信息进行预警研究非常少的原因。本文将以消费者的网络质量信息为研究数据,通过预警指标的构建,尝试利用BP神经网络形成预警模型,对网络质量信息进行预警,减少其带来的负面影响。

二、文献回顾

按照预警依托的不同平台,可以把预警分为网上预警和网下预警两块。网下预警的出现、发展、应用都早于网上预警,预警主要涉及安全性要求比较高的领域。具体而言,预警主要包括以下几个方面:金融风险预警,研究者运用不同的数学模型对存在的财务危机进行预测。Fitzpatrick(1932)利用财务指标进行单变量预测分析。Altman(1968)利用多变量分析模型对财务危机进行预测。黄福员(2013)提出一种基于粗糙集理论的模糊神经网络模型,用于金融风险预警。环境预警,研究者对土地、水等环境的恶化、污染进行预警。Herrick(2002)对耕地进行监测预警。Katlan(1999)对土地的荒漠化进行预警研究。罗艳(2013)采用生态风险预警评估法评估遵义东南部地区农业土地的重金属含量。张立辉(2013)基于韦伯-费希纳定律建立水库水环境预警评价模型。危险工作场所预警,研究者对存在重大安全隐患的场所进行预警。Lee(1992)利用神经网络算法对设备的使用情况进行预测,预防安全事件发生。马建(2013)通过多种地压监测方式对某矿综放工作面形成综合监测预警系统。疾病预警,研究者对高发且危险的疾病进行预警。盛静宇(2013)探讨了心率减速力在评价肥厚型心肌病患者自主神经功能方面的应用以及对高危患者进行预警方面的临床价值。食品安全预警,研究者对食品生产到销售各个环节中存在的安全问题进行预警。陈璐(2013)探索建立江苏省昆山市餐饮食品安全风险监测三级网络和预警信息平台。

网上预警的兴起相对较晚,预警主要集中在网络舆情控制方面。丁菊玲(2011)利用BP神经网络进行网络舆情的预警,对网络舆情的发展趋势进行评价和预测。姚福生(2013)认为主题演化是网络舆情演化的重要形式,构建了包括信息捕获与提取模块、分析评估模块和结论通报模块的网络舆情主题演化预警信息工作系统。王铁套(2012)在详细分析网络舆情影响因素和自身属性的基础,依据模糊综合评价法构建了网络舆情预警模型,并用实例证明了该模型的有效性和准确性。刘毅(2012)利用基于三角模糊数的模糊德尔菲法和模糊层次分析法,对网络舆情指标进行了再次筛选和权重的确定,得到了面向于某一具体公共事务或热点话题的网络舆情预警指标体系。丁菊玲(2011)实现对网络论坛网帖中网民观点极性和观点强度的挖掘,构建基于三粒度挖掘结果的观点树,建立基于观点树的网络舆情危机预警架构,最后通过实验验证其可行性。王青(2011)对现有网络舆情监测指标体系进行整理与归纳,通过E-R模型系统分析主题舆情的属性特征,从舆情热度、舆情强度、舆情倾度、舆情生长度四个维度进行预警。曾润喜(2010)在问卷调查的基础上利用层次分析法构建了警源、警兆、警情三类因素和现象的网络舆情突发事件预警指标体系。

虽然网下、网上预警的侧重点不同,但基本上都采用构建评价指标、计算评价结果、划分预警等级、判断预警结果的步骤进行预警。评价方法已经非常成熟,因此预警的关键在于如何构建科学的评价指标。将网下、网上预警的文献对比,可以发现网下预警指标的领域区分性非常强,比如金融预警的常用指标有净资产收益率、主营业务利润率、资产负债率等,生态环境预警的常用指标有温度、湿度、风速、光照度等。之所以不同领域可以构建适应于该领域的指标,是因为网下预警的数据来源更加多样化。研究者可以通过精密的仪器设备、抽查、调查问卷等方式主动收集评价指标对应的数据。与网下相比,网上预警的数据来源更加单一化,只能通过互联网获取信息。互联网能够提供什么样的信息,我们就只能被动地获取什么样的信息;因此,根据网上的信息设计的评价指标具有很大的局限性,无法主动设计指标,只能被动地接收指标。

另外,网下、网上预警的关注点也是不一样的。网下收集信息的手段丰富,能够准确获取产品相关安全指标的信息,因此网下预警主要对产品进行安全性预警分析。比如金融预警中的净资产收益率就是金融领域一个非常具体的指标,当净资产收益率达到某个值时,能够从一个侧面反映出该企业的财政状况处于何种状态。相反,网上提供的信息与产品的相关性不高,与信息传播的相关性非常高,原因在于信息在网络上传播所带来的负面效应大于信息本身的负面效应,因此网上预警主要对质量事件的传播进行预警分析,更加关注事件的信息传播状态。预警的指标也主要集中在信息传播的指标上,比如:帖子点击数、回复数、参与讨论人数等。

本文主要研究消费者的网上质量信息。根据上文的分析,本文将使用网上预警指标的构建方法构建消费者网络质量信息的预警指标。

三、预警指标

本文选取的预警指标遵循以下几个原则:可获取性、客观性、可用性。

由于网上的预警指标是根据网上信息制定的,而不同的网络虚拟社区提供的信息不同,因此首先需要确定待研究的网络虚拟社区,查看该虚拟社区能够提供哪些信息,然后根据信息确定预警指标。本文选取国内知名论坛――天涯论坛作为预警的实验数据来源。通过对天涯论坛中帖子相关属性进行分析,发现论坛能够提供的信息有发帖数量、帖子标题、楼主昵称、时间、点击数量、回复数量、帖子内容、回复作者昵称、回复时间、回复内容10个帖子属性。

在网上预警的文献中,研究者除了使用网上提供的客观信息外,还会在预警指标中加入一些主观信息,比如:帖子真实性、敏感度、主题参与度。这类指标都是用问卷调查、专家打分的方法获取。还有一类诸如主题观点倾向的指标数据会使用情感词匹配的方法从帖子内容、回复内容中获取。笔者认为采用问卷调查、专家打分的方法获取的指标数据可能会受到调查对象、专家个人经验、偏好的影响。对于情感词匹配方法,由于来自于不同地区的消费者在讨论的时候会使用本地的语言,加上中文存在一词多义、多词一义、一词多性的现象,这些因素都会降低匹配的精度,影响最后的预警结果,而采用论坛提供的客观数据能够更加真实地反映质量信息的传播规律;因此本文将从10个帖子属性中选择预警指标。

考虑到预警主要观察单位时间质量信息传播的数量,帖子标题、楼主昵称、帖子内容、回复作者昵称、回复内容无法使用,而论坛没有提供点击数量随时间变化的量,因此选取发帖数量、时间、回复数量、回复时间4个指标作为原始指标。对原始指标扩展,最终得到发帖单位量、发帖累计量、发帖单位频度、发帖累计频度、回复单位量、回复累计量、回复单位频度、回复累计频度8个指标。其中,单位量和累计量分别指发帖和回复单位时间和累计时间的数量,单位频度和累计频度分别指单位时间和累计时间帖子和回复的变化数量。

四、BP神经网络预警及结果分析

BP(BackPropagation)神经网络的前身是误差反向传播。误差反向传播经由Bryson的提出和Werbos、Parker等研究者的运用,反向传播开始引起广泛的关注,并被逐步引入到人工神经网络。BP神经网络具有简单的结构、较强的可执行性、较好的自学习性,并且能够有效地解决非线性问题。因此,在众多人工神经网络的模型中,以BP神经网络作为研究方法的论文占了最大的比重。

(一) BP神经网络算法和模型

BP神经网络包括输入层、隐含层和输出层(王钰,2005)。输入层和输出层分别负责接收输入值和产生输出值。隐含层负责将输入层的值计算得出输出期望值以及反向传播输出值。BP神经网络算法是一个误差反向传播的循环学习过程。其基本思想为,输入层接受输入值后,传播给隐含层处理,隐含层将处理结果传播给输出层。这个传播过程称为正向传播。如果输出结果与期望值的误差过大,则进入反向传播阶段。误差反向传播阶段,将输出误差反向传播给隐含层,隐含层各神经元都将接收到一部分输出误差,神经元根据输出误差调整权值。通过不断地学习和调整,输出值将无限接近期望值。直到神经网络学习次数达到预定的阈值,神经网络才会停止。

yj=11+e-xj(1)

xj=∑iyiwji(2)

BP神经网络模型主要由公式1、2、3、4构成(李萍,2008)。公式1为神经网络的Sigmoid激活函数,激活函数用于输入和输出值的非线性映射转换。公式2为神经网络的输出值。神经网络中的神经元接收激活函数的值yj,激活公式2,公式2乘以权重,得到神经元的值xj,xj代入激活函数,激活函数激活下一个神经元,依次循环,直到激活所有神经元,形成神经网络。

ΔW=-lEw(3)

Ejwji=yj(1-yj)(yj-dj)yi(4)

当输出值误差大于期望误差时,神经网络利用反馈机制修正神经元权重。神经元权重的修正模型如公式3所示,Ew为权重的误差量,l为学习率,负号表示权重朝负方向调整。通过公式运算,权重误差量可以由公式4表示,其中dj为期望输出值。权重的修正是一个迭代的过程,当权重小于设定阈值,停止修正。

(二)基于BP神经网络的预警结构

通过以上算法和模型的描述不难发现,本文的研究可以基于BP神经网络进行消费者网络质量信息的预警。将上文提出的8个指标作为神经网络的输入层,预警等级为输出期望,利用一段时间内的输入和输出值训练并搭建起BP神经网络,最后利用BP神经网络对未来的消费者网络质量信息进行预警。预警框架如图1所示。预警等级分为安全、轻警、中警、重警、严重警。

图1 基于BP神经网络的预警结构

(三)预警流程

本文将使用Matlab工具进行预警实验。预警流程细分为10个步骤,实验结果将在对应的步骤中展示。

1.选定数据源

选定国内知名论坛――“天涯”中与圣元奶粉质量有关的所有帖子作为数据源。数据时间从2004年11月29日到2013年8月30日。

2.获取输入指标数据和输出预警等级

通过对原始帖子的预处理,将原始数据以时间为轴统计到8个输入指标中。同时,设定输出预警等级。预警的五个等级从安全和严重分别对应10000、01000、00100、00010、00001五个数字,方便计算。

3.训练样本输入值归一化

将所有数据分为训练样本和测试样本两个部分。首先利用训练样本构建BP神经网络,然后利用测试样本检验BP神经网络,查看神经网络的预警准确率。为了降低输入值带来的误差,提高神经网络的精度,需要对输入值进行归一化处理。本文使用“premnmx”进行归一化处理。归一化前后的输入值如表1、2所示。BP神经网络的核心函数如表3所示。

表1 训练样本的部分输入值表2 训练样本的归一化值表3 BP神经网络中的核心函数 表1中,x5、x7的值明显大于其他值,利用这些原始值构建神经网络,会影响神经网络的精度。归一化后所有的值均处在[-1,1]之间,方便神经网络的搭建。

4.创建神经网络

使用“newff”创建神经网络。本文构建三层神经网络,隐含层只有一层。隐含层的节点数通常通过反复测试确定。通过反复测试,确定隐含层的节点数为10。隐含层的激活函数选用双曲正切函数“tansig”。输出层的激活函数选用线性函数“purelin”。训练函数选用梯度下降自适应学习率训练函数“traingdx”。

5.设置网络参数

BP神经网络的常用配置参数如表2所示。通过反复测试,本文选定训练次数显示间隔为100,网络学习速率为005,最大网络训练次数为10000,网络允许误差为005。表4 BP神经网络的配置参数6.训练神经网络

使用“train”开始训练神经网络,Matlab将弹出训练监控窗口,并实时反馈误差信息。当误差小于配置值时,训练过程结束,神经网络形成。表5 从输入层到隐含层的神经元权值表6 从隐含层到输出层的神经元权值表5、表6为形成三层神经网络后,神经元的权值。表5为输入层到隐含层的神经元权值。输入层8个神经元,隐含层10个神经元,因此得到一个10行8列的权值矩阵。表6为隐含层到输出层的神经元权值。隐含层10个神经元,输出层5个神经元,因此得到一个5行10列的权值矩阵。

7.测试样本输入值归一化

将测试样本同样用“premnmx”进行归一化处理。

8.神经网络仿真

将归一化的值输入到神经网络,检验神经网络的准确率。仿真函数为“sim”。

9.仿真结果反归一化

仿真后的结果是归一化后的值,无法与期望值比较,因此使用“postmnmx”函数对结果进行反归一化处理。

10.结果与期望值比较

将反归一化后的结果与期望值比较,查看神经网络的效果。比较结果如表7所示。表7 测试样本输出值从测试的结果来看,BP神经网络具有比较好的预警作用,预警级别略低于期望。2010年8月8日和2010年8月15日的预警结果与期望值是完全一样的。从2010年8月9日到14日,BP神经网络的预警结果均为重警,期望值是严重警,测试结果比期望值低了一个等级。8月6日、8月16日、8月19日、8月27日和8月28日的预警结果比期望值低一个等级。剩下的预警结果均比期望值低两个等级。总的来看,当出现质量危机时,基于BP神经网络的预警模型能够预测到危机,但低于期望结果,预警敏感度有待加强。

五、研究结论、建议与展望

大数据时代,基于互联网的产品质量安全事件频发,利用产品网络质量安全信息进行预警能够有效避免大规模质量安全事件的爆发,最大程度地减少消费者、企业的损失。本文尝试利用BP神经网络对网络消费者产品质量信息进行预警。通过对圣元奶粉质量安全信息预警的实证测试,发现BP神经网络具有比较好的预警作用,但预警结果低于期望值,预警敏感度有待加强。本文仅是对一个品牌的奶粉进行BP神经网络预警,今后的工作将集中在利用BP神经网络进行多产品的预警,将BP神经网络应用到产品质量大数据中。

参考文献:

[1] 陈璐、朱振华,2013:《昆山市餐饮食品安全风险监测三级网络和预警信息平台建立及应用效果评价》,《中国食物与营养》第11期。

[2] 程虹,2013:《2012年中国质量状况――消费者感知与模型构建》,《宏观质量研究》第1期。

[3] 丁菊玲、勒中坚,2011:《基于观点树的网络舆情危机预警方法》,《计算机应用研究》第9期。

[4] 丁菊玲、勒中坚,薛圈圈,2011:《定量网络舆情危机预警模型构建》,《图书情报工作》第20期。

[5] 黄福员,2013:《金融风险预警的RST-FNN模型研究》,《电脑知识与技术》第9期。

[6] 李酣,2013:《从市场失灵到政府失灵――政府质量安全规制的国外研究综述》,《宏观质量研究》第2期。

[7] 李萍,2008:《基于MATLAB的BP神经网络预测系统的设计》,《计算机应用与软件》第4期。

[8] 刘毅,2012:《基于三角模糊数的网络舆情预警指标体系构建》,《统计与决策》第2期。

[9] 罗英,2013:《共享与善治:质量公共服务对质量监管效果的影响――基于我国宏观质量观测数据的实证分析》,《宏观质量研究》,第1期。

[10]罗艳、何锦林、许锡娟,等,2013:《遵义东南部地区农业土壤重金属污染生态风险预警研究》,《贵州科学》第6期。

[11]马建、王震,2013:《煤矿工作面动力灾害综合预警方式》,《科技创新与应用》第35期。

[12]盛静宇等,2013:《心率减速力预警高危肥厚型心肌病患者的临床价值》,《江苏实用心电学杂志》第6期。

[13]王青、成颖、巢乃鹏,2011:《网络舆情监测及预警指标体系构建研究》,《图书情报工作》第8期。

[14]王铁套、王国营、陈越,2012:《基于模糊综合评价法的网络舆情预警模型》,《情报杂志》第6期。

[15]王钰,2005:《基于改进BP神经网络的预测模型及其应用》,《计算机测量与控制》第1期。

[16]武汉大学质量发展战略研究院中国质量观测课题组,2013:《2012年中国质量发展报告》,《宏观质量研究》第1期。

[17]姚福生、钱芳、苏畅,2013:《大学生网络舆情主题演化探究及其预警指标设计》,《学术论坛》第2期。

[18]曾润喜,2010:《网络舆情突发事件预警指标体系构建》,《情报理论与实践》第1期。

[19]张立辉,2013:《基于韦伯―费希纳定律的浅水水库水环境预警评价》,《现代农业科技》第22期。

[20]Altman,E. I.,1968, “Financial Ratios,Discriminant Analysis,and the Prediction of Corporate Bankruptcy”,The Journal of Finance.

[21]Fitzpatrick,P. J.,1932, “A Comparison of Ratios of Successful Industrial Enterprises with Those of Failed Firms”,The Accountants Publishing Company.

[22]Herrick,J. E.,Brown,J. R.,Trugel,A. J.,et al.,2002, “Application of Soil Quality to Monitoring and Management Paradigms from Range Land Ecology”,Agronomy Journal.

[23]Katlan,B.,Sayyed,M. A.,1999, Regionnal Study on Use of Geograohical Information System and Early Warning in Desertification Control and Movement of Schistocerca Gergana,MAAR Press.

[24]Lee,J.,Kramer B. M.,1992, “Analysis of Machine Degradation using a Neural Networks Based Pattern Discrimination Model”,Manufacturing Systems.

An Empirical Study Earlywarning for Network Quality Safety of

Consumer Based on BP Neutral Network Information

Yu Fan,Yu Hongwei and Xu Wei

(Institute of Quality Development Strategy,Wuhan University)

Abstract:To Cope with frequently occurred issues of network quality safety,this paper aims to study information earlywarning for network quality safety by using BP neutral network. Data source is all posts about Shengyuan milk powder downloaded from Tianya forum. BP neutral network includes three layers: input layer,hidden layer,and output layer.Eight indicators includes posts per unit,cumulative posts,posting frequency per unit,cumulative posting frequency,reply per unit,cumulative reply,reply frequency per unit,cumulative reply frequency are constructed,so as to five earlywarning levels including safety and mild warning,middle warning,serious warning,very serious warning. The empirical study finds out that taking advantage of BP neutral network has an efficient impact on earlywarning. However,the earlywarning results are lower than expected.And the earlywarning sensitivity is to be strengthened.

反向传播神经网络基本原理篇6

关键词:高速公路;隧道施工系统;安全评价;模糊理论;神经网络

0引言

近年来,随着国家高速公路迅猛发展,隧道建设数量也越来越多,规模也越来越大。在隧道施工过程中,由于围岩地质条件的多样性和复杂性,其施工事故发生率比其他岩土工程高且严重,给隧道工程施工人员身心带来严重的危害,社会影响恶劣,有悖于国家建设和谐社会的宗旨。这就要求用科学的方法对隧道施工生产系统进行安全分析与评估,预测事故发生的可能性[1]。

在传统的公路隧道施工生产系统安全评价中,经常使用的安全评价方法主要以定性安全评价方法为主,如专家论证法、安全检查表法及作业条件危险性评价法等[2,3]。近年来,在公路隧道施工生产系统安全评价中,引人了模糊综合评价的方法,取得了较好的决策效果[4]。但是,该方法缺乏对环境变化的自学习能力,对权值不能进行动态调整[5],而神经网络具有非线性逼近能力,具有自学习、自适应和并行分布处理能力,但其对不确定性知识的表达能力较差,因此,模糊控制与神经网络结合就可以优势互补,各取所长[6],在这方面已经出现了一些研究成果[7~11]。为此,本文把人工神经网络理论与模糊综合评价理论相融合,研究建立了一种模糊神经网络评价模型,对公路隧道施工的安全管理水平进行评价。

1模糊神经网络

1.1基本结构原理

模糊神经网络是由与人脑神经细胞相似的基本计算单元即神经元通过大规模并行、相互连接而成的网络系统,训练完的网络系统具有处理评估不确定性的能力,也具有记忆联想的能力,可以成为解决评估问题的有效工具,对未知对象作出较为客观正确的评估。

根据评估问题的要求,本文采用具有多输人单元和五输出单元的三层前馈神经网络,其中包括神经网络和模糊集合两方面的内容。

1.2神经网络

为了模拟人脑结构和功能的基本特性,前馈神经网络由许多非线性神经元组成,并行分布,多层连接。Robert Hecht一Nielson于1989年证明了对于任何在闭区间内的一个连续函数都可以用一个隐层的BP网络来逼近[12],因而一个三层的BP网络完全可以完成任意的输人层到输出层的变换。因此,本文研究的公路隧道施工系统安全评价模糊神经网络采用三层BP神经网络结构。输人层有 个神经元,输人向量 , ,输人层神经元 的输出是输人向量的各分分量 。隐层有个神经元 , ,若输人层神经元 与隐层神经元 之间的连接权值为 ,且隐层神经元 的阈值为 ,则隐层神经元 的输出为

(l)

式中 是神经元的激励函数,一般选取单调递增的有界非线性函数,这里选用Sigmoid函数:

(2)

由此,隐层神经元的输出为:

(3)

同理可得输出层神经元的输出为:

(4)

1.3学习算法

本网络采用BP学习算法,它是一种有教师的学习算法,其学习过程由信号的正向传播和误差的反向传播组成。基本原理是:设输人学习样本为 个,即输人矢量 ,已知其对应的期望输出矢量(教师信号)为 ,正向传播过程将学习样本输人模式 从输人层经隐含单元层逐层处理,并传向输出层,得到实际的输出矢量 ,如果在输出层不能得到期望输出 ,则转人反向传播,将 与 的误差信号通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而调整各神经元之间的连接权值,这种信号正向传播与误差反向传播得各层权值调整过程是周而复始地进行的,直到网络输出的误差减少到可接受的程度,或进行到预先设定的学习次数为止。

网络的具体学习算法的计算模型如下:

对某一学习样本 ,误差函数为

(5)

式中: 、 分别为该样本的输出期望值和实际值。

对于所有学习样本 ,网络的总误差为

(6)

网络学习算法实际上就是求误差函数的极小值。利用非线性规划中的梯度下降法(最速下降法),使权值沿着误差函数的负梯度方向改变。

隐层与输出层之间的权值(及阈值) 的更新量 可表示为

(7)

式中: 为学习率,可取 。

将式(6)和(4)代入式(7),并利用复合函数求导的连锁规则,得

(8)

式中: 为迭代次数, 为误差信号

(9)

类似的,输入层与隐层之间的权值(及阈值)修正为

(10)

同理可得

式中 为误差信号

(11)

为了改善收敛性,提高网络的训练速度,避免训练过程发生振荡,对BP算法进行改进,在权值调整公式中增加一动量项,即从前一次权值调整量中取出一部分迭加到本次权值调整量中,即:

(12)

(13)

式中 为动量因子,一般有 。

1.4模糊集合

评估指标集由表征一类评估决策问题的若干性能指标组成。由于指标的量化含有不确定性,故用模糊方法加以处理[13]。评估指标的模糊集合 可表示为

(14)

式中: 是评估指标, 是相应指标的评价满意度, 。

评估指标集用其满意度表示,取值在[0,1]之间,作为模糊神经网络系统中神经网络的输人向量,这正好符合神经网络对输人向量特征化的要求。实践表明,经过对输人向量的特征化处理,可大大减少网络的学习时间,加速网络训练的收敛。

2隧道施工系统安全评价模糊神经网络

2.1指标体系与神经网络划分

实践证明,一个好的隧道施工系统安全评价方法应满足以下要求:评价指标能全面准确地反映出隧道施工系统的状况与技术质量特征;评价模式简单明了,可操作性强,易掌握;评价结论能反映隧道施工系统的合理性、经济性及安全可靠性;评价中所采用的数据易于获取,数据处理工作量小;顶层输出即为系统的专家评估,而每层各评估项目的子系统都可以用子结构表示。

每个子结构具有输人输出关系可表达为

(15)

其中 是子系统的输出, 是子系统的输人矢量, 为相应的专家(加权)知识。

评估专家系统中各子系统的评估由各自的模糊神经网络来完成。

这种对评估系统的结构分解和组合具有如下特点:

(1)每个子系统可以采用较少的神经元来实现神经网络的自学习和知识推理,这样既减少了学习样本数、提高了样本训练速度,又能够独立完成某一推理任务。

(2)分解的各子系统具有相对独立性,便于系统的修改、扩展和子系统的删除,从而具有良好的维护性。

(3)子系统的评估项目即为节点,在系统进行评估推理时产生的评估表示式可以很好地解释评估系统的推理过程,避免了神经网络权值难以理解所致的推理过程难以理解的弱点。

2.2网络的设计

评估问题是前向处理问题,所以选用如前所述的前向型模糊神经网络来实现。

(1)输人层

输人层是对模糊信息进行预处理的网层,主要用于对来自输人单元的输人值进行规范化处理,输出由系统模糊变量基本状态的隶属函数所确定的标准化的值,以便使其适应后面的处理。根据评价指标体系,对应20个指标构建BP网络的输入层为20个节点,将指标转换为相应指数后作为样本进入网络进行计算。

(2)隐层(模糊推理层)

该层是前向型模糊神经网络的核心,用以执行模糊关系的映射,将指标状态输入与评估结果输出联系起来。采用试探法选取模型的隐含层神经元数,即首先给定一个较小的隐含层神经元数,代入模型观察其收敛情况,然后逐渐增大,直至网络稳定收敛。通过计算该模型的隐含层神经元数为28个。

(3)输出层

输出层是求解模糊神经网络的结果,也是最后的评估结果。我们把评价因素论域中的每一因素分成5个评价等级,即

={安全( ),较安全( ),安全性一般( ),较不安全( ),不安全( )}

对应这5个等级,确定输出层为5个节点。这样就构建了一个“20―28―5”的3层BP网络作为评价体系的网络模型。

2.3模糊神经网络训练

网络设计好后,须对其进行训练,使网络具有再现专家评估的知识和经验的能力。样本数据来自我省已经建成的高速公路隧道施工的现场数据库,从中选取30组,其中20组数据作为训练样本,余下的10组作为测试样本。实际网络训练表明,当训练步数为12875时,达到了目标要求的允差,获得模糊神经网络各节点的权值和阈值,网络训练学习成功。根据最大隶属度原则进行比较,与期望结果相符,其准确率为100%。这说明所建立的隧道施工系统安全评价模糊神经网络模型及训练结果可靠。

3 工程应用实例

利用所训练好的模糊神经网络模型,对江西省正在施工的某高速公路A3合同段3座隧道(北晨亭隧道、洪家坂隧道和窑坑隧道)施工系统进行安全评价测定,评价出系统的安全状况与3座隧道施工实际情况完全相符。同时,实际系统的评价结果又可作为新的学习样本输入网络模型,实现历史经验和新知识相结合,在发展过程中动态地评价系统的安全状态。

4 结论

(1)本文对模糊理论与神经网络融合技术进行了研究,建立了一种公路隧道施工系统安全模糊神经网络评价模型,利用历史样本数据进行学习训练和测试,并对工程实例进行了评价。结果显示,该评价方法可行,评价精度满足工程应用要求,为公路隧道施工安全评价探索了一种新的评价方法。

(2)运用模糊神经网络知识存储和自适应性特征,通过适当补充学习样本,可以实现历史经验与新知识完美结合,在发展过程中动态地评价公路隧道施工系统的安全状态,可及时评估出施工系统的安全状况,尽早发现安全隐患。

参考文献:

[1]徐德蜀.安全科学与工程导论[M].北京:化学工业出版社,2005.

[2]刘铁民,张兴凯,刘功智.安全评价方法应用指南[M].北京:化学工业出版社,2005.

[3]田建,李志强,张斌.交通建设工程安全评价技术现状及趋势研究[J].中国安全科学学报,2008,18(6):171-176.

[4]张鸿,刘优平,黎剑华等.基于模糊理论的隧道施工安全预警模型研究及应用[J].中国安全科学学报,2009.19(4):5-10.

[5]刘辉,王海宁,吕志飞.模糊神经网络技术在矿山安全评价中的适应性研究[J].中国安全生产科学技术,2005,1(3):54-59.

[6]张吉礼.模糊-神经网络控制原理与工程应用[M].哈尔滨:哈尔滨工业大学出版社,2004.

[7]葛淑杰,李彦峰,姜天文等.基于模糊神经网络的煤矿安全评价综合评判[J].黑龙江科技学院学报,2007,17(4):321-325.

[8]郑恒,汪佩兰.模糊神经网络在火工品生产系统安全评价中的应用[J].安全与环境学报,2004,4:159-162.

[9田军.基于模糊神经网络的隧道围岩分级系统[J].湖南交通科技,2007,34(4):104-107.

[10]郭宇航,王保国.两类新型神经网络及其在安全评价中的应用[J].中国安全科学学报,2008,18(7):28-33.

[11]宋瑞,邓宝.神经元网络在安全评价中的应用[J].中国安全科学学报,2005,15(3):78-81.

[12]韩力群.人工神经网络理论、设计及应用[M].北京:化学工业出版社,2007.

[13]杨纶标,高英仪.模糊数学原理及应用[M].广州:华南理工大学,2005.

[14]飞思科技产品研发中心.神经网络理论与MATLAB7实现[M].北京:电子工业出版社,2005.

反向传播神经网络基本原理篇7

关键词:电气设备;故障诊断;神经网络;学习算法

中图分类号:TP183

近年来,随着电气设备复杂度的增加,其发生故障的概率也逐渐上升。即使是熟练工程师,面对日趋复杂的设备内部电气结构,也难以迅速分析及判别其故障原因。与此同时,涌现出的各种智能算法、专家系统等,为设备诊断问题提供了可行的方案。其中,神经网络以其特有优势在电气设备故障诊断中发挥了重要作用。神经网络理论是人工智能、认知学、脑神经学、信息学等诸多学科融合发展的结果,它是由大量简单的处理单元(称为神经元),通过广泛的互相连接而形成的复杂网络系统。神经网络具有学习能力,可以根据电气设备的正常历史数据训练,将训练结果信息与当前测量数据进行比较,以确定故障。同时它具有滤除噪声的能力,这使其能在噪声环境中有效地在线监测及诊断。其具有的分辩故障原因及类型的能力,为未来实现故障智能诊断奠定了基础。本文介绍神经网络结构及其学习算法,提出一种基于BP网络的电气设备故障诊断方法,通过网络训练及结果测试表明,该方法具有良好的故障诊断能力。[JP]

1 BP神经网络模型

神经网络有很多模型,例如BP网络、Kohonen,Hopfield及ART等。其中,反向传播网络(Back[CD*2]Propagation Network)在神经网络的实际应用中有着十分重要的影响,工程应用中的绝大多数网络模型都采用BP模型或其变形,可以说BP模型体现了神经网络中的精华。

1.1 BP神经网络模型

以三层前向BP网络为例,对神经网络结构进行分析,其组成包括输入层、隐含层和输出层。如图1所示,图中圆圈表示神经元,Wir表示输入层第i个神经元与隐含层第r个神经元的连接权值;Vrj表示隐含层第r个神经元与输出层第j个神经元的连接权值;其间的连线表示神经元之间的相互作用强度。И

从图1的结构中可以得到,隐含层节点的输出函数和输出层节点的输出函数分别为:

式中:Tr和θr分别为隐含层和输出层的单元阈值。在本文设计的BP神经网络结构中,式(1)中的f(•)采用sigmoid函数,即f(x)=(1+e-x)-1。И

1.2 BP学习算法

BP模型的成功得益于BP算法的应用,即误差反向传播算法。BP算法属于梯度下降算法,是一种监督式的学习算法。用网络的实际输出与目标矢量之间的误差来修正网络权值,使输出与期望尽可能接近(网络输出层的误差平方和达到最小);通过反复在误差函数梯度下降方向上调整网络权值的变化,逐渐逼近目标。每次权值和偏差的变化都与网络输出误差的影响成正比,并以反向传播的方式传递到每一层。BP网络是由两部分组成:信息的正向传递和误差的反向传播。

设神经元的输入矢量为[WTHX]X[WTBX]=\[x1,x2,…,xn\],其中n是输入层的神经元数。对应于输入[WTHX]X的输出矢量是Y[WTBX]=\[y1,y2,…,ym\],其中m 是输出层的神经元数。如果要求网络的期望输出是[WTHX]T[WTBX]=\[t1,t2,…,tm\],г蛭蟛詈数可以定义为:

BP算法采用梯度下降法来调整网络的权值,以使上述误差函数减小,即:

Иw(n+1)=w(n)-η(E/w)[JY](3)И

式中:常数Е鞘侨ㄖ档髡速率,通常取值0.01≤η≤1。权值WУ牡髡方法采用以下公式:

式中:ИΔwpq表示某层第p个节点到下一层第q个节点的权值修正量;xp表示节点p的输出;δq表示节点qУ亩说愕燃畚蟛,由输出层的等效误差反传而来:

式中:对应BP模型网络结构(见图1);节点q位于输出层;节点h位于隐层。

2 电气设备故障检测实例

在电气设备中发动机是故障率比较高的设备之一,其在故障诊断中比较具有代表性。在此,以发动机为例,分析BP神经网络在电气设备故障诊断过程中的一般模式及步骤。

2.1 网络样本选取及参数选择

分析发动机的常见故障模式,首先选择具有代表性的故障作为特征向量,取[WTHX]X[WTBX]=[x1,x2,x3,x4]作为神经网络的输入。其中:x1代表功率不足故障;x2代表声音异常故障;x3代表排气温度高故障;x4代表消耗量过大故障。通过分析故障原因,取[WTHX]Y[WTBX]=[y1,y2,y3,y4,y5]作为目标输出向量。其中:y1代表点火不正确;y2代表高压线圈损坏;y3代表出现燃爆现象;y4代表进气排气管故障;y5代表增压积炭过多故障。表1给出了输入故障现象[WTHX]X和输出原因分析Y[WTBX]е间的对应关系。

由此可知,在设计基于三层BP神经网络的发动机故障诊断系统中,输入层神经元节点数N=4,输出层神经元节点数M=5。由公式h=(N+M)+σ可得隐含层神经元节点数h取3~6之间的数。И

2.2 训练及测试

通过输入样本组对所设计的网络进行训练,选择训练误差为10-6。例如,输入样本[WTHX]X[WTBX]=[0,0,1,0],调整网络状态,使其输出接近目标[WTHX]Y[WTBX]=[1,0,0,1,0],即当发生排气温度过高故障时,可能原因是点火不正确以及进气排气管问题。训练网络的过程,实际上就是调整网络参数的过程,具体来说,最主要的就是确定各个网络权值。最终训练好的网络在测试过程中,能较为准确地诊断出故障问题的原因。在工程使用过程中,选择故障检测过程中各种仪器测量出来、有代表意义的测量数据,根据先验知识及专家分析,组成输入样本和目标向量组,对设计的网络结构训练。在训练过程中,可增加输入样本的数量。因为通过大量样本训练,神经网络能具有更好的适应性和鲁棒性,其故障诊断的准确性有所提高。采用C++builder及Matlab混合编程,前者负责做界面系统的开发,后者集中在神经网络算法的设计上,据此进一步提高本工作的实际应用能力。

3 结 语

反向传播神经网络基本原理篇8

关键词:图像识别;BP神经网络;柑橘始叶螨(Eotetranychus kankitus)

中图分类号:TP391;S436.66 文献标识码:A 文章编号:0439-8114(2013)23-5863-03

叶螨是农业生产中的重要害虫之一,各类经济作物大都有叶螨为害。严重时常致使作物干枯落叶,生长停滞,严重影响产量和质量,在经济上造成很大的损失[1]。柑橘始叶螨(Eotetranychus kankitus)是叶螨的一种,中文别名为四斑黄蜘蛛,分布区域为中国大部分柑橘产区。

昆虫识别的方法有人工识别、声音识别、图像识别等。其中图像识别法是目前昆虫识别研究中的热点,具有准确度高、劳动量小和可视化等优点。赵汗青等[2]对农田害虫进行了成功的分类识别;张洪涛等[3]采用蚁群算法对储粮害虫图像识别进行了深入的研究。人工神经网络方法实现模式识别,可处理一些环境信息复杂、背景知识不清楚、推理规则不明确的问题,运行速度快,自适应性能好,具有较高的分辨率[4]。为此,在对柑橘始叶螨害虫形体特征提取的基础上,应用BP神经网络对其进行识别。

1 柑橘始叶螨图像获取及预处理

在江西农业大学百喜草生态园中种植的柑橘树上,通过数码相机在光线均匀的环境下采集带柑橘始叶螨的叶片图像,作为识别研究处理的样本图像。对获取的原始图像(图1)运用对比度扩展和中值滤波进行增强;利用模糊集熵自动提取阈值,并进行分割以形成二值化图像(图2);最后运用数学形态学算子滤除空洞、孤立点等噪声。经过预处理后的图像基本满足了后续特征提取和自动识别的要求。

2 基于BP神经网络的柑橘始叶螨的识别方法

吴沧海等[5]深入分析了柑橘始叶螨各种边缘特征检测算子的优劣,并指出采用形态学方法的检测结果比其他算子有明显的改善。数学形态学是数字图像处理技术的一个重要分支,利用数学形态学可以除去图像中不相关的结构特征,同时又可以保持图像的基本形状特征,用具有一定形态的结构元素去度量和提取图像中的形状,达到分析、识别图像的目的。数学形态学的基本运算是腐蚀和膨胀,利用一种针对植物虫害二值图像膨胀和腐蚀的快速算法[6],对柑橘始叶螨进行骨架特征提取,提取结果见图3。

目标的骨架特征是一个赖以分辨和识别的重要特征。在提取了柑橘始叶螨害虫的骨架特征后,就可让计算机系统识别这些特征。

考察的骨架特征因子有4个。①骨架点的分支数(B)。运用骨架树将柑橘始叶螨的骨架映射到一个二维的树结构中,再对树做广度优先遍历,计算每个骨架节点的分支数。②横轴纵轴比(R)。横轴长和纵轴长指图像中识别对象的最大体宽XL和最大体长YL,对应骨架图像分析中常用的边界的短轴和长轴,R=XL/YL。③孔洞数(H)。在昆虫分类中,背板上的斑点是重要的鉴别特征。柑橘始叶螨经过预处理后,这些斑点会呈现不同大小的孔洞,孔洞数在一定程度上能够反映目标的复杂度。④整体形状参数(F)。F=P2/(4π×A),其中P为目标整体周长,A为填充孔洞后的目标面积。形状参数可在一定程度上描述目标的紧凑性,具有尺度、旋转不变性。

此文以VC++ 6.0为开发工具,开发了基于BP神经网络的柑橘始叶螨的识别系统原型,主要对柑橘始叶螨、柑橘全爪螨[Panonychus citri (Me Gregor)]和柑橘瘤瘿螨(Aceria sheldoni)3类叶螨进行识别。BP神经网络是一种多层前向网络,由输入层、隐含层(可以是多层)和输出层组成,一种经典的3层BP神经网络模型如图4所示。BP神经网络的学习过程包括正向传播和反向传播,并在来回传播过程中不断进行误差修正。输入信号经由输入层在神经元核的函数作用后,逐层向隐含层、输出层传播。传播过程中有两类重要的参数,一类是神经元的权值,一类是核函数中阈值。这两类参数开始时需确定一组初值,然后在学习的过程中不断调节权值,使得输出误差信号最小或达到预设的目标。另外在神经网络的构建中,神经网络的层数及每层神经元的个数也对整个神经网络有重要的影响。除此外还包括学习步长、反向计算时的局部梯度、目标误差和指定训练次数等。

3 试验结果

将基于骨架的形态特征骨架点的分支数(B)、横轴纵轴比(R)、孔洞数(H)、整体形状参数(F)作为神经网络的输入,3种叶螨的归一化数据作为该神经网络的训练样本。试验结果见表1。

另外,同时采用基于图像像素灰度的神经网络识别方法来识别相同的样本数据,识别结果见表2。这种方法采用经过简单处理的原始图像灰度数据作为神经网络训练数据,省去了复杂的叶螨数字图像的骨架特征抽取部分,将原始图像灰度值直接作为神经网络的输入。这种方式下,由于输入模式维数的增加导致了神经网络规模的庞大,占用系统更多的内存资源,导致识别时间较本研究的基于数学形态学预处理的BP神经网络识别方法更长,一般用户难以接受。但基于图像像素灰度的神经网络识别方法既采用了全局信息又没有忽略细节信息,网络的抗干扰性能好,识别率较本研究稍高一些。试验数据表明,基于数学形态学和神经网络的叶螨识别方法识别快、适应性强、精度较高。

4 小结

针对柑橘始叶螨自动识别问题,采用基于骨架的形态特征提取方法,自动提取柑橘始叶螨的骨架数学形态特征,并将其作为BP神经网络的输入因子。通过多次试验,确定合适的BP神经网络相关参数。然后,使用VC++ 6.0设计了识别柑橘始叶螨、柑橘全爪螨和柑橘瘤瘿螨3类叶螨的原型系统,识别率均大于90%,每张图像样本平均识别时间小于1 s,较传统的采用图像像素灰度的神经网络识别方法识别时间有明显的下降。图像识别客观上受图像质量、图像种类影响较大,本研究仅针对叶螨家族中的3种螨虫做了探索性的识别研究,以后将扩大螨类识别研究的范围,针对不同螨类特征,设计识别能力更强的原型系统。

参考文献:

[1] 高德三,杨瑞生.害虫防治学[M].北京:中国农业大学出版社,2008.

[2] 赵汗青,沈佐锐,于新文. 数学形态特征应用于昆虫自动鉴别的研究[J].中国农业大学学报,2002,7(3):38-42.

[3] 张洪涛,毛罕平,邱道尹.储粮害虫图像识别中的特征提取[J].农业工程学报,2009,25(2):126-130.

[4] 方彩婷.基于BP神经网络的图像识别与跟踪研究[D].西安:西安电子科技大学,2006.

[5] 吴沧海,熊焕亮,裘 武.基于Matlab的柑橘始叶螨边缘检测的研究[J].微计算机信息,2010,26(9-2):198-199.

上一篇:国土资源处罚办法范文 下一篇:数字经济最新政策范文