基于STF滤波的神经网络算法

时间:2022-07-11 08:14:12

基于STF滤波的神经网络算法

摘 要:为了解决“基于卡尔曼滤波的神经网络算法”由于目标模型不确定性而出现的预测信息不准确,甚至发散的问题以及由于传感器误差而造成的估计误差偏大导致跟踪失效的问题,提出将强跟踪滤波(STF)应用于人工神经网络算法中,以神经网络中各层连接权值构成STF滤波的状态向量,引入时变渐消因子,强迫残差具有正交性或近似正交性,以克服上述问题。实验仿真证明,改进后的算法提高了网络训练速度、滤波精度、数值稳定性以及对目标的跟踪性能。

关键词:数据融合;神经网络;卡尔曼滤波;强跟踪滤波

中图分类号:TP183文献标识码:B

文章编号:1004 373X(2009)02 059 04

Neural Network Algorithm Based on STF Filter

LAO Jianwei,ZHANG Guoliang

(Second Institute of Artillery Engineering,Xi′an,710025,China)

Abstract: Algorithm for feedforward neural network based on Kalman filter has some problems,the prediction information is inaccurate,even emanative because of the target model′s inaccuracy,and the larger estimate error makes tracking-disable because of sensors′ error.Aiming at these shortcomings,a learning algorithm based on Strong Tracking Filtering (STF) filter is proposed for training a neural network,it regards all the weight values as the states.The fading factor is introduced,and residuals are forced to have orthogonality or approximately orthogonality to solve these problems.Simulation results show that the new algorithm improves rapidity of network′s convergence,data′s accuracy,stability and target tracking performance.

Keywords:data fusion;neural network;Kalman filter;STF filter

0 引 言

移动机器人是机器人学领域中的一个重要研究分支,它是一个集环境感知、动态决策与规划、行为控制与执行等多种功能于一体的综合系统。移动智能机器人通过传感器感知环境和自身状态,而传感器受本身精度以及外界环境干扰等限制,所提供给上层决策系统的数据的可靠性十分有限,不足以满足控制系统的要求。移动机器人多传感器信息融合滤波技术弥补了传感器数据采集所固有的缺陷,现已成为移动机器人智能化研究领域的关键技术[1,2]。

针对不同应用问题,提出了多种数据融合算法,如加权平均法,贝叶斯方法、Dempster-Shafer证据推理理论(D-S证据理论)、模糊集理论、估计理论、卡尔曼滤波、概率统计决策理论和神经网络等。

文献[3]提出根据各传感器噪声方差,对各传感器实时测量值进行最优加权融合的滤波方法。该算法复杂度低,但滤波效果不是很明显。文献[4]提出的应用误差反向传播算法在实际应用中收敛速度慢,容易陷入局部最小等问题。文献[5]提出应用离散卡尔曼滤波对数据进行融合处理,但是,由于足球机器人系统是一个复杂、时变的非线性系统,传感器的输出信息没有规律性,所以突变状态的预测能力显得尤为重要,并且卡尔曼最优预测估计对目标运动模型依赖很大,当系统的建模与所研究的真实系统不相匹配时,会出现预测信息不准确,甚至发散等现象。

这里根据神经网络理论及强跟踪滤波器(STF)的特点,将STF滤波应用于神经网络方法中,提出基于STF滤波的神经网络算法对位置信息进行滤波和预测,改进的算法提高了滤波精度和数值稳定性,同时也提高了网络训练速度,以及对目标的跟踪性能。

1 基于STF滤波的神经网络算法

1.1 实验平台

该文实验平台为第二炮兵工程学院独立设计并研发制造的“东风Ⅱ代”足球机器人,如图1所示。

足球机器人比赛是近年来国际上兴起的一种高科技活动。其集机器人学、智能控制、数据融合、计算机技术、无线通信、图像处理、机械学等多种学科于一体,为控制理论提供了一个比较好的实验平台。

1.2 基于自适应卡尔曼滤波的神经网络算法

传统的神经网络存在收敛速度慢,容易陷入局部最小,数据稳定性差等问题。文献[6]提出将自适应卡尔曼滤波应用于神经网络。得到基于自适应卡尔曼滤波的神经网络算法,其中:

状态方程:

(k+1)=(k+1|k)+K(k+1)・

{Ye(k)-h\(k),Yr(k)\〗}(1)

状态一步预测方程:

(k+1|k)=(k|k)(2)

增益方程:

K(k+1)=P(k+1|k)hT(k+1)・

\-1(3)

误差协方差一步预测方程:

P(k+1|k)=P(k|k)(4)

误差协方差更新方程:

P(k+1)=\P(k+1|k)(5)

图1 “东风Ⅱ代”足球机器人

1.3 基于STF滤波的神经网络算法

卡尔曼最优预测估计对目标运动模型依赖很大,当系统的建模和所研究的真实系统不相匹配时,会出现预测信息不准,甚至发散等现象。应用于神经网络的卡尔曼滤波算法在公式推算时进行了泰勒展开,忽略高阶项的数学方法,因此,其状态方程的准确性在工程实践中很可能带来不确定的影响。

STF是一种非线性自适应滤波器,它可以用于一大类非线性系统的状态估计和状态与参数的联合估计。STF使用正交性原理,引入时变渐消因子,强迫残差具有正交性或近似正交性;这样目标模型不确定性对状态估计造成的影响就可以得到解决,同时通过实时调节增益,促使测量残差近似正交,克服由于传感器误差而造成的估计误差偏大导致跟踪失效的现象,从而提高了对目标的跟踪性能。

STF采用在线选择适当的时变增益K(k+1),使:

E{\(k+1|k+1)\〗・

\(k+1|k+1)\〗T}=min(6)

E\=0,

k=1,2,…,i=1,2,…(7)

式(6)是卡尔曼滤波的性能指标;式(7)要求不同时刻的残差序列处处保持正交。已经证明,当模型与实际系统完全匹配时,卡尔曼滤波的输出残差序列是不自相关的高斯白噪声序列,式(7)满足这一要求,因而其不减弱卡尔曼滤波的性能。但在实际问题中,选择的模型不可避免地存在不确定性,因此卡尔曼滤波的输出残差不可能白化。建立在性能指标式(6)和式(7)基础上的STF,引进渐消因子λ(k+1),实时调节增益K(k+1),强迫输出残差近似为高斯白噪声,最大程度地提取输出残差中一切有效信息。渐消因子由下式计算:

λ(k+1)=λ0,λ0≥1

1,λ0<1(8)

式中,λ0=tr\tr\;tr为矩阵的迹(对角线元素之和)。其中:

N(k+1)=S(k+1)-η R(k+1)(9)

M(k+1)=P(k|k)hT(k+1)h(k+1)(10)

S(k+1)=γ(1)γT(1),k=0

ρS(k)+γ(k+1)γT(k+1)1+ρ,k≥1(11)

γ(k+1)=Ye(k+1)-h(k+1)(k+1|k)(12)

式中,0≤ρ≤1为遗忘因子,一般取ρ=0.95。弱化次优因子η≤1是为了使状态估计值更加平滑,可凭经验选定。

应用于传感器信息滤波的STF神经网络算法只需调整卡尔曼滤波基本方程(4)为:

P(k+1|k)=λ(k+1)P(k)(13)

结合式(8)~式(12)、式(1)~式(3)、式(5)、式(13)便构成基于STF滤波的神经网络算法。

W(k+1|k)=W(k|k)(14)

W(k+1)=W(k+1|k)+K(k+1)・

{Ye(k+1)-h\}(15)

K(k+1)=P(k+1|k)hT(k+1)・

{h(k+1)P(k+1|k)hT(K+1)+P(k+1)\〗-1(16)

P(k+1|k)=λ(k+1)P(k)(17)

P(k+1)=\・P(k+1|k)(18)

基于离散系统的卡尔曼最优预测估计,其借鉴STF解决问题的方法,在卡尔曼最优预测估计过程中引进渐消因子,促使测量残差近似正交,最大程度地提取测量残差中一切有效信息。

基于STF的预测估计算法如下:

首先,计算最优增益矩阵:

K(k)=P(k|k-1)hT\ hT+R(k)\〗-1(19)

由此得到状态的最优预测估计值:

(k+1|k)=(k|k-1)+K(k)・

\(k|k-1)\〗(20)

引入渐消因子,调整估计误差方差阵:

P(k+1|k)=λ(k+1)P(k|k-1)-λ(k+1)

K(k)h(k)P(k|k-1)(21)

将STF理论应用于最优预测估计,克服了一般预测方法对目标运动模型的依赖性,并对目标的突变状态增强适应性,提高对目标的跟踪控制性能。通过对前一时刻观测值的测量,可以得到运动目标的状态预测,便于实现对目标的准确跟踪。

2 实验与分析

2.1 网络初始化

首先构建神经网络,然后设置网络层数、各层节点数、各层作用函数、各层初始权值矩阵、评价函数goal、最大循环次数epoch、学习速率η和动量a。

在“东风Ⅱ代”机器人传感神经网络中,传感器信息输入源包括:

(1) 视觉系统传感器,图像采集处理输出的足球横坐标,以及根据采样频率计算得到的足球速度、加速度信号3组;

(2) 机器人自定位信息3组,神经网络输入层有6组输入信息源。

考虑根据机器人与足球的不同状态,采集机器人静止、方位角0°、足球横向运动状态为实验状态,采集400组“东风Ⅱ代”运动过程中传感器输出值作为训练样本,机器人定位信息皆为0;足球定位采样如图2所示。

隐层神经元作用函数采用tansig函数,如图3所示。根据训练效果和经验值,隐含层神经元设计为4组,初始权值为(-1,1)之间的随机数。输出层神经元激活函数为线性函数purelin,如图4所示。学习步长取为0.1,目标误差取为0.000 1。

2.2 滤波训练过程

该算法的实质是将问题转化为状态参数估计的问题,在轮训练过程中,网络的权值与阈值作为滤波器的状态,而网络的输出作为滤波器的观测,即将神经网络中各层连接权值构成卡尔曼滤波的状态向量;网络输出作为滤波器的观测,其系统状态方程和观测方程分别为:

W(k+1|k)=W(k|k)+ΔW

Ye(k)=h[W(k),X(k),k]+V(k)=Yr(k)+V(k)

式中,ΔW为状态更新量;Ye(k)为期望输出;X(k)为输入向量;Yr(k)为实际输出;V(k)为高斯白噪声,其统计特性为E\=0,E\=R(k);h(・)为输入/输出及权值、阈值间的非线性映射关系。

图2 部分传感器输出采样值

图3 tansig函数

图4 purelin函数

隐含层各神经元输入为:

Ii=∑nj=1w1ijxj,i=1,2,3,4

w1ij为输入到隐含层连接权。

隐层神经元作用函数为tansig函数:

y=2/(1+e-2x)-1

则隐层输出为:

oi=y(Ii)

输出层作用函数为线性函数:

y=x

则输出层输出为:

yo=∑4i=1w2ioi,i=1,2,3,4

w2i为输入到隐含层连接权。

隐层作用函数求偏导得:

y/x=(1+y)(1-y)

输出层作用函数求偏导得:

y/x=1

则观测方程中的传递矩阵h为:

h=oi,w为输出层连接权

(1+oi)(1-oi)w2ixj,w为隐含层连接权

0,其他

图5为普通神经网络训练曲线、基于卡尔曼滤波的神经网络曲线与基于STF滤波的神经网络训练曲线的误差变化对比。由图可以看出普通神经网络末段收敛速度缓慢,训练迭代次数最多,基于STF滤波的神经网络收敛速度快,输出精度高。

图5 训练过程

为了比较滤波处理效果,分别应用卡尔曼滤波和STF神经网络对状态观测值进行滤波预测处理。取图像传感器测量误差的协方差矩阵R=0.005I,滤波相对误差由下式求得:

d=|(k)-X(k)||X(k)|×100%

将STF神经网络经过训练后的权值作为最终连接权值,使用随机产生50组检验样本序列,其中部分数据加入突变用于对比滤波结果,如图6所示。

3 结 语

实验表明,STF神经网络对多传感器数据融合,补偿传感器误差,改善传感器性能是有效的。STF神经网络对传感器数据进行融合处理,输出稳定、迭代次数少、突变跟踪能力强,是一种有效的数据处理工具。

图6 两种融合算法预测对比图

参考文献

[1]何友,王国宏.多传感器信息融合及应用[M].北京:电子工业出版社,2000.

[2]王仲民,岳宏,刘继岩.移动机器人多传感器信息融合技术述评[J].传感器技术,2005,24(4):5-7.

[3]刘勇,沈毅,胡恒章.精确制导武器及其支持系统中的信息融合技术[J].系统工程与电子技术,1999,21(4):1-11.

[4]游松,程卫星,王田苗,等.基于任务的神经网络多传感器数据融合新方法[J].高技术通讯,2001,11(7):71-75,96.

[5]李群力,傅妍芳.基于Kalman滤波的数据融合研究[J].计算机仿真,2007,24(8):299-302.

[6]Scalem R S.Tepedelenliou N.A Fast Algorithm Training Feedforward Neural Networks\.IEEE Trans.on Signal Processing,1992,40(1):202-210.

[7]Caldwell D G,Reddy K.Sensory Requirements and Performance Assessment of Telepresence Controller Robots.In:Proc.of IEEE Int.Conf.on Robotics & Auto\.1996.

[8]张乃尧,阎平凡.神经网络与模糊控制[M].北京:清华大学出版社,1998.

[9]宋海涛.全自主足球机器人决策与控制方法研究[D].西安:第二炮兵工程学院,2007.

[10]熊蓉,张翮,褚健,等.四轮全方位移动机器人的建模和最优控制[J].控制与决策,2006,23(1):93-98.

[11]刘君华.智能传感系统[M].西安:西安电子科技大学出版社,1999.

[12]栗素娟,王纪,阎保定,等.卡尔曼滤波在跟踪运动目标上的应用\.现代电子技术,2007,30(13):110-112.

作者简介 老建伟 男,陕西西安人,在读硕士研究生。主要研究方向为系统辨识、建模与精度控制。

张国良 陕西西安人,博士,副教授。主要研究方向为组合导航与机器人技术。

上一篇:基于单片机实现的液位控制器设计 下一篇:Fourier变换轮廓术中参数的选择和优化研究