基于改进高斯核函数的雷达高分辨距离像目标识别算法研究

时间:2022-10-20 04:26:59

基于改进高斯核函数的雷达高分辨距离像目标识别算法研究

摘 要:针对支持向量机的核函数选择问题,在保形变换方法的基础上,分析了确定数据分布特征的重要性,给出了判断数据呈高斯分布的方法。利用支持向量机的高斯核函数,提出一种基于改进的高斯核函数雷达目标高分辨距离像的研究方法。该方法对SVM的高斯核函数进行改进,并进行核函数选择。通过改进的高斯核函数与多项式核函数进行比较,在Matlab环境下采用两种方法对高分辨距离像进行仿真,仿真方法验证并改进了高斯核函数的有效性。

关键词:高分辨距离像; 支持向量机; 高斯核函数; 广义高斯分布

中图分类号:TN957.52文献标识码:A

文章编号:1004-373X(2010)15-0001-04

Target Recognition Algorithm of Radar High Resolution Range Profile

Based on Improved Gaussian Kernel Function

ZHAO Nai-jie, LI Hui,JIN Bao-long

(Department of Electronic Engineering, Northwestern Polytechnical University, Xi’an 710129, China)

Abstract: Aiming at kernel function selection of support vector machine(SVM), the method to determine Gaussian distribution of the data is introduced by analyzing feature of data distribution based on the proposed conformal transformation method. A target recognition algorithm of radar high resolution range profile based on improved Gaussian kernel function is proposed by using Gaussian kernel function of support vector machine. The method improved SVM Gaussian kernel function and carried out the kernel function selection. Through comparing the improved Gaussian kernel function with the polynomial kernel functions, two methods are used to simulate high resolution range profile in the Matlab environment, the simulation method validate the effectiveness of Gaussian kernel function.

Keywords: high range resolution profile;SVM;Gaussian kernel function; generalized Gaussian distribution

0 引 言

传统模式识别方法都是在样本数目足够多的前提下进行研究的,所提出的各种方法只有在样本数趋于无穷大时其性能才能有理论上的保证。然而在许多实际应用中样本数目通常是有限的,如何在有限样本情况下使得到的分类器能够具有较好的分类性能和泛化性能,支持向量机(Support Vector Machine,SVM)的出现为解决这一问题提供了新思路。

SVM是20世纪90年代由Vapnik等人提出的┮恢知新的学习机[1],它拥有较好的推广能力和非线性处理能力,尤其在处理高维数据时,可有效地解决“维数灾难”问题,在人脸检测、网页分类、数据融合、函数估计等领域得到了广泛应用[2]。由于SVM 是一种基于核的机器学习方法,核函数决定了学习机的复杂度,所以核及相关参数选择得好坏直接影响到了SVM 的性能。对于一个选定的核函数来讲,其参数选择方法目前已有一些研究[3-6],其中交叉验证法(Cross-Validation)或留一法(Leave-One-Out)被认为是较为准确的方法[7],但其计算复杂度较高。Amari和Wu等基于由核函数导出的黎曼几何结构[8],提出了一种保形变换的方法,并将这一方法运用在高斯核函数上,取得了较好的实验结果。但是高斯核函数期望风险较高,并且要求的支持向量个数较多,所以在此提出一种改进的高斯核函数方法。

本文对雷达目标的高分辨一维距离像(High Resolution Range Profile,HRRP)目标识别算法做了深入研究。通常用于目标识别的样本数目很有限,因此目标高分辨距离像识别大多数情况下是一典型的高维数、小样本问题。

1 支持向量机

支持向量机算法是在训练样本的特征空间求取能把两类样本没有错误分开的最大间隔超平面,在数学上表示为一个凸二次规划的问题。也可以说算法求解的主要内容是通过求解二次规划(QP)问题,这个优化问题的求解是支持向量机算法的核心,可以说支持向量机的算法就得到了实现[9-10]。

(1) 最优超平面 SVM方法是根据线性可分情况下的最优分类面(Optimal Hyper Plane)提出的。设线性可分样本集为:

这个平面将两类样本没有错误地分开,并且使得离分类面最近的样本到分类面的距离最大,即分类间隔最大,等价于使Аw2最小,w为分类面的法向量。然而要求分类面对所有样本的正确分类,约束条件为:

yi(w•xi+b)-1≥0, i=1,2,…,n

(3)

因此,满足上述条件且使得Аw2ё钚〉姆掷嗝婢褪亲钣欧掷嗝妗A嚼嘌本中离分类面最近的点且平行于最优分类面的超平面H1,H2上的训练样本就是┦(3)中使等号成立的那些样本叫做支持向量。最优分类面可以表示为如下约束的优化问题,即在式(3)的约束下求函数为:

φ(w)=12w2=12(w•w)

(4)

的最小值。为此,可以定义如下的拉格朗日函数:

L(w,b,a)=12w2-∑ni=1ai[yi(w•x+b)-1]

(5)

式中:ai>0为拉格朗日系数。

把原问题转化为如下较简单的对偶问题:

max Q(a)=∑ni=1ai-12∑ni=1,j=1aiajyiyj(xi,xj)

(6)

式中:Аni=1yiai=0,ai≥0,i=1,2,…,n。

(2) 非线性SVM上面讨论的是最优和广义线性分类函数,要解决一个特征空间中的最优线性分类问题,只需知道这个空间中的内积运算即可。按照广义线性判别函数的思路,要解决一个非线性问题,可以设法将它通过非线性变换转换为另一个空间的线性问题,在这个变换空间求最优或最广义分类面。考虑Mercer条件:对于任意的对称函数K(x,x′),它是某个特征空间内积运算的充分必要条件,对于任意的φ(x)恒不为0,且∫φ2(x)dx0,显然这一条件不难满足[11]。如果用内积K(x,y)Т替最优分类面的点积,就相当于把原特征空间变换到了某一新的特征空间,此时的支持向量机为:

max Q(a)=∑ni=1ai-12∑ni=1,j=1aiajyiyjK(xi,xj)

(7)

式中:Аni=1yiai=0,C≥ai≥0,i=1,2,…,n;C为某个指定的常数。它起控制错分样本惩罚程度的作用,实现在错分样本的比例与算法复杂度之间的折衷。

相应的判别函数也应变为:

f(x)=sgn[∑ni=1a*iyiK(xi,x)+b*]

(8)

式中:a*i为最优解;b*为分类阈值,它由一个支持向量得到,也可通过两类中任意一对支持向量取中值。

对于给定的训练数据集,其数据分布的几何特征可能是预先已知的,常见的有高斯分布、圆形分布、圆环分布、柱状分布等。对于这类有规律的数据集,可以构造相应的核函数来训练SVM,以提高SVM的泛化能力。然而更多的情况是预先不知道训练数据集的分布特征,因此希望构造一些算法,给出数据分布的一个近似,把它作为SVM核函数及参数选择的一项重要参考指标,从而提高SVM的泛化能力。对于那些确实无法判断其几何分布的训练数据集,在SVM训练过程中,选用常用的高斯核函数或多项式核函数。

雷达目标的高分辨一维距离像是目标多散射中心在雷达径向距离上的一维分布图,反映了这些散射中心的散射强度和相对位置等目标特征信息。在特定姿态角下,目标的一维距离像可以由下面的离散数学式来表示:

x(t)=∑Pp=1∑M2m=-M1xpmδ(-m)(t-tp)

(9)

式中:p为目标上散射中心的个数;M1,M2为各散射中心的微分(随频率增大)或积分(随频率减小)的阶数;xpm为各散射中心的幅度;tp为各散射中心的时延。

雷达目标的高分辨一维距离像反映出目标散射中心的强度和相对位置等目标特征信息,为物理结构特征相似的复杂目标分类提供了必要的信息来源。

2 判断数据呈高斯分布的方法

广义高斯分布(GGD)是一类以Gaussian分布、Laplacian分布为特例,以Е莫Ш数和均匀分布为极限形式的对称分布。它在许多领域都有广泛的应用。

GGD的概率密度函数为:

f(x;μ,α,β)=α2βΓ(1/2)exp-x-μαβ,-∞

(10)

式中:Е,α>0,βХ直鹞均值、形状参数和尺度参数;Е(z)=∫+∞0e-ttz-1dt为Γ函数;β=σΓ(1/α)/Γ(3/α);σ为标准差。

对于一组给定的训练样本S={(x1,y1),(x2,y2),…,(xl,yl)},П疚奶岢鲆恢秩范ㄑ本是否为高斯分布的方法,其主要步骤如下:

(1) 在平面内,取m=k,将实轴分为k+1Ц銮间。

(2) 考虑Е,σ为未知参数,则统计量为V′=∑m+1i=1(vi-l′i)2l′i^。其中vi表示随机数样本落入第i段的个数(i=1,2,…,m+1);

p′i表示随机数落入第i段的概率;lП硎舅婊数样本总数。

(3) 先用极大似然法得到Е,σУ墓兰篇И┆,┆,由此得到p′i的估计′i,然后计算统计量V′。

(4) 若近似服从m-2的χ2Х植,则该训练样本服从GGD;反之,待测试数据不服从GGD。

通过分析给定训练样本集,可得到数据的一个近似分布,本文将它作为核函数及参数选择的一项重要参考指标,以提高SVM的泛化能力。如果训练样本集在输入空间呈高斯分布,则相应的SVM选择高斯核函数,其中的参数α可在上述判定算法中获得。

3 改进的高斯核函数进行高分辨距离像的研究

核函数是SVM 理论中尚未完全解决的问题,多数实验显示多项式核、高斯核和 sigmoid 核有相近的分类性能。由于高斯核函数

K(x,xi)=exp(-x-xi/σ2)

具有较好的局域性,便于将算法扩展到对多目标分类的场合,因此文中选用高斯核函数并对其进行改进。支持向量机期望风险的上界:

E[Pr(error)]≤E(Ni)/(Nj-1)

(11)

式中:Ni为支持向量的个数;Nj为训练矢量的个数。从式(11)可以看出,减少支持向量个数,可以减少期望风险;提高SVM的推广能力,提高目标识别的性能。根据这个原理对高斯核函数进行了改进:

K(x,xi)=Dexp(-x-xi/σ2), D>1

(12)

令Е弄2=D,Ы式(12)代入式(7)得:

w(a)=∑li,j=1ai-1/2ε2∑aiajyiyjexp(-x-xi/σ2)

=∑li,j=1ai-1/2∑εaiyiεajyjexp(-x-xi/σ2)

(13)

令Еai=βi,εaj=βj,式(13)将转化为:

w(a)=∑li,j=1ai-1/2∑βiyiβjyjexp(-x-xi/σ2)

=∑li,j=1ai-1/2∑βiβjyiyjK(xi,xj)

(14)

这样就增大式(7)中二次项系数的绝对值,从而减少了最优值aУ闹导蔼NiУ母鍪,提高了识别性能。

4 仿真分析

使用本文提出的算法对同一组高分辨距离像进行几何形状检测。数据都服从GGD分布,且在形状测试中得到形状参数Е要=0.7;在数据实验中,随机选取其中100个作为训练样本,其他100个作为测试样本;分别采用高斯核函数和多项式核函数对样本进行实验,在Matlab环境下,进行了20次实验。

改进高斯核函数的实验分析结果如图1,图2所示,它们分别指不同a取值下的分类精度、识别时间。它们有共同的规律:在a较小时,变化趋势比较大;随着a的增大,两个指标的变化趋势都变缓慢。分类精度和识别时间随着a的增大基本趋向一个稳定值,特别是分类精度如表1所示,在a=5时达到最大值。在表2中可以看出,随着独立向量个数的增多,对高分辨距离像的平均识别率呈增大趋势。这也就意味着在分类精度达到最大值的情况下,可以增加独立向量的个数来提高平均识别率。

在图3中,前100个样本作为训练数据,后100个样本作为测试数据,对高分辨距离像分别采用多项式核函数和改进高斯核函数进行分类。

图3 对高分辨距离像采用两种核函数进行分类

从图3中可以看出,对于服从GGD分布的数据集,使用高斯核函数且参数取0.7时的回归效果明显优于多项式核函数情况。这些试验结果也同时表明基于SVM的高分辨率雷达目标识别的识别性能相当不错,是雷达目标识别的一种重要的研究方向。

5 结 语

本文重点分析了样本函数呈高斯分布的情况下,提出了改进的高斯核函数方法,并在雷达高分辨距离像目标识别中做了深入研究,采用改进高斯核函数和多项式核函数两种核函数进行计算机仿真。试验结果证明,改进的高斯核与传统的高斯核相比,具有更低的方位角敏感性、训练数据更低的敏感性,从而验证了本文算法的有效性和合理性。

参 考 文 献

[1]VAPNIK V. The essence of computational learning theory[M].张学工,译.北京:清华大学出版社,2000.

上一篇:基于FastICA的雷达信号分选研究 下一篇:双基地LFM雷达信号模糊函数研究