基于决策树的雷达型号识别方法研究

时间:2022-03-18 02:23:34

基于决策树的雷达型号识别方法研究

【摘要】从信息论的角度,以平时侦察所得各种雷达参数的信息量作为分类依据,得出一种基于决策树算法的雷达型号识别方法。计算机仿真试验表明,在目标种类不是太多的情况下,即使仅能侦察少量的雷达特征参数,通过侦察次数的积累,本算法仍能得到不断改善的识别结果,具有一定的实际意义。

【关键词】决策树;雷达;型号识别

1.引言

雷达辐射源型号识别是电子侦察情报系统(ELINT)的重要内容,目前国内常用的雷达型号分析方法主要有人工查表法和统计模式识别法。人工查表分析法主要依靠情报分析人员的手工操作,速度慢、效率低,早已不适合现代战争的要求。统计模式识别法可以定量比较,便于用计算机自动处理,但是由于同一型号的雷达往往在一个或几个信号参数上有较大的离散性,不易得到合适的雷达信号参数标称值,因而目前还难以运用。

本文提出了一种使用决策树对雷达型号数据库进行统计分类,得出以推理为依据的分类算法,用于对未知雷达辐射源的型号进行识别,并通过仿真试验验证了算法的正确性。

2.决策树的算法描述

2.1 决策树的定义

一棵决策树的建立过程代表一个对子集分类的判定过程,树的每个结点对应于一个属性名或一个特定的测试,根据测试的可能结果在此结点对子集进行划分。划分出的每个部分都对应于相应子集空间的一个分类子空间问题,该分类子空间问题可以由一棵判定子树来解决。因此,一个判定树可以看作是一个对目标分类的划分和获取策略[1]。

于是,决策树可以定义为:

①决策树由一个根结点、若干叶结点和若干非叶结点构成;

②根结点对应于学习任务;

③每个叶结点都包含一个分类名,即包含一个概念;

④每个非叶结点都包含一个属性测试,对该属性可能取的每一个值用一个分支引出到另一个结点。

2.2 决策树的生成

生成决策树的一个著名方法是Quinlan提出的ID3[1,2]算法,算法从树根节点处的所有训练样本开始,选取一个属性来区分这些样本,对属性的每一个值产生一个分枝。分枝属性值的相应样本子集被转移到新生成的子节点上。这个算法递归地应用于每个子节点,直到一个节点上的所有样本都被区分到某个类中。到达决策树的叶节点的每条路径表示一个分类规则。这种自顶向下的决策树生成算法的关键性决策是对节点属性值的选择,ID3算法的属性选择方法是使节点中所含的信息增益最小化。

ID3的属性选择基于以下假设,即:决策树的复杂度和所给属性值表达的信息量是密切相关的。基于信息的试探算法选择的是可以给出最高信息的属性,即这个属性使得样本分类的结果子树产生的信息熵最少。ID3的基本策略如下:

(1)树以代表训练样本的单个节点开始。

(2)如果样本都在同一个类,则该节点成为树叶,并用该类标记。否则,算法使用称为信息增益(informationgain)的基于熵的度量作为启发信息,选择能够最好地将样本分类的属性。该属性成为该节点的“测试”或“判定”属性。算法要求所有的属性都是分类的,即离散的。连续值的属性必须离散化。

(3)对测试属性的每个已知的值,创建一个分枝,并据此划分样本。

重复步骤(1)-(3),递归地形成每个划分上的样本判定树。在树的每个节点上使用信息增益度量选择测试属性。这种度量称作属性选择度量或分裂的优良性度量。选择具有最高信息增益(或最大熵压缩)的属性作为当前节点的测试属性。这种信息增益理论方法使得对一个对象分类所需的期望测试数目达到最小,并确保找到一棵简单的树。

设S是s个数据样本的集合。假定类标号属性具有m个不同值,定义m个不同类ci(i=1,2,…m)。设si是类ci中的样本数。对一个给定的样本分类所需的期望信息由下式给出:(1)

其中pi是任意样本属于ci的概率,并用si / S估计。

设属性A具有v个不同值{a1,a2,…,

av},可以用属性A将S划分为v个子集{s1,s2,…,sv}。如果A选作测试属性(即最好的分裂属性),则这些子集对应于由包含集合S的节点生长出来的分枝。设sij是子集sj中类ci的样本数。由A划分的子集的熵(entro-

py)或期望信息由下式给出:

(2)

其中项为第j个子集的权,并且等于子集(即A值为aj)中的样本个数除以S中的样本总数。熵值越小,子集划分纯度越高。对于给定的子集sj,有:

(3)

其中, 是sj中的样本属于类ci的概率。

在A上分枝将获得的编码信息是

(4)

算法计算每个属性的信息增益,将其中具有最高信息增益的属性选作给定集合S的测试属性。创建一个节点,并以该属性标记,对属性的每个值创建分枝,并据此划分样本。以上即是属性度量的过程。由属性度量即选出当前优先属性,再由当前属性对数据集进行分类,就完成了一棵决策树的建立过程。

2.3 准确度评估[3]

估计分类法的准确性是重要的,这使得我们可以估计一个给定的分类法对未来的数据(即已经过分类法处理后的数据)正确标号的准确率。评估分类法准确率的技术,主要包括保持(holdout)和n-折交叉确认(n-fold cross validation)方法,本文选取后者作为准确度评估方法。

n-交叉确认法的具体算法是:将初始数据被划分成n个互不相交的子集S1,S2,…,Sn,,每个子集的大小大致相等。训练和测试进行n次。在第i次迭代,Si用作测试集,其余的子集都用于训练分类法。即:第一次迭代的分类法在子集S2,…,Sn上训练,而在S1上测试;第二次迭代在子集S1,S3,…,Sn上训练,而在S2上测试;依次下去,最后得出的准确率估计值为n次迭代后的分类数除以初始数据中的样本总数。

3.决策树算法在雷达型号识别中的应用

3.1 决策树算法用于雷达型号识别的优越性

随着雷达技术的不断进步,现代雷达信号环境具有密集、复杂、交错、多变等特点。面对这样的特点,电子对抗系统要对每个信号实现100%概率的截获或是逐个分析每个信号的参数特征基本是无法实现的。且传统的型号识别方法还要求所选择的雷达信号参数对于不同型号雷达在数值上不产生交集:如只有在频率、空域上宽开,又能准确分辨各个脉冲的不同频率和不同方位时,此时的频率和方位参数才能作为识别参数。

相对而言,使用决策树算法进行雷达型号识别,具有以下优点:

(1)可以生成可理解的规则:数据挖掘产生的模式的可理解度是判别数据挖掘算法的主要指标之一,相比于一些数据挖掘算法,决策树算法产生的规则比较容易理解,并且决策树模型的建立过程也很直观。

(2)与雷达对抗侦察情报分析中的其他数据挖掘方法相比,其计算量较小,可实现性强。

(3)只要对系统输入识别参数属性,算法总能迅速得到一个较为合理的识别结果。较少的识别参数只对识别精度产生影响而不会没有输出结果,因而对于雷达对抗干扰辅助决策具有相当的参考价值,同时可以满足作战时的时效性要求。

通过第2节的决策树算法描述,可以得到如图1所示的基于决策树算法的雷达型号识别过程。

3.2 算法的应用实例

仿真实例选取雷达对抗侦察数据中通过分析截获的雷达信号可以得到的4个主要参数作为典型属性描述不同型号雷达的特征,用以刻画每种雷达的特性[4]:

(1)雷达的技术体制;

(2)雷达信号工作频率:雷达发射机的射频振荡频率;

(3)脉冲重复频率:雷达每秒钟发射的射频脉冲个数;

(4)脉冲宽度:射频信号持续的时间。

现假设有三种型号的参数体制部分重叠的雷达A、B、C,其主要技术参数如表1所示。

通过模拟平时侦察存入特征参数库的一组分类数据(包含测量误差)如表2所示。

根据2.2节的决策数生成算法,在Matlab7.0中编制程序可得到如图2所示分类标准的决策树。

假设在接收机存在误差的情况下,针对表1所示三种类型的雷达基准参数,模拟出六组实时数据如表2所示。其中,前三组雷达参数取自三类雷达参数特征的不相交区域,第四组数据与第一组数据相同,五、六组数据仅在脉冲重复频率上有较大的差异。

采用如下策略对上述六组参数进行识别:若识别结果与实际情况相符,则将该组参数存入特征参数库中重新进行训练以增加识别的准确性;使用n-交叉确认法判断识别正确率,n取3。(由于示例中样本较少,实际应用时可依据识别正确率选择一个样本添加门限,例如当识别准确度>60%时,可将该组参数及识别结果作为新的样本存入特征参数库。)通过本算法计算所的结果仍填入表3。

可见:

(1)由于样本参数种类较少,训练产生的决策树及分类规则相对简单;

(2)输入参数值在三类不同型号雷达各自的不相交区域内时,识别结果可以有较高的识别正确率;

(3)当向样本库中添加新样本重新训练以后,相似的输入数据就能显著提高识别正确率;

(4)输入参数的属性特征不明显时,识别正确率降低,但算法仍然能给出较为合理的识别结果。

4.结束语

本文通过实例仿真研究了决策树算法用于雷达型号识别的可行性,但决策树方法也存在若干局限性:

(1)当类别太多时,将会增加误差。

(2)缺省值处理问题:决策树进行分类预测时,完全基于数据的测试属性,所以对于测试属性缺值的数据,决策树将无法处理。

(3)通常仅根据单个属性来分类:决策树方法根据单个属性对数据进行分类,而在实际的雷达型号识别分类系统中,雷达不同的属性之间可能具有某种关联,此时类的划分就不仅仅与雷达的单个属性有关,还与一个属性集有关。

因此,决策树技术在包括数据挖掘在内的诸多应用领域,尤其在人工智能的一些领域得到了广泛的应用,具有许多优点。但是,将决策树理论用于雷达型号识别,还需要解决针对本领域的一些相关课题,正如数据挖掘领域已经出现多种效率更高、理论更完善的ID3算法的变体一样。希望本文可以起到一个抛砖引玉的作用,引起本领域专家们的关注和讨论。

参考文献

[1]史忠植.高级人工智能[M].北京:科学出版社,1998:24-27.

[2]陈世福,陈兆乾.人工智能与知识工程[M].南京:南京大学出版社,1997:21-44.

[3]史忠植.知识发现[M].北京:清华大学出版社,2002:31-32.

[4]林春应编.雷达对抗情报分析[M].合肥:电子工程学院,1984:15-58.

[5]王士同主编.人工智能教程[M].北京:电子工业出版社,2004:130-150.

上一篇:直流伺服电机在智能玩具小车中的编程应用 下一篇:OFDM系统中高峰均比问题的研究