基于SVM的IDS中的参数选择问题

时间:2022-05-03 02:06:12

基于SVM的IDS中的参数选择问题

【摘要】 本文介绍了一种基于混合遗传算法求解L00上界极小点的核参数选择方法,并将它用基于SVM的IDS系统。实验证明,通过该方法选择出来的核参数能够提高分类精度,具有实用性。

【关键词】 支持向量机(SVM) 核 混合遗传算法 L00上界

引言:

入侵检测系统(Intrusion Detection System,IDS)是监控网络或计算机系统的动态行为特征并据此判断是否有入侵的系统。目前的入侵检测方法分为两类:误用入侵检测和异常入侵检测。异常检测试图用定量方式描述可接受的行为特征,以区分异常的、潜在的入侵与误用检测利用已知攻击模式识别入侵相比,异常检测的优点是能够检测到新的攻击行为。但是,由于异常检测必须跟踪和更新系统或用户的行为特征,因此异常检测的计算量大。目前多采用基于机器学习的异常检测方法解决计算量大的问题。研究人员设计了很多基于传统机器学习的检测方法,如神经网络方法 。然而,这些方法往往具有很大的局限性。

SVM是近年发展起来的、实现了结构风险最小化原则(SRM原则)的一种新的机器学习方法。将SVM应用到入侵检测系统中,可避免基于传统机器学习检测方法的局限性,能够保证在不降低检测精度的条件下,满足实时检测需求,从而使整个入侵检测系统具有较好的检测性能。核函数在支持向量机中具有重要的地位,其中核参数的选取直接影响到核函数的推广能力。常用的核函数有:线性核函数(Linear Kerne1);多项式核函数(Ploynomial Kerme1);径向基核函数(Redial Bais Kerne1),参见文献[1]。本文采用C-SVM,首先介绍C-SVM,然后说明了基于混合遗传算法的核参数选择方法,最后将结合这一方法的C-SVM用于IDS系统。

2 C-支持向量分类机的变形算法

在文献[2]中,提出了一种C-支持向量机的变形方法,算法如下:

① 设已知训练集:

3 基于混合遗传算法的核参数选择方法[3]

1) 问题的提出 针对上述算法而言,通过极小化该算法的L00上界来寻求最优参数,是一种新的选参方法 。参数θ (既包括核参数又包括惩罚参数C )可通过求解问题式(2)得到。

的最优值。对于求解式(2),可以用最简单的快速下降法,但通过分析得知,并不能判定式(2)一定是一个凸函数,用最速下降法有可能达到局部最优解,这与本文的初衷是相悖的,而混合遗传算法可以有效地解决上述问题。

2)混合遗传算法遗传算法(GA)是一种基于自然选择和进化遗传的随机搜索算法,最早由JohnHol_1and提出[5],它是模拟生物进化过程随机搜索解空间中的许多点,不易陷入局部最优解,能够快速全局收敛,针对L00上界的求解问题,本文对标准遗传算法做了如下调整:

① 在遗传算法的选择操作中,为了避免适应度高的个体被淘汰,本文选择的是再生算子(Reproduction),它使用的是期望值方法(Expected Value Model)。而最常用的赌轮选择方法,当个体数不太多时,依据产生的随机数有可能不会正确地反映个体适应度的选择,即存在统计误差。

② 尽管遗传算法比其他传统的搜索方法有更强的鲁棒性,但它更擅长全局搜索,当遗传算法搜索到最优值的局部域时,很难达到最优值。因而采用遗传算法与最速下降法相结合的方法对问题进行联合搜索,以求得更小的目标函数值

3)核函数及核参数选择的具体步骤

① 选定支持向量机中的一个核函数k,k∈1,2,3 (k=1 代表linear, k=2 代表poly, k=3 代表rbf), 的初始值设为1。

② 得到k 的值,如果k≥3 ,则转③,否则转⑨。

③ 对目标函数式(5),选择θ 的一个初始编码,给出一个有20个染色体的初始群体pop(1),t:=1 .

4 仿真实验

(1)实验数据:本文采用MIT AI实验室提供的lpr数据 。其中训练集由40个正常进程和40个异常进程组成,测试集由200个正常进程和400个异常进程组成。

(2)实验方法:采用基于系统调用序列的方法 ,窗口大小为6,实验软件采用Libsvm。

(3)实验结果:

5 结论

通过实验结果可以发现,利用本文给出的方法选择最优参数,预测的正确率明显优于最速下降法。本文通过利用混合遗传算法进行了核参数的选择,并取得了较好的效果,具有很好的实用价值,但核参数选择问题仍是支持向量机当今研究的一个难点问题,有待进一步研究。特别是实验结果中,HGA方法的漏报率高于GCD,今后的研究中应该使得参数的选择能使IDS系统有较高的检测率和较低的漏报率。

参考文献:

[1] 邓乃扬,田英杰.数据挖掘中的新方法一支持向量机 [M]. 北京:科学出版社,2004.

[2] 齐志全,田英杰,徐志洁 支持向量机中的核参数选择问题 控制工程 2005年7月

[3]

作者简介:

李娜(1981-),女,在职研究生结业,助教。

马炎(1981-),女,大学本科,助教。

上一篇:利用脚本实现ISA的VPN策略中MAC地址的判断 下一篇:基于“钓鱼”执法的行政伦理审视