基于FCM及KPCA算法的白酒识别系统

时间:2022-09-05 03:55:20

基于FCM及KPCA算法的白酒识别系统

摘要:在显微镜下观察,白酒的微观结构呈现不同形状和不同尺寸的颗粒或团状。不同质量和种类的白酒,其显微图像和微观结构不同。本文基于KPCA和FCM算法,应用白酒显微图像边缘信息,构建一种白酒识别系统。该白酒识别系统对五粮液、泸州老窖、叙水、剑南春、茅台等十种酒进行分类识别,结果表明白酒正确识别率超过95%。

关键词:FCM;显微图像;白酒鉴别;KPCA;边缘特征

中图分类号:TS207.3 文献标识码:A 文章编号:1007-9599 (2012) 16-0000-03

白酒是世界上消费最广的蒸馏酒之一,具有非常重要的商业和社会地位。在白酒的生产和销售中白酒质量的评估和分级至关重要。在显微镜下观察,白酒的微观结构呈现不同形状和不同尺寸的颗粒或团状。不同质量和种类的白酒,其显微图像和微观结构不同。微观结构中微粒的形状及结构决定白酒的质量和种类。若通过白酒的显微图像进行白酒识别,显微图像的纹理和颜色特征并不重要,重要的是微粒的形状和结构分布特征。本文基于FCM算法,应用白酒显微图像的边缘信息进行白酒识别。

聚类就是将一系列的目标分成若干类或族,每一类目标具有很高的相似性,而不同类的目标具有较大差异[1]。聚类主要有精确聚类和模糊聚类两种方式。精确聚类的类间边界定义准确。然而,在许多情况下,类间的边界是很难精确定义的,某些目标可能属于某一类,也可能属于另一类。这种情况下,应用模糊聚类将会取得更好的效果[2]。模糊C均值(FCM)是一种广泛应用的聚类算法,传统方法的FCM聚类依赖于目标之间分类特征的距离,大多数情况下,FCM算法假定所有分类特征同等重要,采用通用的欧拉距离进行分类。但是在实际问题中,分类特征往往具有不同的重要性,因此,有人基于梯度下降学习算法提出加权特征聚类算法,并证明在适当的权值条件下具有更好的分类效果。本文采用给定聚类中心的改进的半监督改进的FCM聚类识别算法。

子空间技术能在高维空间有效地获取数据的主要特征,对数据进行全局优化描述。子空间方法较多,主元分析(PCA)和奇异值分解(SVD)用于获取数据的主要结构,两种方法中原数据空间到子空间的映射均是线性的。若数据结构呈非线性,PCA和SVD都不能有效捕获数据的内部特征和规律。对于白酒识别来说,描述白酒显微图像中微粒形状和结构特征的微粒区域边缘信息,可能呈非线性结构,因此需要更好的特征解析方法。近年来,产生了一种新的子空间方法KPCA[3],通过核函数,将特征空间非线性映射到高维核函数空间,然后再进行线性PCA。与线性PCA相比较,KPCA在描述非线性模式时具有更佳性能[3][4]。应用KPCA将有效地挖掘白酒显微图像边缘特征信息中的非线性结构特征。

本文基于KPCA和FCM算法,应用白酒显微图像边缘信息,提出一种白酒智能识别方法。应用显微图像边缘特征的KPCA子空间解析,使用给定聚类中心改进的FCM算法,建立白酒识别模型。

1 显微图像RKT滤波器预处理

白酒显微图像较为模糊,背景干扰大,对比度低,需要进行预处理。采用文献[5]中的RKT滤波器进行处理。将图像通过一系列的核函数滤波,在每个象素点上保留最大的滤波输出值。该核函数以较小的步进在360度范围内旋转。如下式所描述:

其中,I是输入图像, 是方向 上的核函数。输出图像是所有方向上最大值,定义为:

给定 的图像,RKT滤波过程如下:

STEP 1 产生 核函数, 且 ,滤波器厚度 ,方向 ;共产生尺度为 的 个方向上的核函数;

STEP2 图像与核函数卷积,得 个滤波结果;

STEP3 每个象素点选择滤波结果的最大值作为输出结果;

白酒显微图像增强结果如图1、2所示:

2 边缘特征提取

不同白酒在显微镜观察下呈现不同的微观结构,具有不同显微图像。显微图像中微粒的形状和结构特征反映了白酒的质量和性质。文中应用白酒显微图像边缘特征进行白酒识别。

2.1 边缘提取

经过RKT滤波预处理后,应用Canny边缘提取算法,提取白酒显微图像边缘,结果如图3、4所示:

2.2 霍夫变换

白酒显微结构中的微粒在显微图像中描述出来就是一个个区域。大部分微粒的形状近似圆,因此采用霍夫圆变换(CHT)将边缘特征映射到参数空间。CHT用于寻找图像中的圆模式。

圆方程描述为:

其中, 为半径, 是圆心。文中选择了显微图像中最大的30个圆构成特征矢量:

3 KPCA分析

如何从显微图像边缘特征中挖掘隐藏信息用于白酒识别是一个难点。在CHT变换后选择过多的参量直接用于白酒分类识别,信息利用率低,将会导致维数太高,聚类识别分析结构复杂。因此,须降维和信息挖掘。考虑到白酒识别,不仅需要显微图像边缘形状特征,同时还需要结构分布特征,边缘特征存在非线性结构,采用KPCA对边缘特征空间通过非线性映射和主元分析,达到信息挖掘及降维的目的。

与PCA的线性映射不同,KPCA允许输入数据从低维到高维任意高阶映射。KPCA将低维非线性结构输入数据通过核函数映射到高维线性特征空间,获得特征的线性解析。

假定输入数据 , , ,且零均值。应用非线性映射 ,可以将输入空间映射到内积空间 :

在该映射特征空间中数据表示为

,核函数定义为特征空间数据的内积:

核函数矩阵 表示为:

其中, 。内积特征空间PCA满足方程:

其中K是半正定核矩阵,N是数据空间样本数, 是特征值, 是对应特征矢量。到特征空间 的映射表示为:

因此,输入空间到特征空间的映射只需作内积就能实现。获得的子空间是由较大特征值对应的特征矢量张成的。这些特征矢量组成U的正交基,特征值反映对应PC的重要性。

常用的核函数[6]有多项式、高斯和sigmoid三种,高斯径向基函数是最常用的一种,定义如下:

其中参量 将会影响映射 的非线性程度, 越小其非线性程度越高。应用KPCA将有效地挖掘白酒显微图像边缘特征信息中的非线性结构特征。

4 FCM聚类算法

模糊C均值聚类用隶属度 表示样本属于某类的程度。隶属度 定义为样本 与聚类中心 距离 的函数。其算法就是使下面代价函数最小:

本文应用FCM进行白酒识别分类,应用训练样本特征矢量均值作为白酒每类的聚类中心。将待识别白酒样本的特征矢量通过给定聚类中心改进的FCM进行分类识别。其步骤如下:

STEP1 初始化 ,且满足:

STEP2 计算 ,其中聚类中心 已知:

STEP3 重复步骤2直至 不再减少。

5 白酒识别系统实验及结果

5.1 构建白酒识别系统

分别采集五粮液、泸州老窖、叙水、剑南春、茅台等十种酒分辨率为 显微图像各50幅,每类白酒的其中10幅显微图像作为训练集,用于获取聚类中心,剩余40幅作为测试数据。

所有显微图像,经RKT滤波增强和Canny边缘提取,将边缘通过CHT变换转换到参数空间,形成矢量:

应用高斯径向基函数作为核函数( ),对获得的数据进行KPCA计算,选择前M个PC作为变换后的特征空间数据。将训练集的特征矢量取均值作为FCM聚类中心。测试集的特征矢量顺序通过FCM聚类,隶属度最大对应某一样本的白酒识别结果。

5.2 实验结果及分析

KPCA的核函数参量 将会影响映射 的非线性程度, 越小其非线性程度越高。下表是在M=8时,参量 取不同值,对应的实验结果。可以看到,白酒(1,4,9)在σ=0.1时获得最佳鉴别效果,而白酒(2,5,8,10)及白酒(3,6,7)分别在σ = 0.5及σ =1获得最佳鉴别效果。总的说来,在σ=0.5时,鉴别效果最佳。

另一个实验中,固定 ,改变子空间维数,其结果如表2。KPCA子空间是有前M个PC张成的,M取值越大,结构描述越完整。从表2可以看出,M=15获得最佳鉴别效果。因此,得到最佳条件参量, , 。

6 结论

本文基于KPCA和FCM算法,应用白酒显微图像边缘信息,提出一种白酒智能识别方法。应用显微图像边缘特征的KPCA子空间解析,使用给定聚类中心改进的FCM算法,建立白酒识别模型。设定KPCA不同参量,进行白酒识别实验,结果表明白酒正确识别率超过95%。

参考文献:

[1]J. Han, M. Kamber. Datamining: Concepts and Techniques. Morgan Kaufmann Publishers,San Francisco,2001.

[2]M. Hung, D. Yang. An efficient fuzzy c-means clustering algorithm. In Proc. the 2001 IEEE International Conference on Data Mining,2001,pp. 225-232.

[3]Sch¨olkopf,B., Smola, A., M¨uller, K. Non-linear component analysis as a kernel eigenvalue problem. Neural Computation,10:1299-1319,1998.

[4]Kwang In Kim, Keechul Jung, Hang Joon Kim. Face Recognition Using Kernel Principal Component Analysis. IEEE Signal Processing Letters,9(2):40-42,2002.

[5]adwiga Rogowska1, Mark E Brezinski. Image processing techniques for noise removal, enhancement and segmentation of cartilage OCT images. Phys. Med. Biol. 47:641-655,2002

[6]Cortes, C., Vapnik, V. . Support vector networks. Machine Learning,20:273-297,1995.

上一篇:依标施教:从教材内容到教学内容的一条路径 下一篇:让学生在朗读中入情入境