支持向量机结合主成分分析辅助激光诱导击穿光谱技术识别鲜肉品种

时间:2022-07-29 10:04:04

支持向量机结合主成分分析辅助激光诱导击穿光谱技术识别鲜肉品种

摘要为提高激光诱导击穿光谱技术(Laserinduced breakdown spectroscopy, LIBS)对鲜肉品种的识别率, 采用支持向量结合成分分析算法辅助LIBS技术对鲜肉品种进行识别。对鲜肉切片用载玻片压平, 采用LIBS技术对鲜肉组织(猪肉、牛肉和鸡肉)表面进行光谱数据的采集, 每种鲜肉采集150幅光谱并进行随机排列, 取前75幅光谱作为训练集建立模型, 后75幅作为测试集测试建模结果。研究选取K、Ca、Na、Mg、Al、H、O等元素的49l归一化谱线数据进行主成分分析, 并用所得数据建立支持向量机分类模型。结果表明, 通过主成分分析降维, 输入变量从49个优化减少到18个, 模型建模速度从88.91 s降至55.52 s, 提高了支持向量机的建模效率; 并使预测集的平均识别率提高到89.11%。本研究为激光诱导击穿光谱技术在鲜肉品种快速分类领域提供了方法和数据参考。

关键词激光诱导击穿光谱; 支持向量机; 主成分分析; 组织分类

1引 言

肉类品种多样、价格不一, 一些不良商家以次充好, 不断出现“猪肉充当牛肉”、“鼠肉充当羊肉”、“掺假牛羊肉”、“僵尸肉”等严重危害消费者利益和食品安全的事件。因此, 肉类品种的快速分类分析有着重要的现实意义。传统的肉类检测技术有聚合酶链反应技术(Polymerase chain reaction)[1]、气相层析质谱分析技术(Gas chromatography mass spectrometer)[2]、芯片毛细管凝胶电泳(Capillary gel electrophoresis)[3]等。虽然上述方法检测准确度高, 但需要专业人员对样品进行DNA或蛋白质的萃取, 操作过程复杂耗时[4], 不能满足快速检测的需求, 因此亟需开发一种快速肉类品种区分的检测技术。

激光诱导击穿光谱(Laserinduced breakdown spectroscopy, LIBS)是一种原子发射光谱分析技术[5], 已广泛用于固、液、气等物质的检测[6~13], 并逐渐进入工业生产检测领域[14], 尤其以微损、非接触、快速分析的特点在生物组织检测方面受到越来越多的关注[15~18]。近年来, 将LIBS技术与化学计量学方法相结合识别生物组织已成为研究热点[19]。Kumar等[20]使用LIBS技术对狗肝正常组织和恶性肿瘤组织进行光谱区分, 实验表明, 组织中不同元素谱线强度比值差异可以有效区分正常组织和肿瘤组织。Yueh等[21]使用层析聚类分析(Hierarchical cluster analysis, HCA)、主成分分析(Principal components analysis, PCA)、偏最小二乘判别分析(Partial least square discriminant analysis, PLSDA)和BP神经网络(Back propagation artificial neural networks, BPANN)4种算法对冰冻鸡肉组织的不同部位(大脑、肝、肺、脾脏、肾脏、肌肉)进行LIBS实验分析, HCA对44个样品验证,仅有3个没有正确识别, 其它算法(如PLSDA、BPANN)由于训练集建模样品数据太少及训练集与验证集采集时间不一致, 不能有效地建立训练模型, 造成对验证集的识别率差。Bilge等[22]采用LIBS技术结合PCA算法对烘干压片处理的肉类组织(猪、牛、鸡)进行种类区分, 识别率为83.37%。除此之外, 还对相互掺杂的肉制品进行了PLS定量分析的研究。上述研究表明, LIBS对肉类组织的识别率有待提高, 且样品的制作方法如冰冻、压片法, 制样耗时、复杂, 需要改善。

相对于以上所使用的分类算法, 支持向量机[23](Support vector machines, SVM)具有在小样本建模、训练速度、预测稳定等方面的优势, 被广泛用于LIBS分类研究中。 Yu等[24]利用LIBS结合SVM对11种塑料的识别率达到了100%, 但SVM常会受输入变量过多和噪声的影响, 使得建模效率和稳定性降低。鉴于PCA具有降维、除噪[25]的优势, 目前已有研究者将PCA引入SVM算法, 提高SVM的建模效率和稳定度, 并成功应用于土壤[26]、岩石[27]、柑橘叶[28]和蛋白质[29]等LIBS的分类研究中, 识别率分别达到100%, 91.33%, 97.5%和98%。然而, 将SVM与PCA结合用于LIBS鲜肉品种分类方面的研究鲜有报道。

本研究采用载玻片压制鲜肉样品的简单处理方法, 使用SVM辅助LIBS技术对猪肉、牛肉、鸡肉等6种不同品种的鲜肉进行快速、准确地分类识别, 并利用PCA算法优化SVM建模效率, 以期提高建模的速度和识别准确率, 从而证实了PCASVM方法对于识别鲜肉品种有较好的效果。

2实验部分

2.1实验装置

实验装置如图1所示, 采用调Q开关Nd∶YAG脉冲激光器(Quantel Brilliant B, 波长532 nm, 脉冲宽度8 ns, 最大重复频率10 Hz)。激光经过反射镜和平凸透镜(焦距为100 mm)聚焦到样品表面, 激发出等离子光谱。

2.2样品处理

本实验所采用的鲜肉样品为: 恩施土猪里脊肉(简称为恩施土猪)、黑猪里脊肉(简称黑猪)、中粮猪特级里脊肉(中粮集团有限公司, COFCO, 简称中粮猪)、牛里脊、牛后腿和鸡脯肉, 实验材料均购自当地超市。鲜肉组织制样的具体步骤为: (1)用医用切片刀将鲜肉组织切成长宽约为50 mm×18 mm、厚2~3 mm的小片, 放在普通载玻片(25.4 mm×76.2 mm)上; (2)用另一块载玻片压在肉片上, 并用10 kg重物将其压制1 min, 使得肉片平铺在下面的载玻片上, 压片效果如图2所示。(3)利用LIBS系统对制作好的样品进行光谱采集。

3Y果与讨论

3.1数据采集与提取

采用优化的实验参数, 能量30 mJ/脉冲, 频率5 Hz。光谱仪积累模式的采集参数: 曝光时间1 s, 积累次数为2, 采集延时时间为0.9 μs, 门宽为10 μs, 每幅光谱积累10个激光脉冲。每种鲜肉压制5个样品, 每样品采集30幅光谱, 因此6种鲜肉组织样品共获得900幅光谱数据。

为降低光谱强度的波动性的影响, 以生物组织基体元素C 247.86 nm光谱强度对其它元素谱线强度进行归一化处理。图3所示为牛里脊LIBS光谱强度归一化后的全谱图, 部分分析谱线位置也在全谱中予以标出。实验中所使用的49条谱线也在表1中列出。不同组织间部分主量元素归一化谱线强度的差异如表2所示。

由表2可知, 价格较低的中粮猪, 其归一化谱线Ca/C、Na/C、K/C、Al/C强度明显低于价格高的恩施土猪和黑猪; 而两种不同价格的牛肉其谱线Ca/C、Na/C、K/C、Al/C强度则高于恩施土猪和黑猪。这表明不同种鲜肉组织元素含量存在较大差异, 这为鲜肉样品的分类奠定了基础。

3.2主成分分析

主成分分析算法(PCA)是一种高效的信息压缩方法, 采用特征分解方法获得最大方差的主成分(PC)来代替原有变量, 可以消除原始数据的相关性和信息冗杂[31], 通过优化主成分个数代替原有变量个数进行数学建模, 提高建模速度和稳定度, 并使用得到的主要主成分对数据进行聚类分析。分析所用的PCA算法和SVM算法程序均在Matlab R2010b环境下实现。

获得的900幅组织光谱经谱线强度提取、C线归一化处理后, 对其进行PCA降维分析。图4为前3个主成分下不同种组织光谱的散点图, 所使用3个主成分的累计贡献率达到了95.79%。由图4可知, 除了部分牛里脊光谱数据在三维主成分图中可聚集到同一区域, 其它种类的鲜肉组织光谱交互在一起, 难以区分, 因此需结合其它算法进一步区分。

3.3SVM与PCASVM对比分析

支持向量机(SVM)是一种通过寻求结构化风险最小来提高学习机泛化能力的方法, 实现经验风险和置信范围最小化, 从而达到在取样少亦能达到良好统计规律的目的。其很重要的特点是可以将线性不可分的数据通过构造核函数的方式映射到高维空间中, 从而在高维空间得到线性区分[20]。本研究采用Chang等[32]开发的支持向量机软件工具箱(Library for Support Vector Machines, LIBSVM)进行数据分类处理。数据集等分为训练集和测试集。每个类别设置标签进行区分, 相同类使用相同的标签。因为内核选择的是映射径向基函数, 需要选择合适的惩罚参数C和径向基函数系数g才能获得较佳的预测结果。设置的方式和优化选择参数的方法详见文献[33], 不同的是本研究使用的是3折交互验证。

为使SVM分类模型更加稳健, 将每种鲜肉样品的150幅光谱数据随机排列, 选择前75幅光谱进行训练, 剩余的75幅光谱进行预测。在训练过程中使用交叉验证法选择最佳的惩罚参数C和内核参数g。结果表明, 单独的SVM模型平均训练、

在SVM算法中, 输入变量越多, 训练时间越长; 且难免存在变量共线性和光谱噪声的影响。因此采用PCA算法对原始变量进行线性组合对数据进行压缩, 去除多余的变量, 减弱光谱噪声影响。通过使用PCA算法对49个光谱变量重新组合得到新的49个主成分, 不同主成分变量数对SVM训练集识别结果的影响如图5所示, 主成分数分别在18, 19, 21, 28, 29, 30, 33时均可达到最佳的平均训练识别率88.22%。在同样的训练识别率下, 取最小数目的主成分个数可以加快SVM算法的建模效率, 因此本研究采用18个主成分进行建模和分类识别, 其平均预测识别率可达到89.11%, 高于未降维SVM的识别效果, 此时的(C, g)优化参数为(1024.00, 0.0030), 对比文献[22]中对猪肉、牛肉和鸡肉识别率, 提高了5.74%, 具体的识别结果如表3所示。SVM与PCASVM建模结果对比见表4, 在不降低SVM算法识别率的情况下, PCA算法的引入大大缩短了SVM建模的时间, 使得建模时间从89.11 s降至55.52 s。

4结 论

通过对6种鲜肉进行简单的载破片压制处理, 联合PCA和SVM算法对LIBS采集的光谱数据进行分析和建模, 提高了SVM的建模效率, 获得较好的识别效果, 其中建模时间缩短至55.52 s, 平均预测识别率达到89.11%。以上结果表明, LIBS结合PCA与SVM算法可以用于快速检测新鲜肉类品种, 为市场鲜肉的快速识别提供一种新途径。

References

1Rodríguez M A, García T, González I, Hernández P E, Martín R. Meat Sci., 2005, 70(1): 113-120

2Hites R A. Handbook of Instrumental Techniques For Analytical Chemistry, 1997: 609-626

3VallejoCordoba B, CotaRivas M. J. Capillary Electrophor., 1997, 5(56): 171-175

4Kumar A, Kumar R R, Sharma B D, Gokulakrishnan P, Mendiratta S K, Sharma D. Crit. Rev. Food Sci., 2015, 55(10): 1340-1351

5Radziemski L J. Spectrochim. Acta, 2002, 57(7): 1109-1113

6Radziemski L, Cremers D. Spectrochim. Part B, 2013, 87: 3-10

7CHEN QiMeng, DU Min, HAO ZhongQi, ZOU XiaoHeng, LI JiaMing, YI RongXing, LI XiangYou, LU YongFeng, ZENG XiaoYan. Spectroscopy and Spectral Analysis, 2016, 36(5): 1473-1477

启蒙, 杜 敏, 郝中骐, 邹孝恒, 李嘉铭, 易荣兴, 李祥友, 陆永枫, 曾晓雁. 光谱学与光谱分析, 2016, 36(5): 1473-1477

8Li C M, Zou Z M, Yang X Y, Hao Z Q, Guo L B, Li X Y, Lu Y F, Zeng X Y. J. Anal. Atom. Spectrom., 2014, 29(8): 1432-1437

9LI JiaMing, CHU YingBo, ZHAO Nan, ZHOU Ran, YI RongXing, GUO LianBo, LI JinYan, LI XiangYou, ZENG XiaoYan, LU YongFeng. Chinese J. Anal. Chem., 2016, 44(7): 1042-1046

李嘉铭, 褚应波, 赵 楠, 周 冉, 易荣兴, 郭连波, 李进延, 李祥友,曾晓雁, 陆永枫. 分析化学, 2016, 44(7): 1042-1046

10SHAO Yan, ZHANG YanBo, GAO Xun, DU Chuang,LIN JingQuan. Spectroscopy and Spectral Analysis, 2013, 33(10): 2593-2598

邵 妍, 张艳波, 高 勋, 杜 闯, 林景全. 光谱学与光谱分析, 2013, 33(10): 2593-2598

11LIU Li. Las. Optoelect. Prog., 2015, 52(7): 295-299

刘 莉. 激光与光电子学进展, 2015, 52(7): 295-299

12Zeng Q, Guo L, Li X, He C, Shen M, Li K, Duan J, Zeng X, Lu Y. J. Anal. Atom. Spectrom., 2015, 30(2): 403-409

13Hao Z, Guo L, Li C, Shen M, Zou X, Li X, Lu Y, Zeng X. J. Anal. Atom. Spectrom., 2014, 29(12): 2309-2314

14Sun L X, Yu H B, Cong Z B, Xin Y, Li Y, Qi L F. Spectrochim. Acta B, 2015, 112: 40-48

15Rehse S, Salimnia H, Miziolek A. J. Med. Eng. Technol., 2012, 36(2): 77-89

16CHEN TianBing, LIU MuHua, HUANG Lin, ZHOU HuaMao, WANG CaiHong, YANG Hui, HU HuiQin, YAO MingYin. Chinese J. Anal. Chem., 2016, 44(7): 1029-1034

陈添兵, 刘木华, 黄 林, 周华茂, 王彩虹, 杨 晖, 胡慧琴, 姚明印. 分析化学, 2016, 44(7): 1029-1034

17Liu X Y, Zhang W J. J. Med. Biol. Eng., 2008, 1(3): 147

18Yao M, Huang L, Zheng J, Fan S, Liu M. Opt. Laser. Technol., 2013, 52: 70-74

19Singh V K, Rai A K. Laser Med. Sci., 2011, 26(5): 673-687

20Kumar A, Yueh F Y, Singh J P, Burgess S. Appl. Optics, 2004, 43(28): 5399-5403

21Yueh F Y, Zheng H, Singh J P, Burgess S. Spectrochim. Acta B, 2009, 64(10): 1059-1067

22Bilge G, Velioglu H M, Sezer B, Eseller K E, Boyaci I H. Meat Sci., 2016, 119: 118-122

23Cortes C, Vapnik V. Mach. Learn., 1995, 20(3): 273-297

24Yu Y, Guo L, Hao Z, Li X, Shen M, Zeng Q, Li K, Zeng X, Lu Y, Ren Z. Opt. Express, 2014, 22(4): 3895-3901

25Shi Q, Niu G, Lin Q, Xu T, Li F, Duan Y. J. Anal. Atom. Spectrom., 2015, 30(12): 2384-2393

26Yu K Q, Zhao Y R, Liu F, He Y. Sci. Rep., 2015, 6: 27574-27574

27Yang H X, Fu H B, Wang D H, Jia J W, Dong F Z. Chinese Phys. B, 2016, 25(6): 290-295

28Sankaran S, Ehsani R, Morganc K T. Appl. Spectrosc., 2015, 69(8): 913-919

29Pokrajac D, Lazarevic A, Kecman V, Marcano A, Markushin Y, Vance T, Reljin N, McDaniel S, Melikechi N. Appl. Spectrosc., 2014, 68(9): 1067-1075

30Pearse R W B, Gaydon A G, Pearse R W B, Gaydon A G. The Identification Of Molecular Spectra (Chapman and Hall London), 1976, Vol. 297

31YIN Fei, FENG DaZheng. Comput. Technol. Dev., 2008, 18(10): 31-33

尹 飞, 冯大政. 计算机技术与发展, 2008, 18(10): 31-33

32Chang C C, Lin C J. Acm. T. Intel. Syst. Tec., 2011, 2(3): 27

33YU Yang, HAO ZhongQi, LI ChangMao, GUO LianBo, LI KuoHu, ZENG QinDong, LI XiangYou, REN Zhao, ZENG XiaoYan. Acta. Phys. Sin, 2013, 62(21): 215201-215201

于 洋, 郝中U, 李常茂, 郭连波, 李阔湖, 曾庆栋, 李祥友, 任 昭, 曾晓雁. 物理学报, 2013, 62(21): 215201-215201

AbstractTo improve the classification accuracy of fresh meat species using laserinduced breakdown spectroscopy (LIBS), the support vector machine (SVM) and principal component analysis (PCA) were combined to classify fresh meat species (including pork, beef, and chicken). A simple sample preparation to flatten fresh meat by glass slides was proposed. For each meat sample, 150 spectra were recorded and randomly arranged. The first 75 spectra were used to train a model while the others were used for model validation. By analyzing the 49 normalized spectral lines (K, Ca, Na, Mg, Al, H, O, etc.) in the different tissues, the classification model was built. The results showed that the dimensionality of input variables was decreased from 49 to 10 and modeling time was reduced from 89.11 s to 55.52 s using PCA, thus improving the modeling efficiency. The mean classification accuracy of 89.11% was achieved. The method and reference data are provided for further study of fresh meat classification by laserinduced breakdown spectroscopy technique.

KeywordsLaserinduced breakdown spectroscopy; Support vector machine; Principal component analysis; Tissue classification

上一篇:优化问题设计开展分组讨论 下一篇:气相色谱燃烧同位素比值质谱法分析氨基酸氮稳...