一种基于近红外光谱的常用塑料分类方法

时间:2022-07-12 10:42:21

一种基于近红外光谱的常用塑料分类方法

摘要:塑料制品以其质轻、美观实用等特点广泛应用在日常生活及各行各业中,其大量使用给环境造成了严重污染,消除污染最积极的办法是对其进行回收再利用,但常用塑料的种类繁多,不同塑料制品的成分及可塑性不同,进行回收利用的价值也不同,只有对塑料进行分类收集处理,才能提高回收利用率。本文基于近红外光谱法提出了一种塑料分类的新方法。该方法选择测定了60个样本的近红外光谱数据,引入支持向量机算法对其进行训练预测:选用40个样本作为训练集,建立模型;20个作为预测集,优化模型;利用该模型对采集的未知样本进行分类预测,得到较高的准确率。新方法对快速处理废旧塑料具有积极的作用。

关键字:近红外光谱;塑料;支持向量机;分类;

引言

近年来,随着塑料工业的不断发展,塑料制品已成为人们日常生活中不可或缺的组成部分,因具有质轻、外观美、加工方便、经济实用等特点推动了工农业的持续发展和当代高科技的兴起;塑料制品的大量使用也给环境造成了严重污染,影响生态健康及人体健康,同时也造成了一定的资源浪费。从保护环境、资源的综合利用角度考虑,对塑料制品的回收利用是我国当前的首要途径。由于塑料种类繁多,不同种类的塑料性质和用途不相同,按材质分类收集处理以提高利用率。对常用塑料的分类方法很多,较近代的有外观鉴别法、燃烧法、静电法,光学法、紫外光谱法、拉曼光谱法、中红外(MIR)法及近红外(NIR)法,其中NIR法是最吸引人的先进技术之一[1,2]。

近红外光谱分析技术是20世纪90年代以来发展最快、最引人注目的技术,以不破坏样品、操作简单、稳定性好等特点应用于农业、工业等领域。将近红外光谱技术应用于对塑料制品的分类,已经成为研究热点之一。本文对塑料样本采集红外光谱数据,引入支持向量机算法对塑料样本进行分类预测,得到较高的准确率和处理速度,具有很好的应用前景。对塑料制品能正确快速的分类,既促进废旧塑料分类投放及收集,又节约分选归类所需的大量人力、物力及资金,对减轻生活垃圾的处理,消除“白色污染”、保护环境、节约能源、资源综合利用具有深远意义。

1.方法研究的理论基础

1.1.近红外光谱分析技术

近红外光谱是指物质在近红外区的吸收光谱。其波长范围介于可见光与中红外光之间的电磁波,美国材料检测协会定义其波长范围为780~2526nm,波数范围为12820~3959cm-1。近红外区的吸收是低能电子跃迁以及含有氢原子的原子团如C-H、O-H、N-H等的倍频和合频所产生的。它对醇、酚、胺、不饱和碳氢化合物,某些高分子以及其它含C-H、O-H、N-H原子团的化合物的定量分析很适宜。近红外光谱图稳定,获取比较容易,因此被誉为分析的巨人。

近红外光谱技术是一项综合了光谱学和化学计量等方面知识的样品的现代分析技术,与传统的技术相比,现代近红外光谱技术具有测定速度快、效率高、设备简单易于维护、无需对样本进行前处理、检测成本低、环境污染小等特点,已广泛应用于各个领域。光纤的介入更使得近红外光谱技术可以在恶劣的环境和危险环境下进行在线过程分析及控制。目前近红外光谱技术已经应用在农业、食品工业分析、石油化工等领域[3,4,5]。

1.2.支持向量机算法[6,7]

支持向量机(SVM)是一种模式识别方法,是建立在结构风险小和统计学习理论的VC维理论基础上的,主要研究如何从一些观测数据中挖掘出目前尚不能通过原理分析得到的规律,并利用这些规律去分析客观对象,对未知数据或无法观测的新数据进行预测和判断的一种算法。与传统的统计学相比,支持向量机是一种专门研究小样本情况下机器学习规律的理论,避免了人工神经网络等方法的网络结构选择、过学习和欠学习以及局部极小等问题,已在模式识别、信号处理、函数逼近等领域得到了应用。此外,支持向量机是一个凸二次优化问题,能够保证找到的极值解是全局最优解,它是一种优秀的基于数据的机器学习方法,目前处于不断发展阶段。

SVM是从线性可分情况下的最优分类面发展而来的,基本思想是建立一个超平面作为决策曲面,使得正反比例的隔离边缘被最大化,保证最小分类错误率。

对于线性可分情况,两类n维样本向量(,),(,)…(,){+1,―1},线性判别函数为:

(1-1)

将判别函数进行归一化,使两类所有样本都满足,此时离分类面最近的样本的,要求分类面对所以样本都能正确分类,即满足:

i=1,…,n(1-2)

此时分类间隔等于,间隔最大等价于最小。满足式(2-2)且使最小的分类面就是最优分类面。定义如下的Lagrange函数:

(1-3)

式中,为Lagrange乘子。为求式(1.2-3)的最小值,分别对求偏微分并令它们等于0,在利用结构风险最小原则时,优化目标选择松弛因子允许错分样本存在,此时的分类面满足:

―松弛因子。当0

C为惩罚因子,为某个指定的常数,起到控制对错分样本惩罚程度的作用,实现在错分样本的比例和算法复杂程度之间的折衷。

根据约束条件,可以将上述最优分类面的求解问题转化为如下的凸二次规划寻优的对偶问题:

对于非线性分类问题,若在原始空间中的简单最优分类面不能得到满意的分类结果,SVM的解决思路是利用核函数,这一特点解决了算法中维数灾难问题。判别函数中只包含未知向量与支持向量机内积的线性组合,通过非线性变换将输入空间换到一个高维空间,然后在这个空间中求广义的最优分类超平面,然后进行分类,而计算复杂度却没有增加,此时的目标函数为:

概括的说,支持向量机就是首先通过用核函数定义的非线性变换将输入空间变换到一个高维空间,然后在这个空间求广义的最优分类面。

2.实验部分

2.1仪器部分

采用的仪器是NicoletMagnaIR-750型傅立叶变换红外光谱仪。该型号仪器具有不破坏样品情况下对样品直接测量的特点,可以快速准确地对复杂样品单组分进行定量分析,在测量开始之前需要提前搭设透射器件。该仪器适用于中红外和近红外光谱测量,在开机后经过一段时间的稳定和校正后,调整到可进行近红外光谱测量的状态后就可以对样本进行测量。采集系统如图1所示。

2.2样本采集及实验方法

利用光谱仪对收集的样本进行近红外光谱采集,通过仪器中相应的处理软件获取红外光谱图,采集到的数据输送到计算机中,通过软件编写算法对光谱数据的处理,数据处理部分采用matlab软件进行编写。在算法处理部分中,引入支持向量机算法,在60组样本数据中,选出40组作为训练集,事先知道训练样本所属的类别,然后设计分类器,再用该分类器对测试样本进行识别,进而也对模型进行优化,得到分类结果,支持向量机处理的示意图如图2图2.SVM训练和分类过程

本文中对生活中常见的4种塑料进行分类,样本来自生活中收集的各种塑料样本和购买的不含其他添加剂的标准样本,采集的光谱图如图3所示:

2.3光谱数据预处理和特征提取

在光谱获取的过程中,各种随机噪声、仪器漂移等对样本造成一定的影响,为了消除这些影响,需要对光谱数据进行预处理。对数据进行归一化和滤波,滤波的方法有均值滤波、中值滤波、高斯滤波等方法,本系统主要的噪声是高斯噪声,通过高斯噪声滤除噪声,提高了数据质量,将经过预处理的近红外光谱数据进行特征提取,因为物质内部的分子结构存在差异,不同分子的塑料样本会在近红外谱段的不同位置产生吸收峰,因此在样本多个吸收峰位置共同表征了该种样本的属性和特征,特征提取对于判定塑料属性十分重要,采用差分处理,根据差值正负符号的变化寻找光谱吸收峰位置[8]。

未知样本的采集光谱图及数据处理后的光谱图如图4所示:

图4未知样本及处理谱图

在图a中,曲线在1210.5nm,1419.4nm,1720.8nm附近有明显的吸收峰存在,但是谱线仍存在大量细小的峰值,对实验数据进行预处理,消除这些细小的毛刺,得到效果图b,然后再用支持向量机识别方法对其判别属于哪一种塑料成分。

2.4核函数的选择

在支持向量机分类方法中主要是用核函数定义的非线性变换将输入空间变换到一个高维空间,然后在这个空间求广义的最优分类面。Mercer定理将核函数解释为特征空间的内积,在本文中选择用高斯径向基核函数,原因主要有:

高斯径向基核函数具有良好的通用性,其有效性也已经在众多应用中得到证明。

2)对于分类,最终的判决式都是在多变量高斯分布下推导出来的,当数据服从多变量高斯正态分布时,将具有很好的处理效果,而高斯径向基核函数映射的数据在高维空间能够呈现较好的正态特征;

2.51-v-1SVMs

SVM最初是用于解决二分类问题,不能直接用于多类分类,但是对于塑料的分类是属于多类分类,本文章中采用了一对一分类方法来解决,该方法在每两类间训练一个分类器,对于一个k类问题,就有k(k-1)/2个分类器,每个分类器都对其类别进行分类,并为相应的类别投票,最后得到票数最多的类别即为该样本的类别[9]。

3.结果及讨论

本文中选用四种常见塑料进行分类,pp,pet,pe,pvc,根据一对一原则组成6个训练分类器,然后采取投票形式进行最终的结果判决,得票最多的一项就是与未知塑料成分相同,6个分类器如下:

X1=[pe;pvc]X2=[pe;pp]X3=[pe;pet]X4=[pvc;pp]X5=[pvc;pet]X6=[pp;pet]

用svc函数寻找训练样本的最优面,函数如下:[nsvalphalbias]=svc(X,Y,ker,C)

预测函数:predictedY=svcoutput(X,Y,testX,ker,alpha,bias)

对上述采集的未SVM 分类器1 分类器2 分类器3 分类器4 分类器5 分类器6

训练集 PP PET PP PVC PP PE PE PET PE PVC PVC PET

训练集标签 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1

分类结果 1 1 1

投票 1 1 1 由上表可知PET得票最多为3票,未知成分塑料判定为是PP。

支持向量机求解的是一个凸二次规划,所得解是唯一的最优解,对解决小样本、非线性等实际问题,具有很强的泛化能力,在本文中用大量已知样本建立数据库,并对训练模型进行优化,然后用支持向量机算法对未知样本进行预测,准确率达到85%以上,效果比较显著,时间也相对较短,符合快速检测塑料种类的要求,具有很大的应用潜力。

4.结语

支持向量机是一种专门研究小样本情况下机器学习规律的理论,是一种优秀的基于数据的机器学习方法,目前处于不断发展阶段,本文基于近红外光谱技术法结合支持向量机算法对常用塑料进行分类,并得到了很好的效果,说明支持向量机在小样本、多分类问题上具有很强的泛化能力,为分类提供了一种解决方法,有很好的应用前景。对快速处理废旧塑料,提高资源综合利用方面起到了积极的作用。

参考文献

[1]童晓梅.废旧塑料种类鉴别方法讨论.塑料科技,2007,35(3)

[2]刘荣忠,刘俊松.用红外光谱鉴定塑料成分.塑料科技,2008,36(6)

[3]陆婉珍,袁洪福,徐广通.现代近红外光谱分析技术.北京:中国石化出版社,2000.

[4]张晓曼,戴连奎.光谱学与光谱分析.2008,28(12):2847

[5]王多加,周向阳,金同铭等.近红外光谱检测技术在农业和食品分析上的应用.光谱学与光谱分析.2004,24(4):447

[6]杨淑莹.模式识别与智能计算.北京:电子工业出版社,2009,133-137

[7]白鹏,张喜斌等.支持向量机理论及工程应用实例.西安:西安电子科技大学出版社,2008

[8]李庆波,黄彦文,张广军等.光谱学与光谱分析.2009,29(12):3275

[9]刘志刚,李德仁等.支持向量机在多分类问题中的推广.计算机工程与应用,2004

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文

上一篇:浅析无伸缩缝桥梁的影响因素和应用 下一篇:关于往复式压缩机振动消减措施的探讨