汽车尾气在自组织特征映射下的排放水平评估方法

时间:2022-09-23 12:52:24

汽车尾气在自组织特征映射下的排放水平评估方法

摘 要:针对汽车尾气的非线性数据聚类问题,提出一种在自组织特征映射(Self-Organizing Map,SOM)下的聚类方法来评估汽车的排放水平。根据汽车在城区真实环境中的行驶速度设置SOM神经网络中的神经元个数,通过神经元之间拓扑相关的学习方式,自动形成具有数据原始属性的有序映射,实现不同排放水平的尾气数据聚类。为避免网络训练过程中出现训练死区的现象,竞争学习采用弹性邻域半径代替固定邻域半径,自适应地缩放学习区域。以某轻型车的THC和CO2排放数据为对象的数值试验结果表明,采用弹性邻域半径的SOM神经网络的聚类准确性优于采用固定邻域半径的SOM神经网络,能有效评估汽车尾气排放水平。

关键词:汽车尾气;自组织特征映射(SOM);竞争学习;聚类分析

中图分类号:U467.5+21文献标文献标识码:A文献标DOI:10.3969/j.issn.2095-1469.2013.05.06

持续增长的汽车保有量给城市发展带来各种形式的环境压力,特别是其尾气排放所引起的空气污染问题[1]。大量文献指出汽车尾气会给人类健康造成许多负面影响,并且随着暴露在这些污染物中的人群数量的增加,这些负面影响在城市中日益加剧[2-3],

于是针对汽车尾气更严格的排放标准[4]得以实施。为满足这一新标准,学术界和工程界的专家学者提出许多方法和技术以降低汽车尾气中有害气体的排放量[5-6]。然而,极少有研究从“大数据”的角度[7]关注汽车尾气的污染评估模型。事实上,职能监管部门更关心的是在真实行驶条件下对汽车尾气排放的大数据进行分析,借此评估汽车尾气对城市环境的影响程度,进而为新标准的有效执行提供决策依据。

由于燃料在发动机中的物理化学反应极其复杂,加之车辆驾驶方式因人而异,以及车辆行驶环境的多样性,导致汽车排放的尾气具有复杂的非线性、时变性和随机性等特征,从而使基于发动机中物化反应原理的汽车尾气排放模型无法满足对排放水平高可靠分析的需要。作为一种非线性数据分析工具,神经网络广泛应用于数据分析的各个领域[8]。事实上,通过分析汽车尾气数据以实现对排放水平的评估,本质上可看成是一个数据聚类问题。众所周知,自组织映射神经网络(Self-Organizing Map Network,SOM NN)在数据的聚类、分类问题中得到广泛关注,并取得良好的应用效果[9-10]。然而,SOM网络所采用的固定邻域半径的学习方式容易造成训练“死区”,使某些神经元无法得到合适的训练,进而影响数据聚类、分类的准确性[11-12]。

针对上述问题,本文提出一种在自组织特征映射下的汽车尾气排放水平评估方法。该方法将汽车尾气按不同的城区行驶速度划分为不同的排放种类,每种行驶速度对应着一种排放水平,通过SOM神经网络的拓扑有序映射将高维的排放数据映射到一个二维的特征空间,以描述汽车在真实条件下不同速度的排放水平。为提高数据聚类的准确性,在SOM神经网络采用的固定邻域半径的基础上,通过引入权值与输入向量之间的夹角来定义一种新的弹性邻域半径。该弹性邻域半径可自适应地缩放竞争层神经元的学习区域,避免这些神经元因权值在初始化过程中离输入向量太远而进入训练死区。

1 具有弹性邻域半径的SOM神经网络

由于SOM神经网络中邻域半径的更新过程采用固定的缩放方式,使网络训练容易形成训练死区,为了提高对汽车排放数据聚类的准确性,本文提出一种具有弹性邻域半径的SOM神经网络。该网络的拓扑结构与Kohonen提出的SOM网络相同,只是在竞争学习过程中采用弹性邻域半径来缩放学习区域。

1.1 SOM神经网络的拓扑结构

荷兰学者Kohonen提出的自组织特征映射,本质上属于一种无监督竞争学习的动态映射方式[13-15]。由此产生的SOM神经网络中,一次仅有一个神经元被“激活”。图1给出了这种网络常用的拓扑结构(从一维的输入到二维的映射输出),其基本思想是:来源于原始事件空间中的输入信号被由自适应单元所构成的简单网络接受,输入信号以某种表示方式被自动映射为一系列输出响应,这种输出响应保持了与原始事件相同的拓扑排序的方式。因此,SOM神经网络能自动形成对事件属性的正确拓扑映射。换言之,SOM神经网络能以拓扑有序的方式,将任意维数的输入模式变换成一维或二维的特征映射[16-17]。

值得指出的是,在图1所示的结构中,即使输出神经元之间没有侧向连接,但与输入具有最佳匹配的神经元(即获胜神经元)邻域内的其它神经元被更新,使这个邻域内的神经元与其以前所处的状态相比,更像获胜神经元那样响应。网络中的神经元并不是以相互独立的方式,而是以拓扑相关的方式进行学习。这种学习方式对于形成有序映射来说是至关重要的。

1.2 改进的竞争学习算法

SOM神经网络的竞争学习算法可通过下述推导加以描述。图1中的SOM神经网络的输入可写成向量形式。

二维阵列中的神经元i的突触权值向量由下式给出。

式中,m是二维阵列中的输出神经元总数。在Kohonen的竞争学习算法中,输入向量x与突触权值向量wi的最佳匹配由下式确定。

这里的q(x)表示输出神经元阵列的索引,特别指定为获胜神经元,是欧几里德范数,也是获胜神经元所在的邻域半径。然而,这种固定邻域半径容易形成训练死区,使某些神经元因初始权值向量离输入向量太远以至于它从未在竞争中获胜,即从未参与竞争学习而形成毫无用处的死神经元。为此,本文提出一种弹性邻域半径ri(k),并将其定义为

式中,表示Kohonen的竞争学习中的固定半径,而是输

入向量与竞争层神经元权值之间的相似系数。当输入向量与权值相似较大时,会放大邻域半径,扩大竞争学习区域;当相似较小时,会缩小邻域半径,使竞争层神经元尽快进入学习区域。

那么,输入向量x与突触权值向量wi的最佳匹配可以定义为

式中,。竞争学习算法的下一步是更新与获胜神经元相联系的突触权值向量和获胜神经元的确定邻域内的神经元的突触权值向量。相应的学习规则可表示为

式中,学习率参数0

2 数值试验

为验证本文所提方法的有效性,本节选取一种轻型车在真实行驶条件下的不同批次排放测试数据为对象开展数值试验。通过SOM神经网络的拓扑有序映射,将排放数据按照不同速度的行驶模式聚类,每种行驶模式所得到的数据种类便代表了一种排放水平。

2.1 数据介绍

数值试验所使用的排放数据来源于一种轻型车按国家标准GB 18352.3―2005进行的测试。根据该标准,从同种类型的轻型车抽样出若干样本,驾驶这些抽样的轻型车分别在城市和郊区环境中按照指定速度行驶,最终获取该类汽车在相同行驶条件下不同车次的排放数据。图2给出了汽车尾气排放数据采集过程。其中,城区环境分为4个循环单元,每个单元的速度设置相同,并都采集195个数据样本;而郊区环境仅采集400个数据样本,整个数据长度为1 180个样本点。在同一辆车的1 180个数据样本中,所测试的排放气体包括以下几种类型:COL(g/100 km)、NOx(g/100 km)、THC(g/100 km)和CO2(g/100 km)。

需要指出的是,上述指标的排放数据并未全部在本文中使用。事实上,通过分析数据的组合分布,最终选择的排放指标为THC(g/100 km)和CO2(g/100 km)。此外,由于城区的污染较为严重,因此本文关注车辆在城区环境的排放情况,而车辆在郊区的排放数据不予考虑。图3给出了数值试验中所采用的THC和CO2数据样本。

图3中的所有数据均为同种轻型车的5辆车在相同的真实条件下进行1次测试得到的排放数据。这些数据在归一化之后,将被提交给SOM神经网络以完成网络的训练。

2.2 网络训练

根据图3所示的数据采样过程,这类轻型车的排放情况按照市区运转循环单元中的速度条件可分为12类。因此,SOM神经网络的神经元个数设置为12,每个神经元的输出代表一种排放水平。训练过程可按如下步骤完成。

(1)将输入的排放数据样本归一化到[-1,1]之间,并随机初始化网络的权值,设置学习率参数为1,邻域初值为1。

(2)指定500次的学习次数为停止条件,检查停止条件,如果失败,则继续,如果成功,则退出。

(3)对于每个训练样本,执行(4)~(7)步。

(4)按照式(5)计算与输入向量匹配最好的权值向量。

(5)按照式(6)更新计算权值向量。

(6)调整学习率参数。

(7)适当缩减拓扑邻域Nq(k)。

(8)设置kk+1,然后转到步骤(2)。

需要说明的是,为使本文的方法更具说服力,采用固定邻域半径的SOM神经网络在相同数据集的基础上,除输入向量最佳匹配按式(4)计算外,同样按照上述步骤完成数值试验。基于固定邻域半径和弹性邻域半径的SOM神经网络的训练结果由图4给出。

图4中的数据类别与汽车尾气排放水平一一对应,只要确定排放数据的种类便能确定其相应的排放水平。从图4所示的训练结果来看,采用固定邻域半径的SOM神经网络在排放数据的聚类中明显出现数据类别(排放水平)的混叠现象。例如,图4(b)中具有排放水平4~6的尾气数据聚类中出现不同程度的混叠。其中,数据种类5与数据种类6的混叠较为严重,导致部分具有排放水平5和排放水平6的数据区分出现错误。因此,相比于图4(a)所示的采用弹性邻域半径学习的聚类效果而言,图4(b)中所示的采用固定邻域半径学习的SOM神经网络较差。

为进一步分析两种学习方式的训练结果,带有距离分布的竞争层神经元拓扑结构由图5给出。

图5中的蓝色六角形代表神经元,红线为各神经元之间的连接线,而包含红线的菱形表示各神经元之间距离的远近,从黄色到黑色,随着颜色加深距离越近。图中神经元编号从左下角开始(0,0)为1号神经元,右下角(0,3)为4号神经元,第2行第4列(1,3.5)为5号神经元,依次类推,左上角(0,1.75)为12号神经元。从图5(a)所示的拓扑结构可看出,在采用弹性邻域半径的SOM神经网络中,竞争层的各个神经元彼此隔离,距离较远,各个数据类别能较好地分开。而图5(b)所示的采用固定邻域半径的SOM神经网络中,4~5与5~6号神经元的距离较近,导致排放数据所对应的类别相互纠缠。这也正是图4中混叠现象出现的原因。

2.3 网络测试

完成SOM神经网络的训练后,选取第1辆车和第2辆车在相同条件下的另一次排放测试数据分别提交给采用弹性邻域半径和固定邻域半径的SOM神经网络。图6给出了两种学习方式下的聚类结果。

从图6(a)与图6(b)的对比结果来看,采用固定邻域半径的SOM神经网络聚类效果低于采用弹性邻域半径的SOM神经网络。图6(b)清晰地显示出排放水平5和排放水平6存在着混叠,也就是说原本属于排放水平5的数据被错误地划分到排放水平6中。类似的,具有排放水平4的数据也被错误地划分到排放水平5中。这与网络的训练结果相吻合。值得注意的是,在测试中,排放水平2与排放水平3也出现了混叠,这是由于网络的泛化性能不足造成的。解决该问题的一个有效途径是增加训练回合数,但这会增加时间的消耗。从这一点来说,采用弹性邻域半径的SOM神经网络在与采用固定邻域半径的SOM神经网络保持相同聚类准确度的条件下,前者需要的训练回合数更少。表1给出了在数值试验中,两种学习方式进行排放数据聚类的总体比较情形。

从表1看出,在网络设置相同的前提下,采用弹性邻域半径学习的SOM神经网络在网络训练与测试的过程中,对排放数据的聚类效果都要优于采用固定邻域半径学习的SOM神经网络网络。在网络测试过程中的数据样本总数为3 900个,在网络测试过程中的数据样本为1 560个。其中,采用弹性邻域半径的学习方式下,网络训练过程中聚类正确的样本个数为3 587,测试过程中聚类正确的样本个数为1 410;采用固定邻域半径学习方式下,网络训练过程中聚类的样本个数为3 452,测试过程中聚类正确的样本个数为1 348。因此,在训练过程中,采用弹性邻域半径和固定邻域半径的网络训练过程中的聚类正确率分别为91.97%和88.51%,而测试过程中的聚类正确率分别为90.38%和86.41%。

3 结论

本文提出了一种基于SOM神经网络的汽车尾气排放水平的评估方法,其主要贡献在于通过引入相关系数来设计弹性邻域半径,进而自适应地更新竞争层神经元的学习邻域,避免这些神经元陷入训练死区,以提高对汽车排放数据聚类的准确性。在数值试验中,根据汽车在城区行驶的不同速度将排放数据分为不同的类,每个数据类代表一种排放水平。通过与采用固定邻域半径的SOM神经网络的对比,以某轻型车排放数据为对象的数值试验结果表明,采用弹性邻域半径的SOM神经网络对于汽车尾气排放水平的评估具有较高的准确性。

参考文献(References)

PANDIAN S,GOKHALE S,GHOSHAL A K. Evaluating Effects of Traffic and Vehicle Characteristics on Vehicular Emissions Near Traffic Intersections[J]. Transportation Research Part D,2009(14):180-196.

POPE C A,DOCKERY D W. Health Effects of Fine Par-ticulate Air Pollution:Lines That Connect[J]. Journal of Air and Waste Management Association,2006(56):709-742.

MEISTER K,JOHANSSON C,FORSBERG B. Estimated Short-Term Effects of Coarse Particles on Daily Mortality in Stockholm,Sweden[J]. Environmental Health Perspectives,2011(120):431-436.

GB 18352.3―2005. 轻型汽车污染物排放限值及测量方法[S]. 北京:中国标准出版社,2005.

GB 18352.3―2005. Limits and Measurement Methods for Emissions from Light-Duty Vehicles(Ⅲ,Ⅳ)[S]. Beijing:

China Standard Press,2005. (in Chinese)

ZAMBONI G,CARRARO C,CAPOBIANCO M. On-road Instantaneous Speed Measurements on Powered Two-Wheelers for Exhaust Emissions and Fuel Consumption Evaluation[J]. Energy,2011(36):1039-1047.

WEILENMANN M F,SOLTIC P,HAUSBERGER S. The Cold Start Emissions of light-Duty-Vehicle Fleets: a Simplified Physics-Based Model for the Estimation of CO2 and Pollutants[J]. Science of the Total Environment, 2013(444):161-176.

VIKTOR M, KENNETH C.大数据时代:生活、工作与思维的大变革[M]. 盛杨燕,周涛,译.杭州:浙江人民出版社,2012.

VIKTOR M,KENNETH C. A Revolution That Will Transform How We Live,Work,and Think[M]. Sheng Yangyan,Zhou Tao,Translate. Hnagzhou:Zhejiang People's Publishing House,2012.(in Chinese)

HYV?RINEN A,OJA E. Independent Component Analy-sis:Algorithms and Applications[J]. Neural Networks,2000,13 (4-5):411- 430.

GHASEMINEZHAD M H, KARAMI A. A Novel Self-Organizing Map(SOM) Neural Network for Discrete Groups of Data Clustering[J]. Applied Soft Computing, 2011,11(4):3771-3778.

HSU K C,LI S T. Clustering Spatial Temporal Precipi-tation Data Using Wavelet Transform and Self-Organizing Map Neural Network[J]. Advances in Water Resources,2010,33(2):190-200.

MAY R J,MAIER H R,DANDY G C. Data Splitting for Artificial Neural Networks Using SOM-Based Stratified Sampling[J]. Neural Networks,2010,23(2):283-294.

JIANG X,LIU K,YAN J,et al. Application of Improved SOM Neural Network in Anomaly Detection[J]. Physics Procedia,2012(33):1093-1099.

KOHONEN T. Self-Organized Formation of Topologically Correct Feature Maps[J]. Biological Cybernetics,1982, 43(1):59-69.

KOHONEN T. The Self-organized Map[J]. IEEE Procee-dings,1990(78):1464-1480.

KOHONEN T. Self-organization and Associative Memory

(3rd ed.)[M]. Berlin:Springer Verlag,1989.

华.量子计算在动态递归与自组织神经网络中的机理及应用研究[D].重庆:重庆大学,2012.

Li Penghua.Study on the Mechanism for Dynamic Recur-sive & Self-Organizing Neural Networks Using Quantum Computing and Its Application[D]. Chongqing:Chongqing University,2012. (in Chinese)

华,柴毅,熊庆宇,等.污水处理过程的QSOM出水水质预报[J].重庆大学学报(自然科学版), 2012,35(8):72-79.

Li Penghua,Chai Yi,Xiong Qingyu,et al. Prognoses of Inlet Water Quality via QSOM in Wastewater Treatment Processes[J]. Journal of Chongqing University(Natural Science),2012,35(8):72-79.(in Chinese)

上一篇:基于AMESim的轻型客车采暖系统的改进 下一篇:语文阅读教学对于培养学生想像力的重要性