基于动态数据驱动的泸州市空气质量指数适应性建模预测研究

时间:2022-09-03 04:10:44

基于动态数据驱动的泸州市空气质量指数适应性建模预测研究

【摘 要】环保监测数据的更新是一个不断变化的动态过程,随着数据量的增加,数据所反映的信息也更加完善,给人民的生活和生产带来了重要的影响。利用灰色GM(1,1)系统建模理论和新陈代谢建模原理,建立基于动态数据驱动的灰色GM(1,1)新陈代谢模型。该模型根据空气质量指数的动态数据更新,去掉旧数据加入新数据,弱化了对数据服从怎样统计规律这一要求,避免了模型与数据统计规律不适应的难题,使得模型预测精度较传统GM(1,1)、线性模型及BP神经网络模型要好得多。

【关键词】空气质量 GM(1,1)模型 线性模型BP 神经网络

【中图分类号】TV139.1 【文献标识码】A 【文章编号】1674-4810(2015)27-0032-02

空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的无量纲指数,通过空气质量指数的变化可直观地评价大气环境的质量状况,并对空气污染的控制和管理进行指导。目前,我国已有367个城市建立了全国城市空气质量日报和小时报制度,实时公布相应城市的空气质量指数、级别和首要污染物,为工农业生产和人民生活提供帮助。因此,对空气质量指数的预测研究在实际生产和生活中显得非常重要。

一 模型选择分析

目前,监测部门对环境监测数据只是在实时更新相关环境指标数据,没有对其相应的指标进行预测,这给人民生活和工业生产造成了一定的影响。例如,居民如果不知道明天的PM2.5的预测浓度,也就不能对明天的生活进行合理地安排。环保部门没有对未来几天空气质量指数及空气污染指数的预测数据,从而不能对一些工业生产进行有效地控制,一定程度上造成处于被动的局面。

对空气质量指数的预测研究大多利用统计学知识从大量数据中找到数据变化规律,再利用此规律找到匹配的数学模型。采用较多的预测模型主要有线性回归模型、自回归求和滑动平均模型(ARIMA)、自回归条件异方差类模型(ARCH类)、神经网络方法、灰色预测模型。这些模型存在两方面的不足:一是这些模型建模过程中的数据均固定不变,没有体现数据的不断更新;二是在选模型之前首先统计分析数据规律,若得出的规律与模型的适用性不匹配则仍用该模型进行建模预测难度较大,模型选择失效。

为克服这两点不足,将动态数据驱动原理与新陈代谢理论相结合,建立基于动态数据驱动的灰色GM(1,1)新陈代谢模型,该模型在不断补充新信息的同时,要及时地去掉旧信息,使数据不断更新;同时,该模型解决了建模运算量不断增大的困难,GM(1,1)模型对数据服从怎样统计规律这一要求较弱,避免了模型与数据统计规律不适应的难题。

二 模型选择与建立

在环保部网站选取2014年12月1日到2015年6月19日四川省泸州市空气质量指数共199个数据建模,预测2015年6月20日至2015年6月29日共10个数据,分析模型预测。

1.灰色GM(1,1)模型

设原始数据序列为严格的指数序列,即:x(0)(k)=Ae-a(k-1),k=1,2,…N

建立GM(1,1)模型最终拟合结果为:

利用MATLAB7.0编程,建立GM(1,1)模型,预测结果见表1:

――――――――――――――――――――――――

* 泸州市社科联2015年哲学社会科学研究规划项目(LZ15A17)、四川省教育厅2014年度科学研究计划项目(14ZB0397)、泸州职业技术学院2013年度院级科研资助金项目(K-1302)

2.基于动态数据驱动的灰色GM(1,1)新陈代谢模型

定义:设原始序列X(0)=(x(0)(1),x(0)(2),…x(0)(n))。(1)用X(0)=(x(0)(1),x(0)(2),…x(0)(n))建立传统GM(1,1)模型称为GM(1,1);(2) ,用X(0)=(x(0)(k0),x(0)(k0+1),…x(0)(n))建立的GM(1,1)模型称为部分数据GM(1,1)模型;(3)设x(0)(n+1)为最新信息,将x(0)(n+1)加入到X(0)中,再利用X(0)=(x(0)(1),x(0)(2),…x(0)(n+1))建立的GM(1,1)模型称为新信息GM(1,1);(4)加入最新信息x(0)(n+1),删除最老的信息x(0)(1),将这个过程称为新陈代谢。利用新陈代谢理论和数据X(0)=(x(0)(2),x(0)(3),…x(0)(n+1))建立的GM(1,1)模型称为基于动态数据驱动的灰色GM(1,1)新陈代谢模型。

该模型随着旧的数据删除,新的数据加入,数据序列得到不断更新,虽然数据总量和建模方法未发生变化,但是在新旧数据的更换过程中使得数据特征发生量变甚至质变,新形成的数据序列更能反映当前数据的特征,因此新陈代谢方法是可行的。根据灰色GM(1,1)模型中的步骤进行,利用Matlab7.0编程可得预测数据,预测结果见表1。

3.线性回归模型

为与其他预测效果进行比较,利用Eviews5.0软件建立自回归AR模型,该模型为线性模型,其参数估计方法为普通的最小二乘法。预测结果见表2。

X(t)=104.6622621+0.7883649588*X(t-1)+εt,t=2,…199。

X(t)为原始数据t时刻数据,εt为随机扰动项。

4.神经网络模型

神经网络模型是利用某种连接方法将各信息处理部分连接为一个计算系统,该系统对进入的信息进行处理,通过处理后的信息模拟类似人脑的神经网络。使用该模型网络对信息进行分析和建模。该神经网络模型具有较高的非线性拟合能力和良好的泛化能力,对非线性数据具有较高的拟合度。泸州市空气质量指数数据有非线性特征,故采用三层BP神经网络模型对其拟合和预测,预测结果见表1。BP神经网络模型调用格式如下:net=newff([-11;-11],[2,5],{'tansig','pureline'},'trainbr','learngdm','msereg')

三 预测结果比较和结论

1.预测结果

用均方误差和平均绝对百分比误差来分析模型预测效果,预测结果及比较见表1。

表1 各模型预测结果

日期 真值 线性模型 BP神经网络模型 GM(1,1)模型 新陈代谢GM(1,1)模型

6.20 70 88 77 73 73

6.21 73 91 81 72 72

6.22 50 94 83 72 71

6.23 49 96 86 72 69

6.24 55 98 89 72 68

6.25 53 99 69 71 67

6.26 55 101 73 71 66

6.27 62 101 76 71 65

6.28 69 102 80 71 64

6.29 68 103 83 70 63

表2 预测效果比较

MSE 38.3523 22.0204 14.0748 11.8152

MAPE 64.5101 34.7785 21.0912 17.7961

2.结论

第一,因原始数据成非线性特征,若采用线性模型进行拟合预测,会造成建模偏差,使得预测误差加大,甚至失去可靠性。第二,在采用BP神经网络模型进行建模预测时,考虑了数据的非线性特征,预测精度优于线性模型。但受数据量较小的影响,神经网络建立不够完善,因此此模型预测精度较基于动态数据驱动的灰色GM(1,1)新陈代谢模型预测精度较差。第三,在利用基于动态数据驱动的灰色GM(1,1)新陈代谢模型建模过程中既考虑了数据的实时更新,又能将老的信息及时删除并增加新信息在系统中,尽量让建模数据充分反映数据的最新特征,其预测精度优于线性模型、BP神经网络模型及GM(1,1)模型。第四,使用基于动态数据驱动的灰色GM(1,1)新陈代谢模型对泸州市空气质量指数进行动态预测分析,可以及时掌握空气质量指数的变化,根据预测数据采取相应措施应对环境的变化。

参考文献

[1]邓聚龙.灰色理论基础[M].武汉:华中科技大学出版社,2002

[2]李梦梅、朱家明、杨光等.西安市环境空气质量评价与预测[J].贵州师范学院学报,2014(3):11~15

[3]张延利、张德生、井霞霞等.基于无偏灰色马尔科夫模型的人民币/美元汇率短期预测模型[J].陕西科技大学学报(自然科学版),2011(6):135~139

[4]杨建刚、储庆中.对人工智能未来发展的几点思考[J].甘肃科技纵,2006(6):125~126

[5]王梦冬.人民币汇率短期组合预测研究[D].天津大学,2008

上一篇:Android通过WebService连接SQLServer浅析 下一篇:改动一个字 跑了三个月