基于 Log-GMDH模型的我国能源消费中长期预测

时间:2022-07-01 11:42:20

基于 Log-GMDH模型的我国能源消费中长期预测

摘要:利用 Logistic函数作为GMDH两水平自回归算法的传递函数构建了新模型:

Log-GMDH模型。运用我国 1979~1999年的历史能源消费总量数据,将

Log-GMDH模型在检测集(2000~2010年)上的预测结果与自回归移动平均(

ARMA)模型和BP神经网络模型进行了比较,表明 Log-GMDH模型有更准确和更稳定的预测效果。对我国未来

30年(2011~2040年)的能源消费总量进行预测时,发现 Log-GMDH模型更适合于反映我国新形势下可持续发展的能源战略。运用 Log-GMDH模型的预测结果得到:我国未来能源消费先将有较大幅度的增长,到

2030年总量将达 62.55亿吨标准煤,之后能源消费将逐步得到较好的控制,预计将于

2040年实现 “零增长”,届时全国能源消费总量约为 65.70

亿吨标准煤。

关键词:能源消费;预测; GMDH;Logistic函数

中图分类号:F224 文献标识码:A 文章编号:1001-8409(2012)05-0051-04

Medium and Longterm Forecasting of Energy Consumption Based on LogGMDH Model

LI Hongmei, HE Changzheng, XIAO Jin

(School of Business Administration, Sichuan University, Chengdu 610065)

Abstract: This paper provides a new model, LogGMDH model, by introducing logistic function as the transfer function of autoregressive twolevel algorithm of GMDH model. According to the historical data of Chinese total energy consumption from 1979 to 1999, back propagation (BP) neural network model, autoregressive moving average (ARMA) model and LogGMDH model are compared on the test dataset (20002010). The results show that the LogGMDH model is more accurate and stable. It forecasts China’s energy consumption in the following 30 years (20112040) and the results of LogGMDH fit the energy sustainable development strategy better than ARMA’s. The results show that China’s energy consumption will keep a rapid growth. The total energy consumption of China will be 6255 million tons of standard coal in 2030, and then that number will be controlled in 6570 million tons of standard coal in 2040 when energy demand reaches the “zero growth”.

Key words: energy consumption; forecast; group method of data handling (GMDH); Logistic function

1 引言

我国中长期奋斗目标是:国内生产总值到 2020年力争比 2000年翻两番,在本世纪中叶把中国建成富强民主文明和谐的社会主义现代化国家。能源消费量直接影响能源供需缺口 , 也关系到国家的能源安全问题, 而能源安全是建设社会主义现代化国家的重要保障之一。只要利用科学的预测方法揭示我国能源消费的发展规律,在此基础上制定出科学的能源中长期规划,就可以为实现我国本世纪中叶的奋斗目标提供重要保障。所以,做好能源消费的中长期预测工作,对于社会主义现代化国家建设有着重要的意义。

目前,神经网络方法[1,2]和灰色系统理论方法[3,4]是能源消费预测中运用较多的两种方法,但主要运用于短期的能源消费预测,其预测区间通常不超过 10年或者更短 [5]。在对国内的能源消费预测中也多运用这些方法[4,6]。 然而,能源消费的中长期预测是一项超前的研究,它的研究对象是由众多元素组成的能源大系统,这个系统处于动态的发展变化过程中。在中长期能源消费预测中,由于能源系统运动过程中不断受到新的不确定的影响和干扰,其运动轨迹经常会发生突变,比短期预测更具有不确定性。在短期预测中利用能源系统运动过程的稳定性、将过去能源需求运动趋势转移到未来的方法已不再适用。预测的时间区间越长,其精确度就越小,预测水平的不确定性程度随其预测时间区间长度的增加而增加,这是中长期能源需求预测最本质的问题。

对于能源中长期预测,目前运用较多的是组合预测方法,通常以两到三个模型的预测结果进行加权组合预测。周扬等 [7]通过建立 BP神经网络与灰色 GM的优化组合模型,对江苏省未来 15年的能源需求进行了预测;卢奇等[8]采用灰色预测模型、神经网络模型和多元回归模型建立了组合模型并对我国未来 20年的能源消费进行了预测。 Gang等[9]运用多项式曲线和移动平均模型的组合模型预测了我国 2009~2015年 7年间天然气消费情况。

Yi等[10]以人工神经网络模型、灰色模型和时间序列模型为基础建立组合模型对我国未来 6年的能源消费行了预测。组合预测综合多个模型的预测结果,改变了单一模型由于对信息利用不充分等问题所产生的不足,改善了预测效果。但是,组合预测的基础模型仍然来自短期预测方法,组合并不能扩大可预测范围。此外,上述研究工作的预测区间一般在 20年内。按照中国能源中长期发展战略研究成果[12]中的提法,[宜把能源消费预测领域中长期预测区间长度界定在 20年以上。 A G Ivakhnenko将两水平思想引入 GMDH方法,建立了 GMDH两水平自回归模型,扩大了模型的可预测区间 [11]。但由于 GMDH两水平自回归算法以线性函数为传递函数,若预测区间较长,必然会导致远期出现无限上升的趋势,这显然是不符合我国可持续发展能源战略的。为此,本文引进 Logistic函数作为 GMDH两水平自回归算法的传递函数,构建了新模型: Log-GMDH模型,并运用它对我国未来 30年的能源消费总量进行预测。 2 Log-GMDH预测模型的构建

2.1 GMDH两水平自回归模型工作原理及评价 Ivakhnenko于 1971年首次提出了数据分组处理方法(GMDH)[13],经过近 40年的发展, GMDH在系统建模与预测、最优化问题等许多领域都得到了广泛的应用 [14,15],成为复杂系统进行非线性分析的有效方法[16]。20世纪 80年代,Ivakhnenko将两水平思想引入 GMDH方法,构建了 GMDH两水平自回归算法[11]。它将下水平(例如月均值)详细语言的可预测范围扩大到上水平(例如年度值)模糊语言的可预测范围,即把月均值数据相应的短期预测范围扩大到年均值数据的预测范围,[使下水平的可预见性程度有本质的提高,从而扩大了GMDH模型的可预测区间。但是,通常的 GMDH两水平自回归算法以线性函数为传递函数,若预测区间较长,必然会导致远期出现无限上升的趋势,这在很大程度上限制了 GMDH两水平自回归模型的实际运用。

2.2 Log-GMDH模型的实现

为克服 GMDH两水平自回归算法在预测的远期阶段出现无限上升趋势的问题,本文引进 Logistic函数作为 GMDH两水平自回归算法的传递函数构建了 Log-GMDH模型。其建模步骤如下:

(1)建立原始数据表。设原始数据集为X={x1,x2,…,xN},其中 N为样本数,应尽可能的大一些。

(2)确定上下水平数据集。假设原始数据为年度值,上水平可视具体情况定为 M年度的平均值(假设 N是 M的整数倍),记上水平数据集为 Q,则 Q为 1×m阶( m=N/M的矩阵;下水平数据即为原始数据,不过改以二维数据记为q,则q应为 m×M阶的矩阵。

(3)确定 Logistic模型可能的上限值 K。关于 Logistic模型中 K值的确定有很多学者做过研究[17~19],本文中根据我国能源历史消费情况利用多项式曲线趋势外推方法,结合定性分析确定 K值。

(4)用输出变量建立上水平系统模型。对于 Log-GMDH模型,其输出变量就是我们要预测的能源消费量。第一层方程为:

3 能源消费预测模型的比较

3.1 我国能源消费现状分析

根据《中国能源统计年鉴》 [20],可搜集到我国 1979年至今的历史能源消费总量数据。如图 1所示,近年来我国的能源消费总量呈明显的不断上升的趋势。1979年我国能源消费总量约为 5.6亿吨标准煤,而到 2010年我国能源消费总量已达到 32.5亿吨标准煤。

[PS,BP#]

进入 21世纪后,我国能源消费增长相对较快,平均年增长率约为 10%。从 2003年开始,我国能源消费总量以前所未有的速度迅猛增长,其年增长率曾一度达到 16%,使得我国的能源供需形势日益严峻。 2008年和 2009年能源消费总量出现了短暂的缓慢增长,这与世界金融风暴的影响等分不开,不过在 2010年又出现了 11%的年增长率。在“十二五”规划纲要中,我国政府明确提出“绿色发展,建设资源节约型、环境友好型社会”;国务院的《“十二五”节能减排综合性工作方案》中也明确提出了节能减排的具体目标及相关政策措施;中国工程院原副院长杜祥琬院士[12]也指出虽然我国能耗随着经济的发展在未来必将有一定幅度的增长,但我国将逐步实现“能源转型”,预期到 2050年我国将基本完成能源体系的变革,实现能源供需模式的科学平衡。

3.2 样本数据及参数处理

本文以 1979~1999年的数据训练模型,以 2000~2010年的数据为检测集。在上面的数据集上建立了 Log-GMDH模型、 ARMA模型和BP神经网络模型3种模型。对于 Log-GMDH两水平自回归模型,本文以 4年度的平均值构成上水平数据集,以年度值构成下水平数据集,因此步骤(1)中的数据样本数N为 32(1979~2010年)。 Q为1×8阶矩阵, q为 8×4阶矩阵,分别为步骤(2)中的上下水平数据集。步骤(4)中的自回归滞后阶按通常做法取为 4阶。对于 ARMA模型,其模型参数p和 q均为2,即ARMA模型中的自回归阶数和移动平均的阶数都取2阶。

对于BP神经网络模型,以在能源消费预测中普遍使用的如下指标:国内生产总值、能源生产总量和人均能源消费总量作为输入,即输入层节点数为3;以我国能源消费总量作为输出,即输出层节点数为1,构建了三层的 BP神经网络。隐层节点数经试验最终确定为 10。 该模型中其他参数设置情况为:训练误差设定为 0.005,学习效率为 0.3,最大训练步数为 2000步。

3.3 模型预测检验结果比较

图 2中给出了 Log-GMDH模型、ARMA模型和 BP模型在 2000~2010年的预测误差及平均误差。为表述方便,记 Log-GMDH模型为模型1,记 ARMA模型为模型2,BP神经网络模型为模型3。

[PS,BP#]

由图 2可知,ARMA模型和 BP神经网络模型在检测集上的预测误差曲线波动都比 Log-GMDH模型的波动大。ARMA模型、 BP神经网络模型和 Log-GMDH模型的平均预测误差分别为 4.96%, 2.57%和 2.00%,Log-GMDH模型的误差是最小的。由此可见, Log-GMDH模型无论是在预测稳定性方面还是预测精度方面都是三种模型中最好的。

4 能源消费中长期预测研究

这里仅以 Log-GMDH模型和ARMA模型对我国能源消费总量进行中长期(2011~2040年)预测分析。对于 BP神经网络模型,由于2011~2040年输入变量国内生产总值、能源生产总量和人均能源消费总量的值是未知的,而要对这些变量做中长期预测也是比较困难的,因而通常采用的是对输入变量的发展趋势进行经验估计[8],主观因素较大;另一方面,在 BP神经网络模型中,能源消费总量的预测实际上是在输入变量预测的基础上进行的二次预测,这样会造成预测误差的叠加和放大。因此本文在中长期预测模型的选择中不考虑BP神经网络模型。

4.1 Log-GMDH模型上限值的确定

以Log-GMDH模型进行预测需要确定 2040年的能源消费总量可能的上限值。本文以多项式曲线趋势外推方法估计我国未来能源消费的大体走势,对我国1979~ 2010年的历史数据进行拟合并预测至2040年的能源消费总量,结果如图3所示。该模型拟合效果较好,其对应的R2值达到 95.47%;预计 2040年我国能源消费总量将达约 71.33亿吨标准煤。同时,本文统计了模型拟合偏差情况,平均正负偏差分别为 9.12%和-11.44%,以同样的偏差估计 2040年我国的能源消费情况,则2040年我国的能源消费总量区间为[63.17, 77.84](单位:亿吨标准煤)。本文假定我国在 2011~ 2040年的经济发展过程中未受到其他重大因素的干扰,保持近年来的发展趋势,取所预测区间的中间值作为 2040年“零增长”点的能源消费总量值,即70.50亿吨标准煤,该值也即为Logistic模型可能的上限值K。

4.2 预测结果比较分析

用 Log-GMDH模型和ARMA模型对我国2011~2040年的能源消费总量进行预测的结果如表1所示。由表1可知,在预测的前几年即短期预测中,两种模型的预测结果较为接近,[但是随着预测区间的扩大,二者的差异就逐渐显现出来了。为了更加清晰直观,以图4进行分析。

从图 4中可以看到,ARMA模型的预测结果全然没有考虑到远期发展规律,随着预测区间的扩大其预测误差也会不断增大,能源消费量出现不断上涨的趋势,显然这是与实际发展不相符的。文献[12]通过对我国能耗数据的分析指出,未来能源需求持续高速增长并不合理。中国城市科学研究会在2009年10月的《中国低碳生态城市发展战略》报告[21]中提出“力争 2040年实现能源消费的‘零增长’”。于汶加和王安建等[22]指出中国能源消费“零增长”将在 2030~2035年间到来。可见,Log-GMD两水平自回归模型预测出的远期趋势与专家的看法是一致的。

[PS,BP#]

Log-GMDH模型的预测结果表明,未来 30年我国能源消费整体仍将处于增长趋势,其发展可以分为3个阶段:

(1)2011~2022年,这12年间,我国能源消费总量增长虽会因宏观调控等有所控制,但经济增长所必须的能源消耗量还是比较大的,平均年增长速度为4.30%。到 2020年我国的能源消费总量将达到约 50.54亿吨标准煤, 2022年为53.82亿吨标准煤。

(2)2023~2030年,在这8年中全国能源消费总量增长速度将进一步得到控制,年均增长量逐渐降低,平均年增长速度为1.90%。到2030年全国能源消费总量约为 62.55亿吨标准煤。

(3)2031~2040年,这10年期间我国能源消费逐步实现“零增长”,年平均增长速度仅为0.49%。 2035年我国能源消费总量约为64.70亿吨标准煤,在预计的“零增长 ”点2040年达到65.70亿吨标准煤。

5 结论

本文构建了Log-GMDH新模型,并对我国未来30年的能源消费进行了预测。 Log-GMDH模型是将Logistic函数作为 GMDH两水平自回归算法的传递函数构建而成的,一方面两水平思想的运用使得我们可以在保证一定预测精度的前提下有更大的可预测区间,能满足中长期预测的客观要求;另一方面Logistic函数的运用将远期趋势定量化考虑,使得该模型在远期预测阶段不会出现不切实际的不断上涨趋势。按照我国现阶段的经济发展状况及相关发展规划及政策,我国的能源消费总量在今后一段时间内仍将有较大幅度的增长,但不会持续这样高速增长,而是逐步实现“零增长”, Log-GMDH模型的预测结果很好地反映了这样的发展轨迹。此外,Log-GMDH模型预测相对简单易行,不需要对其他相关因素进行预测估计,如BP神经网络。

参考文献:

[1]J Stuart McMenamin, Frank A Monforte. Short term Energy Forecasting with Neural Networks [J]. Energy Journal, 1998, 19(4):43-61.

[2]Roohei Yokoyama, Tetsuya Wakui, Ryoichi Satake. Prediction of Energy Demands Using Neural Network with Model Identification by Global Optimization [J]. Energy Conversion and Management, 2009(50):319-327.

[3]Diyar Akay, Mehmet Atak. Grey Prediction with Rolling Mechanism for Electricity Demand Forecasting of Turkey [J]. Energy, 2007(32):1670-1675.

[4]Yi-Shian Lee, Lee-Ing Tong. Forecasting Energy Consumption Using a Grey Model Improved by Incorporating Genetic Programming [J]. Energy Conversion and Management, 2011(52):147-152.

[5]L Ekonomou. Greek Long-term Energy Consumption Prediction Using Artificial Neural Networks [J]. Energy, 2010(35):512-517.

[6]Kangji Li, Hongye Su, Jian Chu. Forecasting Building Energy Consumption Using Neural Networks and Hybrid Neuro-fuzzy System: A Comparative Study [J]. Energy and Buildings, 2011(43):2893-2899.

[7]周扬,吴文祥,胡莹,刘秀香. 基于组合模型的能源需求预测[J].中国人口.资源与环境,2010,20(4):63-68.

[8]卢奇,顾培亮,邱世明. 组合预测模型在我国能源消费系统中的建构及应用[J].系统工程理论与实践,2003,3:24-30.

[9]Gang Xu, Weiguo Wang. Forecasting China’s Natural Gas Consumption Based on a Combination Model [J]. Natural Gas Chemistry, 2010(19):493-496.

[10]Yi Xue, Zhengzheng Cao, Lei Xu. The Application of Combination Forecasting Model in Energy Consumption System [J]. Energy Procedia, 2011(5):2599-2603.

[11]Ивахненко А Г, Степашко В С. 建模的抗干扰性 (俄) [M]. Киев: НауковаДумка, 1985.

[12]中国能源中长期发展战略研究项目组. 中国能源中长期( 2030、2050)发展战略研究[M].北京:科学出版社,2011.

[13] Ivakhnenko A G. Polynmial Theory of Complex Systems [A]. IEEE Transactions on Systems, Man, and Cybernetics[C], 1971, 1(4): 364-378.

[14]Ivakhnenko A G. Problems of Future Development of the Group Method of Data Handling Algorithms. Part 1 [J]. Pattern Recognition and Image Analysis, 2000, 10(2): 187-194.

[15]Ivakhnenko A G. Sorting Methods in Self-organization of Models and Clusterizations (Review of New Basic Ideas) Iterative (multi-row) Polynomial GMDH Algorithms[J]. Soviet Journal of Automation and Information Sciences, 1989, 22(4): 88-91.

[16]Madala H R, Ivakhnenko A G. Inductive Learning Algorithms for Complex Systems Modeling [M]. Bocaraton, London, Tokyo: CRC Press Inc, 1994.

[17]Pearl R, L J Reed. On the Rate of the Population of United States Since 1790 and its Mathematical Representation [A]. Proc. Nat. Acad. Sc [C]. 1920, 6: 275-288.

[18]Andrewartha H G, Birch L G. The Distribution and Abundance of Animals [M]. The University of Chicago Press.1954: 348-354.

[19]陈彦光. 人口与资源预测中Logistic模型承载量参数的自回归估计[J].自然资源学报, 2009, 24(6): 11055-1113.

[20]国家统计局能源统计司. 中国能源统计年鉴2010 [M].北京:中国统计出版社,2010.

[21]中国城市科学研究会. 中国低碳生态城市发展战略[M].北京:中国城市出版社, 2009.

[22]于汶加,王安建,王高尚. 中国能源消费“零增长”何时到来[J].地球学报,2010, 31(5): 635-644.

上一篇:资源税改革中的价值补偿问题研究 下一篇:基于群组决策分析的国家科技奖励制度运行绩效...