ARIMA模型与BP神经网络模型的比较研究

时间:2022-10-13 09:53:49

ARIMA模型与BP神经网络模型的比较研究

【摘 要】 文章基于供电企业对电费现金流入预测的现实需要,分别建立了基于时间序列的ARIMA模型和BP神经网络预测模型,并对两种预测方法进行了对比分析,最终确定了以ARIMA模型为主、BP神经网络为辅的综合预测手段,有效地提高了电费现金流的预测精度,增强了供电企业的现金流管理水平。

【关键词】 现金流预测; 差分自回归移动平均模型; BP神经网络模型

中图分类号:F275 文献标识码:A 文章编号:1004-5937(2014)34-0025-04

一、前言

如果说利润相当于企业的“营养”,那么现金流则相当于企业的“血液”,因现金流管理出现问题而使企业处于困境的例子不胜枚举。因此,强化对现金流的预测和管控是任何一家企业的必修课。而现金流中蕴含的丰富信息又成为大数据时代企业必须挖掘的宝贵资源和实现数据驱动智慧经营的重要基础。对资金密集型的供电企业而言,在当前售电量及相应的销售收入进入平稳增长期,而投资需求依旧旺盛的环境下,对现金流进行精益管控就显得尤为重要,而其中的关键要点便是现金流预测。

现金流入的预测一直是所有企业在现金流管理领域面对的难题,国内外各大企业和学术界对此作了大量的研究,但是并没有取得很好的效果,其主要原因在于现金流入的随机性较强、波动性大、影响因素多,不同行业不同企业的现金流各具特征、差异很大,难以找到一个统一的预测方法。但进一步就电网企业来说,电费现金流入有着其特定的规律,如图1,各年间电费现金流呈现明显的季节性变化趋势。因此,若能揭示并利用其中规律,便可在一定程度上进行较为准确的预测。

本文以占供电企业现金流入90%以上的电费现金流入为对象,尝试并比对不同的预测方法,为电网企业提高现金流管理水平提供有效手段。

二、方法介绍和已有研究成果综述

按照目前的技术手段和常用方法,一般采用: (1)解释性预测方法,典型的如线性模型和非线性模型,通过找出预测的影响因素建立回归方程;(2)时间序列模型,仅依赖被预测变量本身,通过揭示其规律进行预测。在社会经济领域,由于某一个待预测事项的影响因素众多,包括社会、经济、天气、地理、人类行为和心理因素等,而这些因素彼此又存在相关关系,因此要求穷举主要的影响因素进而建立模型也较为困难,而且其间的影响关系往往是非线性的,因此非线性的复杂模型便成为备选方法。进一步,由于“事物是发展变化的”,待预测事项及其影响因素往往是非平稳时间序列,存在前后的延续关系,因此,时间序列模型便较为合理。鉴于现金流数据的以上特征,本文选择时间序列的ARIMA模型方法和BP神经网络模型方法进行尝试和比对。

(一)ARIMA模型

ARIMA模型全称为差分自回归移动平均模型(Autoregressive Integrated Moving Average Model),其基本思想是将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以用时间序列的过去值及现在值来预测未来值。

ARIMA是多个模型的混合,即自回归AR、求和I及移动平均MA,它分为非季节性ARIMA(p,d,q)模型和季节性ARIMA(p,d,q)(P,D,Q)模型,两者的区别在于后者在进行预测时考虑了季节周期的因素,更加适用于有季节性或周期性变动的数据。由于电费现金流入数据具有明显的季节性和周期性波动,故采用后者。

对于ARIMA(p,d,q)模型,AR是自回归,p为自回归项,MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。在使用ARIMA模型进行预测时,最关键是的确定p、q和d等参数,其主要步骤包括平稳性检验(确定d)、模型识别(确定p和q)、参数估计与诊断检验,最后利用模型进行预测。

(二)BP神经网络模型

BP神经网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。它能学习和贮存大量的输入――输出模式映射关系,而无需事前揭示描述这种映射的数学方程式。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值跟阀值,使得网络的误差平方和最小。BP神经网络拓扑结构包括输入层、隐含层和输出层。

利用BP神经网络进行预测的主要步骤包括原始数据的归一化、数据分类、神经网络的建立、模型训练、实际预测、反归一化和预测结果的误差分析等。

(三)应用此两种方法进行预测的已有研究成果

对未来的预测是人们在各个领域都孜孜以求的目标,学术界和实务界进行了大量探索和尝试,其中应用较多的便是上述两种方法。

在ARIMA模型的应用方面:(1)最直接的应用是在与经济利益直接相关的金融市场,如徐珍和李星野(2012)比较了小波ARMA模型和ARIMA模型在预测上证指数中的差异,发现前者预测效果更好,说明在传统ARIMA的基础上加入小波分析是一种优化。(2)另一个较多的应用方向是对人口数量的预测,涂雄苓和徐海云(2009)比较了ARIMA与指数平滑法在我国人口数量预测中的使用,发现前者优于后者,最优模型为ARIMA(2,2,1)模型并采用其进行了预测。(3)其他领域的预测包括疾病和降水的预测,如胡建利等(2013)利用季节指数法和ARIMA模型预测感染性腹泻周发病数。

在BP神经网络模型的应用方面:(1)崔德光等(2005)在综合回归预测方法和人工神经网络预测方法优点的基础上采用组合预测方法的思想,并基于多元线性回归模型确定组合方法的权重系数,进行空中交通流量与预测,是一种比单一方法更优的模型。(2)在电力相关领域,孟凡青和解大(2009)基于盲数和神经网络进行了电价预测,吴斌等(1999)基于人工神经元网络及模糊算法进行了空间负荷预测。(3)此外,还包括在股票市场预测(胡静,2007)、税收预测(林国玺和宣慧玉,2005)和资本市场预测(曾勇,唐小我,1999)等方面。

从经济含义来看,供电企业的电费现金流入是全社会范围内大量个体自发性的综合结果,与前人研究过程中涉及的对象,如股指、电力负荷、交通流量等具有内在的一致性,很难进行人为调节和事先管控,是在全社会层面上的综合反映,因此,探寻数据本身蕴含的信息和规律并据其进行预测便是可行的方法。在这些研究结论中,比较统一的结论是ARIMA要优于指数平滑法,BP神经网络要优于多元回归方法,但是ARIMA和BP神经网络这两种方法的比较,却鲜有涉及。因此,本文便主要以供电企业电费现金流入为预测对象,对这两种方法进行比较。

三、基于电费现金流入的实证分析

(一)模型设计

历史预测结果表明仅基于电费现金流入数据本身进行预测,平均误差在5%~10%之间,个别月份更大,无法满足公司现金流入管控的要求。借鉴多元回归及组合预测的思想和方法(崔德光等,2005),在全面分析了影响电网企业电费现金流的各个因素后,最终筛选确定了供电量、增容、减容和预收差额等对电费现金流入影响较大的因素作为自变量。由于春节假期对用电量有显著影响,若预测时包括1或2月份(传统的春节均在这两个月中),则加入春节调整系数作为自变量。

在此基础上,选择A供电公司2011年1月到2014年4月的月度数据,包括各个自变量和电费现金流入数据,分别建立电费现金流入的ARIMA和BP神经网络预测模型,对比两者的预测效果。以往的研究中,通常都是基于一个单一期间的历史数据,预测特定期间的未来值,虽然神经网络算法实现过程中也进行了训练,但均缺少基于不同期间长度的历史数据的预测值比较。本文为了更好地对两种预测方法进行比较,考虑到春节假期的较大影响,基于不同长度的历史区间,分别进行四次预测,全面比较,分别是:

预测1:利用2011年1月到2012年12月共24期历史数据,预测2013年1―2月(春节期间);

预测2:利用2011年1月到2013年12月共36期历史数据,预测2014年1―2月(春节期间);

预测3:利用2011年1月到2013年4月共28期历史数据,预测2013年5―6月(非春节期间);

预测4:利用2011年1月到2014年4月共40期历史数据,预测2014年5―6月(非春节期间)。

由于供电企业在实务处理中主要进行下月的短期预测,因此本文主要进行未来两个月的短期预测分析。

(二)ARIMA模型的预测结果

对于本小节,本文借助SPSS构建ARIMA模型进行计算。

首先对除了春节波动系数①之外的自变量进行预测,再根据对应的月份填入春节波动系数预测电费现金流入,最优的预测模型均为ARIMA(0,0,0)(0,1,0),具体结果如表1所示。

随着历史数据的不断增加,预测误差并没有明显缩小。四次预测的拟合如图2。

(三)BP神经网络模型的预测结果

依旧界定四个预测模型,利用Matlab来预测下两期的电费现金流量,将自变量归一化后导入Matlab中,构建一个具有14个隐含层的BP神经网络,见表2。

随着历史数据的不断增加,预测误差明显缩小。四次预测的图示如图3。

(四)结果比对

从短期的预测精度比较来看,随着历史数据的增加,BP神经网络的误差明显较ARIMA模型收敛得更快,但在预测精度的绝对值上并没有明显的优势,其差异率的波动性较大。本文进一步进行了长期预测(6~12个月),发现两种方法的预测精度都会明显下降,误差越来越大,且BP神经网络的预测精度下降得更快(详细结果不再罗列)。但仅从预测精度与实际的差异率来看,基于前述事实无法明确区分两种方法的优劣。

四、两种预测方法的比较及实施效果

由于该预测方法需要在公司日常业务中进行广泛应用,操作的便利性和易用性便成为重要考虑因素。将ARIMA模型和BP神经网络模型进行对比,两种方法各有千秋。ARIMA模型操作起来比较方便,而BP神经网络则相对比较复杂,但BP神经网络模型具有能以任意精度逼近任意曲线的能力,这是ARIMA模型所不具备的。此外,BP神经网络模型由于在初始化网络的权值和阀值的时候是随机赋值的,这就造成了训练结果的不唯一性。可能单次训练会造成比较大的误差,但是采取多次训练取均值的方法则能很好地降低误差,提高预测精度。而基于SPSS的ARIMA模型只要给定数据,可以很快计算出唯一确定的结果,无需重复操作使结果收敛。

通过一段时间的实践,笔者同时对两种预测方法的预测结果进行了比较,发现在电费现金流入趋势相对稳定的月份,如4―6月使用ARIMA模型效果较好,但是在1―2月和7―8月电费现金流入突增突减的月份,使用BP神经网络效果较好,因此确定以前者为主要方法,特殊月份以后者作为补充方法。该项措施实施前后,A供电公司电费现金流入预测的情况如图4所示,改善十分明显。

今后A公司可持续在其他预测模型的尝试、自变量选择、调整系数计算方法和赋值的优化、预测模型中关键参数的设定等方面进行改进,以期不断提高预测精度。

【主要参考文献】

[1] 范恒瑞,任黎秀.ARIMA与指数平滑法在江苏省GDP预测中的应用[J].江西农业学报,2011,23(2):187-189.

[2] 韩萍,王鹏新,王彦集,等.多尺度标准化降水指数的ARIMA模型干旱预测研究[J].干旱地区农业研究,2008(2):212-218.

[3] 胡静,吴强.神经网络在股票市场预测中的应用[J].科技信息(科学教研),2007(13):261-262.

[4] 孟凡青,解大.基于盲数和神经网络的电价预测模型[J].电力系统保护与控制,2009,37(16):11-15.

[5] 涂雄苓,徐海云.ARIMA与指数平滑法在我国人口预测中的比较研究[J].统计与决策,2009(16):21-23.

上一篇:国泰基金艾小军:金融股仍有投资机会 下一篇:上市公司扎堆进军P2P网贷股价暴涨初现隐忧