基于ARIMA模型的标准普尔S&P500指数预测分析

时间:2022-10-01 02:50:10

基于ARIMA模型的标准普尔S&P500指数预测分析

摘 要:金融预测对于发现金融发展客观趋势、指导金融投资具有重要的现实指导意义。研究了应用ARIMA模型预测标准普尔S&P500指数。原始数据采集来源于Yahoo finace数据库,研究数据为标准普尔S&P500指数收盘价,数据范围为1990-1-3至2012-3-26,数据划分为建模数据与检验数据二部分。研究结果显示,预测模型为ARIMA(5,1,4)形式,模型预测平均精度为1.8%。研究结果可为金融投资提供理论实证参考。

关键词:S&P500指数;ARIMA模型;预测分析

中图分类号:F83 文献标识码:A 文章编号:16723198(2012)14010002

1 引言

自2007年美国发生金融危机以来,世界经济秩序发生了巨大的变化,全球经济增长陷入了停滞,有些国家甚至出现了负增长,尤其对于以出口导向为主的发展中国家影响更为明显,实体经济遭到沉重打击,制造业成本增加,利润减少,实体经济效益降低,刺激了相应第三产业的投资增加,其中金融行业的投资相应显现出增长趋势,而金融行业投资与实体经济投资具有明显差异,其中金融行业的不确定性因素相比实体经济而言更为复杂。因此,准确预测金融投资预期成为了当前股票、证券、期货等投资的研究热点领域。金融预测具有显著的实践指导意义,无论是投资者还是管理者,他们都迫切需要知道投资未来预期的变化趋势,以及未来的收益变化,这些变化均体现在金融数据的波动过程中,金融数据具有随机性、非线性等特征,这为准确预测带来不确定性。因此应用适当的数据工具、准确预测金融发展趋势具有重要的现实意义。针对金融时间序列数据的特性,本文拟以标准普尔500指数(即S&P500)作为研究对象,以差分自回归移动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA)作为研究工具,预测S&P500指数的变化规律。

2 研究现状

S&P500是全球最著名的篮筹股指数,相对NASDAQ指数和DOW Jones Industrial Average指数,S&P500指数无论是在市场代表性、衍生品等方面具有明显的优势。深刻理解及掌握S&P500指数的变化规律,对于正确评价美国经济趋势,跟踪世界经济发展源流,参与全球市场套利及定价,具有非常重要的现实意义。标准普尔500指数英文简写为S&P500 Index,是记录美国500家上市公司的一个股票指数。标准普尔500指数在资本市场上具有重要的参考作用,其在金融投资、管理等领域均具有非常重要的参考价值。基于标准普尔500指数在金融市场的重要地位,自之日起便受到金融、经济界的高度重视,对S&P500指数的预测研究引起了国内外研究学者的重视,国内研究成果分别有:以上证综指、恒生指数以及S&P500指数的高频数据作为研究对象,采用跳跃显著性检验方法和扩展HAR模型,对股票市场波动跳跃特征进行了实证研究(西村友作,2012),采纳神经网络模型建立股市预测模型,通过S&P500指数开盘价进行实例分析,与传统的时间序列分析和其他集成方法对比(赵世安,2011),运用方差方法/重标极差方法(R/S)和消除趋势波动分析方法(DFA)对美国股市标准普尔500指数的收盘价进行分析(2009,许娜),应用神经网络对S&P500短期走势进行预测,具体研究数据对象是从1998年3月20日至1999年4月26日S&P500的每周数据(王洪刚,2002)。国外研究的相关成果有:结合熵与LVQ网络、概率理论预测S&P500指数(Lahmiri,S.2012),采用时间序列预测应用局部学习算法预测S&P500指数(Metghalchi,M.2005)。通过分析国内外研究现状可知,当前对于S&P500指数的研究主要集中于对短期的预测,研究工具各不相同,本文在前人研究的基础上,采用差分自回归移动平均模型对S&P500指数进行长期预测。

3 ARIMA原理

3.1 基本原理

ARIMA(p,d,q)模型全称为差分自回归移动平均模型,是由Box和Jenkins于1976年创立,其基本原理是将数据视为一随机序列,构造数学模型,以过去值和现在值预测未来数值。ARIMA(p,d,q)模型由两模型联合而成,即AR(p)模型和MR(q)模型,AR(p)即自回归模型,p表示回归项数,MR(q)模型为移动平均模型,q表示移动平均项数,ARIMA中的d表示差分阶数。

AR(p)p价自回归可表示为:

Yt-δ=a1(Yt-1-δ)+a2(Yt-2-δ)+…+ap(Yt-p-δ)+ut

Ma(q)可表示为:Yt=μ+β0ut+β1ut-1+β2ut-2+…+βqut-q

ARMA(p,q)的一般形式(其中θ为一常数项):

Yt=θ+α1Yt-1+a2Yt-2+…+αpYt-p+β0ut+β1ut-1+…+βqut-q

ARMA(p,d,q)则是ARMA(p,q)差分d阶模型。

3.2 实施步骤

(1)判断。在ARMA(p,d,q)模型中有三个参数p,d,q需要确定,在实际应用中需要首先判断数据序列是否是平稳序列。

(2)估计。在ARMA(p,d,q)模型中参数p,q的确定,常借助相关图和偏相关图确定。

(3)检验。检验ARMA(p,d,q)模型的拟合程度及可靠性,判断模型估计结果的残差是否存在白噪音,以便修正相关参数。

(4)预测。使用通过检验的在ARMA(p,d,q)模型进行预测分析,并计算预测结果的准确度。

ARIMA原理的更详细介绍请参见参考文献[6]。

为了检验ARMA(5,1,4)模型的拟合程度及可靠性,判断模型估计结果的残差是否存在白噪音,可以通过ARMA(5,1,4)模型所生成的残差序列,确定最大滞后阶数为15,计算出残差序列的相关图和Q统计量。经检验发现,残差序列的样本自相关函数均在设定区域内,相应的概率误差均小于5%,因此可以判断残差序列不存在自相关,因此可以认为模型通过检验。

上一篇:我国农村小额信贷机构可持续发展问题研究 下一篇:论领导者的职权与人力资源管理