浅析处理经济数据的几种方法

时间:2022-08-25 07:38:11

浅析处理经济数据的几种方法

摘要:本论文对时间序列进行分类:按线性性分,时间序列可以分为线性时间序列和非线性时间序列;非线性时间序列模型又可分为参数非线性模型和非参数非线性模型。并简单的介绍了重要的几个模型,分析它们的优点和缺点。阐述了处理不同类型的时间序列数据,要用不同的模型。

关键词:时间序列;AR模型;MA模型;ARMA模型;ARCH模型;门限模型

一、引言

时间序列模型在经济预测过程中既考虑了经济现象在时间序列上的依存性,又考虑了随机波动的干扰性,对于经济运行趋势的预测准确率较高,是应用比较广泛的方法之一。

以往的经济预测,往往依靠传统的经验分析预测法或简单的计量经济分析预测法,如相关分析、回归分析等。这些方法的优点是:简便,易实现;但是缺点也比较明显,那就是精确度不高。为了提高预测精度,人们引进线性时间序列分析方法对经济数据进行预测。而且信息技术以及计算机工业的发展无疑给统计学家带来更多的机遇和挑战。

本文主要介绍线性时间序列模型和非线性时间序列模型,下面简略介绍这几种模型:

二、线性时间序列模型

时间序列是按照时间顺序取得的一系列观察值。很多数据是以时间序列的形式出现的:一个工厂装船货物的周度序列,谋化工过程产出的按小时观测,等等。时间序列典型的一个本质特征就是相邻观察值的依赖性。若把时间序列的当前观察值看作过去时刻观察值和当前冲击值与过去冲击值的线性函数,就是所谓的混合的自回归和滑动平均模型:

yt-φt-1yt-1-…-φt-p=at-θt-1at-1-…-θt-qat-q(1)

使用后移算子记号,则上式可写成

(1-φ1B-…-φpBp)yt=(1-θ1B-…-θqBq)at

其中Bmyt=yt-m,令φ(B)=1-φ1B-…-φpBp,θ(B)=1-θ1B-…-θqBq,at独立同分布于期望为0,方差为σ2的正态分布(高斯分布),简记为at~iidN(o,σ2)下面的记法雷同。

则(1)式可以写成

φ(B)yt=θ(B)at(2)

上述模型(1)简称为线性平稳模型ARMA(p,q)模型。

若(1)式中的q=0,则模型变为

yt-φ1(yt-1-…-φpyt-p=at(3)

该模型称为p阶自回归模型,简称AR(p)模型。

若(1)式中的p=0,则模型变成

yt=at-θqat-1-…-θq(at-q(4)

该模型称为q阶的滑动平均模型,简称MA(q)模型。不难看出,AR(p)和MA(q)模型是ARMA(p,q)模型的特例。

利用上述模型进行预测,需要满足平稳性条件,若不满足,要对序列进行差分。当序列满足平稳性条件后,就可以对序列进行模型识别,然后是确定阶数,接着就是在某个准则下求出参数的估计值,把参数的估计值求出来后,还要对模型进行检验,若模型通过了检验,我们就可以利用该模型进行预测了。

从Yule(1927)关于太阳黑子数的AR建模的开拓性工作到Box和Jenkins(1970)标志着ARMA建模的理论和方法成熟的工作,线性高斯时间序列模型研究得到极大的发展,支配着理论探索和实际应用。虽然最初的ARMA框架已经被推广到包括具有结合分式的ARMA的长范围相依(Granger和Joyeux1980以及Hosking1981),多变量VARMA和VARMAX模型(Hannan和Deistler1988),利用协整(co-integration)所得的随机游动非平稳性(Engle和Granger1987),但是,ARMA建模长达四十年的持续普及足以说明这一点。毫不夸张地说,由于其简单性、可行性和灵活性,ARMA模型及其变种在将来仍将在分析时间序列中继续发挥积极的作用。

然而,早在上世纪50年代,P.A.P.Moran在对加拿大山猫数据进行建模的经典文章(Moran1953)中就暗示了线性模型的局限性。他注意到了数据中的“怪异”特征,即大于均值的样本点的残差显著地小于那些小于均值的样本点的残差。正如现在知道的那样,这正好能够解释为在种群波动的不同阶段有所谓的“控制效应”(Tong1990的§7.2;Stenseth等1990).建模控制效应或者含别的非标准特征的模型超出了高斯时间序列模型的范围。由此,统计学家想用非线性模型代替线性模型。

三、非线性时间序列模型

线性范围之外,尚有无穷多的非线性形式有待挖掘。非线性时间序列分析的早期发展的重点是在各种非线性参数模型。成功的例子包括金融数据的波动波幅性的ARCH模型和生态及经济数据的门限模型。另一方面,非参数回归方法的最新发展为建模非线性时间序列提供了另一种手段。这种方法的一个既得的优点是对模型结构的先验信息要求很少,而且为进一步的参数拟合提供有用的感性认识。此外,近几年来随着计算能力的增强,存取和试图分析海量的和复杂的时间序列数据已变成平凡之事。随着这些变化而来的是对那些能够识别内在结构和按照新的精度标准预报将来的非参数和半参数分析工具的需求日益增大。对时间分布过长的大的实际数据集合,参数模型的有效性总是值得怀疑的。所有这些因素导致了通过探索局部低维结构来识别复杂数据结构的计算机辅助方法的迅速发展。下面简单介绍几个非线性时间序列模型:

1.ARCH模型

自回归条件异方差(ARCH)模型定义如下

Xt=σtεt,和α2t=a0+b1X2t-1+…+bqX2t-q(5)

其中a0≥0,bj≥0,{εt}~iidN(0,1)

ARCH模型由Engle(1982)为建模英国的通货膨胀的预报方差而引进。从此这个模型被广泛地用来建模金融和经济时间序列的波动率,或者用于建模一般时间序列变化的(条件)方差或波动性。时间序列较大的值可能导致较大的不稳定性(即大的方差),这一现象经常在经济和金融中发现。这种现象称为(条件)异方差性。

Bollerslev(1986)通过下式代替(5)的第二个方差而引进了广义自回归条件异方差(GARCH)模型

σ2t=a0+a1σ2t-1+…+apσ2t-p+b1X2t-1+…+bqX2t-q(6)

其中aj≥0,bj≥0。

2.门限模型

由H.Tong提出的门限自回归(Tar)模型假定在状态空间的不同区域,模型有不同的线性形式。状态空间的划分通常由一个门限变量来描述,比如,对某个d≥1,Xt-d就是一个门限变量。模型具有如下的形式

d≥1,Xt=b(i)0+b(i)1Xt-1+…+b(i)pXt-p+ε(i)t,若Xt-d∈Ωi(7)

对i=1,2,…,k,其中{Ωi}构成理论实直线的一个(不重叠的)分割,{ε(i)t}~iidN(0,σ2i)。

最简单的门限模型是Ω1={Xt-d≤τ}的两段(即k=2)TAR模型,其中门限τ是未知的。

该模型的成功部分地在于它的模型拟合,也许更重要的是在模型解释这两方面的简单性。通过分割状态空间建模非线性,平稳性可以被保持。这明显地不同于变点模型,后者的控制开关按时间发生,其结果导致非平稳过程。TAR模型的缺点是,关于该模型的知识仍处于发展中,我们还没有像线性ARMA模型那样的全面的理论和方法。

3.非参数自回归模型

非线性时间序列有无穷多的可能形式。我们不能抱有一个特殊模型族将会很好地适合我们数据的想法。一个自然的替代想法是采用非参数的方法。一般地,我们可以假定

Xt=f(Xt-1,…,Xt-p)+σ(Xt-1,…,Xt-p)εt(8)

其中f(・)和σ(・)是未知函数,{εt}~iidN(0,1)。对于函数f和σ,我们不规定具体形式,而仅作一些定性的假定,比如假定f和σ是平滑的。模型(8)称为非参数自回归条件异方差(NARCH)模型,如果σ(・)是常数,则称为非参数自回归(NAR)模型。

显然,模型(8)是非常一般的,且对如何生成数据所做的假定非常之少。它允许异方差性。然而,仅当p=1或2时,这个模型是有用的。对适当大的p,这样一个有“饱满”的非参数形式的函数很难估计,除非样本容量是天文数字。困难是“本质的”,在非参数回归中常称为“维数祸根”。

四、总结

自从1970年Box和Jenkins在ARMA框架内系统建立时间序列分析后,线性高斯时间序列模型研究得到极大的发展,支配着理论探索和实际应用。由于其简单性、可行性和灵活性,ARMA模型及其变种在将来仍将在分析时间序列中继续发挥积极的作用。然而,自然界的很多现象是以非线性的状态存在的,若用线性模型描述非线性现象,则会产生很大的误差,这个就是线性模型的局限性。因此,提出非线性模型成为必要。

与重点在于给条件一阶矩建模的传统时间序列分析不同的是,ARCH和GARCH模型主要是考虑条件二阶矩的相依性的建模。这很有希望适应解释和建模兼容时间序列的风险和不确定性方面日益增长的要求。

对于TAR模型,虽然还没有全面的理论和方法,但是该模型在模型拟合和模型解释这两方面的简单性,也使得该模型在时间序列预测领域,特别是经济时间序列预测领域中起到重要作用。

至于非参数模型,虽然它的理论方法更不完善,但是因为非参数方法对如何生成数据所做的假定非常少,而且还允许异方差性。因此,该方法具有很大的应用潜力。

本文简单介绍了几个重要的时间序列模型,而这些模型都是基于随机假设前提下的,事实上,还有基于混沌假设前提下的时间序列预报,由于篇幅关系在本论文没有作详细介绍。

参考文献:

[1]博克斯等著,顾岚主译.时间序列分析:预测与控制.中国统计出版社,1997.

[2]范剑青,姚琦伟著,陈敏译.非线性时间序列-建模、预报及其应用.高等教育出版社,2005.

[3]王振龙等.应用时间序列分析.科学出版社,2007.

[4]冯文权主编.经济预测与决策技术.武汉大学出版社,2002.

[5]菲利普.费朗西斯.商业和经济预测中的时间序列模型.中国人民大学出版社,2002.

[6]张军峰,胡寿松.基于多重核学习支持向量回归的混沌时间序列预测.物理学报,2008.5.

(作者单位:华南农业大学理学院)

“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文”

上一篇:企业科技工作者社会地位的影响分析 下一篇:我国商业银行企业文化实证研究