ARIMA季节乘积模型预测医院门诊量的试验研究

时间:2022-09-15 03:49:59

ARIMA季节乘积模型预测医院门诊量的试验研究

摘 要:利用ARIMA乘积模型对2005年到2012年的八年门诊量做了分析和预测的研究实验分析探讨了ARIMA乘积模型在预测医院门诊量中的应用从而建立医院门诊量的预测模型,实践证明ARIMA乘积模型是一种精度较高且周期短的预测医院门诊量模型值得推广应用。

关键词:ARIMA季节乘积模型;预测;医院门诊量

中图分类号:R197.324

科学准确地预测门诊量,越来越成为各级医院处理日常工作和规划未来发展的重要依据。但是门诊量受社会医疗政策、医院的治疗水平、人们的生活水平变化,以及就医的心理观念、自然环境、季节性等众多因素的影响,表现的变化也是敏感和巨大的。传统的统计方法,运用静态因果结构模型进行分析预测,已经无法准确的处理这些复杂的数据和难控制的变化因子。

1 ARIMA乘积模型建立

某省级三甲医院,在2008年进行了规模扩建,门诊量发生了巨大变化。本人尝试用混合有季节性和非季节性成分的ARIMA乘积模型(p,d,q)(P,D,Q)s,经过大量的试验,运用了多种离群值处理方法,对2005年到2012年的八年门诊量做了分析和预测的研究实验。建立了特殊峰值高度吻合,预测值在95%置信区间,相对误差较小的ARIMA乘积模型。20世界60年代,美国学者Geogre E.P.Box和英国统计学者Gunlym M.Jenkins提出一套关于时间序列分析、预测和控制的方法,被称为Box-Jenkins建模方法,求和自回归移动平均(Autoregressive integrated moving average,ARIMA)模型是其中重要而基本的模型之一。它用相应的数学模型描述一组依赖于时间的随机变量相互之间所具有的自相关性,以表征预测对象发展的延续性并从时序的过去值与现在值预测其未来值[1]。

ARIMA乘积模型是非季节ARIMA模型与季节ARIMA模型的结合,具有一定的代表性和普遍性。

1.1 非季节ARIMA(p,d,q)模型

假定Xt为某时间序列第t个时间间隔的观测值,非季节ARIMA(p,d,q)模型的一般形式为:

φ(B)d Xt =θ(B)εt (1)

其中,t代表时间,Xt表示响应序列,B是后移算子,=1-B,p,d,q分别表示自回归阶数、差分阶数和移动平均阶数;φ(B)为自回归算子,θ(B)为移动平均算子。

1.2 季节ARIMA(P,D,Q)S模型

对于有季节性变动规律的ARIMA(P,D,Q)模型的一般形式为:

U(Bs)sD Xt=V(Bs)εt (2)

其中,s为季节性周期,U(Bs)为季节性自回归算子,P、D、Q分别表示季节性自回归、差分和移动平均的阶次,V(Bs)为季节性移动平均算子。

1.3 乘积(p,d,q)(P,D,Q)s模型

乘积季节模型一般形式为:

φ(B)U(Bs)dsD Xt =θ(B)V(Bs)εt (3)

其中φ(B)=1-φ1B -φ2B2- … -φpBp

θ(B)=1 -θ1B -θ2B2 - … -θqBq

用来消除同一周期不同周期点之间的关系性;

U(Bs)=1- u1Bs- u2B2s- … - upBPs

V(Bs)=1- v1Bs- v2B2s- … -vQBQs

可以对不同周期的同一周期点之间的相关性进行拟合。εt代表独立挠动或随机误差,S为周期长度。[2,3,4]

2 应用实例

ARIMA建模法分为三个阶段:模型识别,参数估计和诊断检验,通过这三个处理步骤的反复进行,最终确定一个用于预报或控制的最优模型。本研究采用SPSS 19.0软件,以某医院2005年1月-2012年12月门诊人次数据作为季节性时间序列(见表1),建立ARIMA乘积模型,进行门诊量预测分析。

表1 某医院2005年1月-2012年12月门诊人次

年份 一月 二月 三月 四月 五月 六月 七月 八月 九月 十月 十一月 十二月

2005 28283 31953 37430 41190 37205 38022 36024 40432 37387 33217 40841 37631

2006 36855 30966 39159 44225 35985 38454 38934 40479 44242 36726 38530 42952

2007 41029 26263 37635 39843 37460 36754 35613 38939 35265 32627 38448 39111

2008 81352 70359 95634 94453 94533 95340 88885 90583 95319 162603 107826 114853

2009 44435 63386 81500 80021 74006 73992 81479 77847 71592 68213 81479 72183

2010 84210 66033 101258 99007 102907 83438 92948 99239 88752 84026 97824 94826

2011 72318 55311 160048 82781 87752 127903 142381 139675 159080 120787 132107 134802

2012 113353 148504 169383 94755 100431 97090 165447 157512 121606 130292 144976 156877

2.1 模型识别

由SPSS生成门诊量序列图,如图1所示,观察序列图可发现门诊量呈现逐年升高的趋势,并且具有季节性波动,可初步判断为非平稳时间序列。为进一步验证,绘制自相关函数图和偏自相关函数图,如图2所示。由图2可以看出,时间序列的自相关函数有线性衰减的特征,而偏自相关函数则迅速衰减趋于零,因此序列不是平稳的,需要进行平稳化处理。

从图1可以看出,门诊量的波动变化显著,需要进行离群值的处理。在进行了简单的水平偏移和加法的处理后,效果不理想,因此采用了多种离群值的处理方法,如表2所示:

表2 离群值处理

估计 SE t Sig.

2008 一月 水平偏移 40515.565 6371.896 6.358 .000

2008 十月 加法 67774.076 4721.803 14.353 .000

2009 一月 革新的 -68113.510 7533.157 -9.042 .000

2010 一月 水平偏移 35518.283 6402.925 5.547 .000

2010 二月 季节性相加 -16087.445 4934.105 -3.260 .002

2011 三月 加法 32738.558 8471.062 3.865 .000

季节性相加 38915.304 8364.704 4.652 .000

2011 六月 水平偏移 51310.682 6003.157 8.547 .000

2011 九月 加法 36325.198 4899.263 7.414 .000

2012 二月 加法 52561.236 6840.652 7.684 .000

2012 四月 瞬时的 幅度 -31892.658 9315.723 -3.424 .001

衰减因子 .940 .098 9.550 .000

2012 七月 革新的 58701.693 7520.934 7.805 .000

2012 八月 加法 18807.682 6616.404 2.843 .006

由于序列具有趋势性和季节性,处理好离群值后,对序列先进行一阶差分,以消除其趋势性,再进行一阶季节性差分,以消除其季节性。从差分后的序列图(见图3)可以看出,序列已经趋于平稳,根据上面的分析,尝试建立ARIMA(p,d,q)(P,D,Q)s模型。前面对数据进行了一阶差分和一阶季节性差分,因此d=D=1,从差分后的自相关函数和偏自相关函数图(见图4)可以看出,在同一周期内,自相关函数在滞后期k=1和k=11时比较大,偏自相关函数除周期点外,其于都落在置信区间,因此p=1,Q=1。通过spss 19,生成ARIMA(1,1,0)(0,1,1)模型。

2.2 参数估计

表3 ARIMA模型参数

估计 SE t Sig.

AR 滞后 1 -.347 .076 -4.556 .000

差分 1

季节性差分 1

MA,季节性 滞后 1 .529 .091 5.822 .000

通过计算,非季节性和季节性参数分别为-0.347和0.529,标准误分别为0.076和0.091,正态化的BIC为18.493。生成的ARIMA乘机模型为:

(1-B)(1-B12)Xt=(1+0.347B)(1-0.529B12) εt

2.3 诊断检验

对残差系列进行检验,从残差的自相关函数和偏自相关函数图(见图5)可以看出,残差的自相关系数和偏自相关系数都落在置信区间内,因此序列是白噪声序列,预测模型具有较佳的拟合优度。

2.4 预测

运用建立的乘积模型ARIMA(1,1,0)(0,1,1)12,对2013年1-6月的门诊量进行预测,预测结果与实际门诊量的比较分析如表4所示:

表4 2013年1-6月门诊量预测值与实际值比较分析表

月份 预测值 95%置信上限 95%置信下限 实际值

1 130454 143775 117132 140927

2 116239 132146 100332 110310

3 189839 208790 170888 170741

4 148545 169853 127236 170303

5 152332 175844 128821 180551

6 145489 170988 119991 158627

从表4可以看出,实际值基本在95%置信区间,并且相对误差较小。运用ARIMA乘机模型生成的2005年1月-2012年12月的数据拟合图,如图6所示,可以看出数据的几个特殊的峰值都吻合的比较好,因此可以推断该预测模型基本合理。

参考文献:

[1]方积乾,陆盈,张晋听等.现代医学统计学(时间序列分析方法及其医学应用)[M].北京:人民卫生出版社,2002:219-269.

[2]Bowerman,O’Connell Forecasting and Time Series:An Applied Approach(Third Edition)[M].China Machine Press,2003:117-156.

[3]Box GEP,Jenkins,Time Series Analysis Porecasting and.Control[M].Holden-day,1976.

[4]王沁编著.时间序列分析及其应用[M].成都:西南交通大学出版社,2008.

作者简介:韩春阳(1978.11-),吉林长春人,工程师,主要从事数据库、软件开发工作。

作者单位:长春中医药大学附属医院信息中心,长春 130021

上一篇:基督教对维特根斯坦的影响 下一篇:PC软件开发技术的应用及未来发展研究