基于ARMA模型的海西州地区慢支发病情况研究

时间:2022-06-27 08:37:39

基于ARMA模型的海西州地区慢支发病情况研究

收稿日期:2009-06-02.

基金项目:国家自然科学基金(60673192).

作者简介:马亮亮(1986-),男,硕士研究生.主要研究方向:数学模型.

通讯作者:田富鹏(1963-),男,教授,硕士生导师.主要研究方向:数学模型.

摘要: 通过EViews软件对青海海西州地区支气管炎发病例监测登记资料进行统计分析,同时进行时间序列模型拟合,观察疾病发展趋势,建立了时间序列模型,并对实际值与预测值进行比较.

关键词: 时间序列;ARMA模型;支气管炎;EViews

中图分类号:O212

文献标识码:A文章编号:1672-8513(2010)04-0275-03

Study of Bronchitis Morbidity in Haixi Prefecture Based on ARMA Model

MA Liangliang,TIAN Fupeng

(School of Computer Science and Information Engineering, Northwest University for Nationalities, Lanzhou 730030, China)

Abstract: At present, the research of bronchitis morbidity based on the time series analysis is inadequate. Through the establishment of mathematical models for its study, timely prevention of bronchitis is hopeful. The research gives a statistical analysis of the bronchitis cases in Haixi Prefecture of Qinghai Province with the EViews software, and establishes a time series model based on a comparison between the predicted value and actual value.

Key words: time series; ARMA model; bronchitis; EViews

支气管炎简称慢支,是严重危害人民健康的常见病和多发病.由于环境的日益恶化、人们工作压力的增大和缺少运动锻炼及其他原因,近年来支气管炎发病率有增加的趋势.通过建立数学模型,研究支气管炎的发展变化趋势,可以帮助我们更好地认识和及时预防支气管炎,有效地降低支气管炎对人们的危害,从而保障人们的生活质量.

1 基础数据和统计学方法

1.1 病历资料的来源

全部发病资料取自青海海西州第一人民医院.经过核对、补漏,从而保证资料的准确和完整.

1.2 统计学方法

运用Excel 2003及EViews对2001年1月到2007年12月海西州地区支气管炎发病资料进行整理分析,统计出海西州地区支气管炎每月发病人数作为时间序列,观察疾病发展趋势,应用时间序列分析方法,建立数学模型,并对预测值和实际值进行比较.

2 理论与模型介绍[1-4]

ARMA 模型是一类常用的随机时序模型.它的基本思想是:某些时间序列是依赖于时间t的一族随机变量,构成该时序的单个序列值虽然具有不确定性,但整个时序的变化却有一定的规律性,可以用相应的数学模型近似描述.ARMA 模型有3种基本类型:自回归(AR: Auto-regressive)模型、移动平均(MA: Moving Average)模型以及自回归移动平均(ARMA: Auto-regressive Moving Average)模型.

3 建模过程分析

3.1 时间序列特征分析

为了检验模型的预测效果,将2007年的12个月的观测值留出,作为评价预测精度的参照对象.建模的样本期从2001年1月到2006年12月.记支气管炎月发病人数为时间序列yt,应用EViews将其数据绘制成折线图,可见序列无整体趋势和周期变动.对序列进行自相关分析和偏自相关分析,应用EViews得序列的自相关与偏自相关分析图,从图可以看到序列是非平稳的.为消除趋势同时减小序列的波动,对原序列做一阶自然对数逐期差分.从差分后的自相关与偏自相关分析图可以看出,序列的趋势基本消除,偏自相关系数在k=4后很快的趋于0,所以取p=4;但当k=1时,样本的自相关系数和偏自相关系数显著不为0,表明季节性存在,故考虑q=1,并对序列做季节差分.从季节差分后的自相关与偏自相关分析图可以看出,样本的自相关系数与偏自相关系数很快地落入随机区间,故序列趋势已基本消除,但在k=1时取值仍然较大,季节性依然比较明显.对序列进行二阶季节差分,发现序列季节性并没得到显著改善,故只做一阶季节差分即可.对季节差分后的序列进行0均值检验,得到该序列样本的平均数是9.90×10-3,均值误差为0.2248,序列均值与0无显著差异,表明序列可以直接建立ARMA模型[5].

3.2 模型识别[6]

因为经过一阶逐期差分,序列趋势消除,故d=1;经过一阶季节差分,季节性基本消除,故D=1.所以选用ARIMA(p,d,q)(P,D,Q)s模型.综合考虑所有的可供选择的(p,q)组合:(4,1),(5,0).由于k=1时,样本自相关和偏自相关系数都显著不为0,所以,P=Q=1.

3.3 模型建立

下面利用EViews分别建立ARIMA(4,1,1)(1,1,1)1,ARIMA(5,1,0)(1,1,1)1模型,并将2个模型的参数估计和相关检验结果汇总列入在表1和表2中.从表2中可以看出,模型1和模型2的相伴概率分别为0.95,0.92,可以认为这2个模型的残差序列能够满足随机性检验.经计算,模型1和模型2都满足ARMA过程的平稳条件及可逆条件,故模型设定合理.与模型2相比,模型1的AIC和SC值较小,试预测的MAPE值显示其预测精度较高,故选择模型1作为最终模型[7].

4 结语

随着人们生活水平的提高,人们开始越来越关注健康问题,相应地人们对支气管炎的关注程度也不断加强.在国内,时间序列模型主要应用于经济数据分析,在医学上应用尚少.大多数传统的时间序列模型均以各变量之间呈线性关系,实际预测时往往效果不佳.本文用历年的发病资料进行时间序列分析,建立模型ARIMA(4,1,1)(1,1,1)1,ARIMA(5,1,0)(1,1,1)1,得到最优模型ARIMA(4,1,1)(1,1,1)1,且得到较好的预测结果.

参考文献:

[1]宇传华.SPSS与统计分析[M].北京:电子工业出版社,2007:577-614.

[2]洪楠,侯军.MINITAB[M].北京:电子工业出版社,2007:431-465.

[3]何宁,吴黎兵,腾冲,等.统计分析系统SAS与SPSS[M].北京:机械工业出版社,2008:184-200.

[4]易丹辉.数据分析与EViews应用[M].北京:中国统计出版社,2005:106-134.

上一篇:Γ-半群的Fuzzy理想 下一篇:一类双复合二项风险模型的破产概率