基于ARIMA模型的南宁房地产销售分析与预测

时间:2022-07-12 03:05:35

基于ARIMA模型的南宁房地产销售分析与预测

摘要:本文应用RStutio软件并基于arima模型南宁房地产销售额进行了分析与预测。本文建立了两个模型,然后通过模型对比得到最优模型,且模型的MAPE值和TIC值均显示模型的拟合精度良好。因此,模型对相关房地产的模型研究起到有一定的参考意义。

关键词:ARIMA模型;房地产销售;RStudio

中图分类号:F299.23 文献识别码:A 文章编号:1001-828X(2017)007-0-03

房地产业既是我国基础性和先导性产业,也是我国经济发展的支柱之一,对房地产产业的观察有助于我们从侧面了解一个地区的经济发展情况。房地产产业的健康发展对区域经济的影响有着举足轻重的作用。一个地区的房地产的销售反映了该地区的房地产市场的火热程度和济的发展情况。南宁的房地产在进入新世纪之后,开始进入了快速发展的轨道。特别是南宁作为自治区首府且将房地产作为支柱产业进行扶持之后,南宁的房地产更是有了飞跃式的发展。近两年,根据官方公布的数据,随着全面二孩的开放和各项利好政策的出台,南宁房地产的销售实现了20%左右的增长。

而随着自治区政府和南宁市政府决定将南宁建成面向东盟开放合作的区域性国际城市和中央提出“一带一路”的政策之后,人们对南宁房地产的发展充满信心。另外,从近些年房地产的销售数据来看,也反映的人们对南宁房地产发展的信心。本文以南宁近四年的房地产销售额数据作为研究对象,采用RStudio软件和ARIMA模型对南宁房地产销售额进行建模,最后对南宁房地产销售额进行预测,最后分析了南宁房地产销售额的增长发展特点和造成这个特点的原因。

一、模型分析

1.模型理论

本文所使用的模型为简单季节疏系数模型,即通过趋势差分、季节差分将序列转化为平稳序列后,再对序列进行建模。其模型结构如下:

式中

(1)D为季节周期,d为为对序列进行去趋势信息而进行的差分阶数

(2)为白噪声序列,且E(

(3),为q阶移动平均平均系数多项式,且至少有一个系数为0

(4)Φ(B)=1-φ1B-…φpBp为p阶自回归系数多项式,且至少有一个系数为0

2.分析思路

由ARIMA模型的理论知,ARIMA模型一般是对平稳的序列进行建模,因此在进行ARIMA建模之前,需先对序列进行平稳化。常用的平稳化方法为:首先对原始序列进行d阶差分去趋势,如果d阶差分后的数据具有周期性,则需再对差分后的数据进行周期差分以去季节。在ARIMA模型中,要求模型中的符合上述(2)的要求。建立ARIMA模型的关键点在于,需要对移动平均多项式和自回归多项的阶数q和p进行定阶和参数的估计,然后对参数进行显著性检验并剔除不显著的参数。

要使模型中的符合上述(2)的要求,本文采用对残差进行白噪声检验,当p值小于0.05时认为其为白噪声序列,即符合(2)的要求。q和p的定阶按如下规则进行。

由于真实的数据的自相关系数和样本偏自相关系数几乎不会呈现出理论上的完美截尾性,因此一般以它们落入二倍标准差范围内作为判断是否截尾的依据。一般情况下,它们在最初的d阶明显大于2倍标准差范围,d阶之后几乎有95%的样本相关系数或样本自相关系数落入2倍标准差范围内,且它们衰减到0值附近波动非常突然,则可以认为d阶截尾。反之,有超过5%的样本相关系数或样本偏自相关系数落入2倍标准差之外,或者在衰减到0值附近波动的过程非常的缓慢或者连续,则可以认为它们具有拖尾性。

二、实证分析

1.样本数据获取及数据预处理

样本数据选自广西统计局公布的全区月度统计数据,每两个月作为一次样本数据获取点,且得到的数据为当前月与前一月的累计投资额,比如2013年2月的数据即为2013年1月和2月的累计销售额。得到的数据如下:

首先,观察原数据的分布情况。从下图可以看到南宁房地产销售额呈明显的波动增长趋势。另外从原始数据中我们可以看到每年的2月份为南宁房地产销售的低谷,而每年的12月份则是南宁房地产的销售高峰。因此,可以认为南宁房地产销售额数据为具有年度周期的数据。

基于上述理由,决定对数据进行一阶差分后在进行周期为6的季节差分。数据处理后的时序图如图2所示,从图中可以看到经过去趋势和季节差分后,序列基本在0值附近波动,即认为预处理后的数据的均值为0,另外可以看出预处理后的数据基本上没有明显的趋势和周期,初步认定处理后的数据平稳。

为进一步确认判断是否正确,现对经过预处理后的数据进行无趋势无常数项的单位根检验,检验结果如下:

结果显示预处理后的数据平稳。进一步地,对预处理后的数据进行白噪声检验,检验结果如下:

图3的结果显示预处理后的数据不是白噪声数据,这说明预处理后的数据存在着相关信息。综上可知预处理后的数据平稳且非白噪声数据,适合建立ARIMA模型。

为对模型的p和q进行定阶,现在观察预处理后的数据的自相关系数图和偏自相关系数图如下:

从图4可以看出自相关系数均具有一定的拖尾性,从图5可以看出偏相关系数4阶截尾。这表明预处理后的数据具有短期相关性,这与ADF检验的结果一致。根据图4和图5,因考虑对预处理后的数据进行无常数均值的ARMA(1,4)和AR(4)模型。并对模型和模型系数的显著性进行检验,然后根据AIC准则选择最优模型。

2.数据建模

首先对数据进行ARIMA(1,(1,6),4)模型拟合,其结果如下:

图6 ARIMA(1,(1,6),4)模型系数拟合结果

接下来对模型的各项系数进行显著性检验。其结果如下:

根据表4,剔除检验p值大于0.05的系数项,由此拟合疏系数季节模型ARIMA(1,(1,6),(2,4)),得到结果如下:

由图7的结果容易验证此时模型的各项非0系数的p值均小于0.05,即各项非0系数均是显著的。进一步对该模型的残差进行白噪声检验,检验结果如下:

由上且从图8可以看出模型拟合后模型的残差为白噪声,这说明模型也是显著的。从而可得模型为:

------------------模型I

类似的,重复上述过程建立ARIMA(4,(1,6),0)模型,经显著性检验发现φ1、φ3的系数不显著,剔除后拟合ARIMA((2,4),(1,6),0)得到如下结果:

容易验证系数φ2、φ4都是显著的。现对模型的残差进行白噪声检验,得到如下结果:

由上且从图10可以看出模型拟合后模型的残差为白噪声,这说明模型也是显著的。从而可得模型为:

--------------模型II

3.模型预测

通过上面的建模过程可以得到南宁房地产销售额的两个模型,现引入指标对比这两个模型的优劣。另外一般认为如果平均绝对百分误差(MAPE)在10%以内,则认为模型预测精度较高,且MAPE的值越小模型预测精度越佳。另外,模型的希尔不等系数(TIC,一般介于0~1之间)越小则表明模型预测精度越好,进一步说明模型拟合精度较好。在时间序列模型中一般认为AIC的值越小模型越优。因此这里通过计算上述两个模型可得模型的AIC、MAPE、TIC的值如下表所示:

由上表可知m然这两个模型的拟合效果均较为理想,但在三个指标中ARIMA(1,(1,6), (2,4))模型均优于ARIMA((2,4),(1,6),0)模型。因此这里选用ARIMA(1,(1,6), (2,4))模型对南宁房地产销售额进行为期一年的预测,进而提供一些建议。ARIMA(1,(1,6), (2,4))模型预测结果如下:

(说明:图中星号表示原始数据,实线表示拟合曲线,虚线为置信水平为95%的置信线)

三、结语

通过原始数据我们可以看到,南宁房地产销售额在2015年之前的增长态势较为缓慢,波动相对较小,但在进入2016年之后,南宁房地产的销售额出现了剧烈的波动和明显的上升趋势。另外根据对南宁房地产未来1年的预测结果,可以知道在未来一年里南宁房地产销售额仍然会出现较为剧烈的波动上升且呈同比增长的态势。另外,可以看出每年5-6月份和11-12月份南宁房地产的销售的两个高峰,而年初和7-8月份则为相对低谷。造成这种情况的可能原因有:(1)年初房地产开发商并不急于回笼资金,此时房地产销售价格较为高昂,购房者处于观望态势,因此成交量较少。而到年中5-6月份,开发商为回笼部分资金以缓解资金链压力会进行部分促销活动,而5-6月份会有一些假期,也方便购房者看房。另外,购买者一般买房前会和家人商量,经过春节期间及之后的家庭商议后,部分购房这会选择此时购买商品房。当购买需求在5-6月份得到部分释放后,在7-8月份出现成交量的部分下滑。之后随着下半年开发商的资金压力和相关的促销活动,购房的需求开始释放,并在年末达到高峰。在这下半年的过程中,开发商的资金也逐渐回笼。进入新的一年后,资金相对充足的开发商并不急于回笼资金,因而使得南宁房地产销售额出现明显的周期。(2)随着“一带一路”的提出和南宁-东盟经济开发区的持续推进,南宁的发展不断加快,这刺激着南宁的房地产投资不断增长,也不断的刺激这外地购房者和本地购房者的购买欲望。(3)随着经济的不断发展,人们的收入不断提高,再加上持续推进的城镇化和农村富余劳动力的转移,都在不断的刺激者房地产的销售,再加上南宁作为自治区首府的区位优势,也让购房者对商品房的保价能力充满信心,这也一定程度地刺激房地产的销售。(4)房地产产业是自治区政府和南宁市政府重点扶持的产业之一,刺激着房地产的投资,进而影响房地产的销售。另外异地公积金政策的出台,也不断地刺激着南宁周边区民去南宁买房的欲望。(5)开放二孩政策后,创造了部分刚需。因此,综合来看,南宁房地产销售额在未来地一段时间内,仍然会呈现较为强劲的波动周期上升态势。

参考文献:

[1]王燕.应用时间序列分析――基于R[M](第一版).北京:中国人民大学出版社,2015.

[2]欧廷皓.基于ARMA模型的房地产价格指数预测[J].统计与决策(理论版),2007(7).

[3]吴喜之,等.应用时间序列分析――R软件陪同[M].北京:机械工业出版社,2016.

[4]陆尚辉.基于疏系数季节模型的南宁房地产投资分析与预测[J].时代金融,2016,4:184-186.

作者简介:陆尚辉,广西南宁人,河池学院讲师。

基金项目:1.河池学院青年课题项目(XJ2015QN013);2.大学生创新创业项目(201610605009)。

上一篇:探究双汇火腿肠品牌策略存在的问题及对策 下一篇:高职经济学基础教学改革研究