基于ARIMA模型的通讯网络诈骗犯罪增长趋势分析

时间:2022-09-07 11:59:31

基于ARIMA模型的通讯网络诈骗犯罪增长趋势分析

摘 要:近年来,随着网络通信技术的不断发展,通讯网络诈骗犯罪已经成为严重危害群众财产安全的侵财犯罪之一,也是困扰公安机关侦查破案的一大难点问题。基于arima模型,通过对2012年7月至2015年6月期间浙江省衢州市通讯网络诈骗案件的发案量的研究,给出了浙江省衢州市通讯网络诈骗犯罪的发案模型。经过检验,模型与之后时间内通讯网络诈骗犯罪发案量吻合良好,为当地警方预防犯罪提供了指导,从而达到提高警务活动效率的目的。

关键词:通讯网络诈骗;时间序列分析;ARIMA模型;情报分析;警务活动

中图分类号:D92 文献标识码:A 文章编号:1009 ― 2234(2017)05 ― 0101 ― 03

0引言

通讯网络诈骗作为近年来兴起的一种新型犯罪,在我国迅速产生和蔓延,由于通讯网络诈骗具有明显的地域不确定性,发案地和犯罪嫌疑人所在地往往不在同一区域。传统的通过对犯罪热点进行分析来调整警务资源分配的方式面对这种新型的犯罪方式难以奏效。因此,必须从时间序列方面来探究通讯网络诈骗犯罪的特点。本文针对浙江省衢州市2012年7月至2015年6月通讯网络诈骗发案量建立ARIMA模型,并使用该模型对衢州市之后一段时间内的犯罪量进行预测。

本文采用的数据来自“基于大数据架构的公安信息化应用”公安部重点实验室,使用的分析软件为Eviews6.0。

1浙江省衢州市通讯网络诈骗犯罪量ARIMA模型的建立

1.1ARIMA模型概述

ARIMA模型是求和自回归移动平均模型(auto-regressive integrated moving average)的简写,主要用于将非平稳时间序列差分平稳后进行分析,其表达式为:

其中实参数p称为自回归系数,?兹1,?兹2,…?兹q称为移动平均系数,自回归系数和移动平均系数均为模型的待估参数。?着t为相互独立的白噪声序列,且服从均值为0,方差为?滓2的正态分布。ARIMA模型又可以表示为ARIMA(p,d,q),其中p为自回归阶数,q为移动平均项数,d为使时间序列平稳所作的差分次数。确定p,d,q三者的阶数是ARIMA模型建立过程中所要面对的一个重要问题。

1.2浙江省衢州市通讯网络诈骗犯罪量时间序列的平稳性检验及处理

在进行时间序列分析时,我们希望该时间序列是平稳的,否则往往会出现大量随机变量,且一些实际上不相关的随机变量之间会表现出很大的相关性。为避免这种情况出现,下面首先进行平稳性检验。

平稳性检验主要有单位根(ADF)检验和PP检验两种方法,将浙江省衢州市2012年7月至2015年6月的通讯网络诈骗犯罪量序列记为{Xt}。通过对{Xt}进行ADF检验及PP检验(图略),结果显示{Xt}序列是非平稳的,这说明通讯网络诈骗犯罪量序列{Xt}受到多种因素制约为非平稳序列,需要对其进行处理使其变得平稳。常见的处理方法有取对数法及差分法,在这里我们将两种方法综合运用。

考虑到{Xt}存在异方差,我们先对{Xt}进行对数处理得到新的序列{Yt},其中Yt=1n(Xt)。下面对{Yt}进行一阶差分以提取其中所含有的确定性信息,得到新的序列{Zt}。此时{Zt}即为我们想要得到的平稳序列,为确定其平稳性,再对{Zt}进行ADF检验和PP检验。

经检验得,在1%的置信区间下,ADF检验中的检验值为-2.639210,大于ADF检验值-6.263234。PP检验中的检验值为-2.634731,大于PP检验值-13.34858,因此拒绝序列非平稳的统计假设,序列{Zt}是平稳的,且存在一定的趋势性,可以进行时间序列分析。

1.3浙江省衢州市通网络诈骗犯罪量时间序列ARIMA模型阶数的分析

为了确定ARIMA模型的阶数,需要先求出序列{Zt}的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。

下面通过观察表一来确定模型的阶数,注意到自相关系数(ACF)和样本偏自相关系数(PACF)都是拖尾的,1、3、4阶自相关系数及1、3阶偏自相关系数超过正负两倍标准差,显著不为0,因此估计p=3,q=4。考虑到之前进行的序列平稳性检验,我们进行了一次差分便得到了平稳的时间序列,因此确定ARIMA模型的步长为1。所以初步估计使用ARIMA(3,1,4)模型对衢州市通信网络诈骗犯罪发案量的时间序列进行模拟和预测。

1.4衢州市通信网络诈骗犯罪量ARIMA模型参数估计

由于ARIMA模型的阶数决定存在着一定的主观性,因此我们在ARIMA(3,1,4)的基础上对阶数进行小幅变动并反复拟合。通过比较R^2、AIC、SC这三个统计量的取值,我们发现疏系数模型ARIMA(4,1,(1,3,4))模型的R^2统计量约为0.74,在所有可取模型中最大。AIC和SC统计量分别约为0.35和0.72,在所有可取模型中最小。根据R^2、AIC和SC准则确定ARIMA(4,1,(1,3,4))模型为最佳模型,其表达式为

Zt=-0.763118Zt-1-0.759613Zt-2-0.737856Zt-3+0.051669Zt-4+0.106490?着t-1-0.137473?着t-3-0.95828l?着t-4

下图为模型的拟合结果图像

从图中可以观察到拟合结果良好,因此初步确定ARIMA(4,1,(1,3,4))模型为最佳模型。但是肉眼的观察往往不具有说服力,为了提高可信度,下面对拟合结果中的参数进行检验。

2衢州市通信网络诈骗犯罪量的预测

由之前估计得到的结果,衢州市通信网络诈骗发案量的最优模型ARIMA(4,1,(1,3,4))模型的表达式为:

上一篇:办公室玩具史 下一篇:实践育人在培育大学生社会主义核心价值观中的...