繁忙机场高峰航班流量预测问题研究

时间:2022-07-26 07:59:45

繁忙机场高峰航班流量预测问题研究

摘要: 为了提高繁忙机场的应急管理能力,为繁忙机场制定应急预案提供科学依据,本文提出了一种基于灰色模型和改进的支持向量回归机模型相结合的新方法,并对繁忙机场的非常态高峰航班流量的小样本进行了时间序列预测。

Abstract: In order to improve the busy airport emergency management ability, and provide scientific basis for the busy airport emergency plan, a new method based on the combination of grey model and improved support vector regression model is proposed. Time series prediction is done to the abnormal peak traffic on the busy airport flights small sample.

关键词: 灰色模型;支持向量回归机模型;高峰航班流量;小样本;时间序列预测

Key words: grey model;support vector regression model;peak flight flow;small sample;time series prediction

中图分类号:V355;F224 文献标识码:A 文章编号:1006-4311(2014)11-0316-02

0 引言

随着我国民航事业的迅猛发展,空中交通流量骤然增加,航班流量是民航空中交通管制的重要数据,是评定民航空管发展水平的关键指标。对非常态的高峰航班流量进行预测,不仅有助于提高繁忙机场的应急管理能力,而且还能为繁忙机场制定应急预案提供科学依据。但是因为繁忙机场的非常态高峰航班流量受到诸多因素的影响作用,系统的发展变化并非是线性的,而是高度非线性的,所以就很难直接的发现描述系统发展变化规律的函数。

目前采用最多的是灰色预测方法或支持向量回归机方法(SVR)。文献[1]采用灰色预测对航班流量进行预测,灰色预测方法在解决繁忙机场非常态高峰航班流量这种“部分因素已知,部分因素未知”的“小样本”、“贫信息”的时间序列预测中是一种非常有效的方法,先对原始数据进行生成处理,淡化或消除冲击扰动对系统行为数据序列的影响,然后利用生成数据序列建立预测模型,但是灰色模型预测的精度并不高。文献[4]采用SVR模型对航班流量进行预测,SVR是基于统计学习理论框架下的一种新的通用机器学习方法。它首先较好地解决了以往困扰很多学习方法的小样本、过学习、高维数、局部最小等实际问题,其次具有很强的泛化能力,是解决小样本时间序列预测建模的又一种可行的有效途径。将灰色模型与SVR模型两者相结合――灰色支持向量回归机模型,利用灰色预测方法中“累加生成”的优点,削弱原始数据序列中随机扰动因素的影响,使杂乱无章的原始数据中所隐藏的规律显露出来,使数据更具有规律性,得到便于SVR学习的新序列,进而建立优于单一SVR方法的预测模型。

1 GM(1,1)预测模型

令原始数列x(0)=(x(0)(1),x(0)(2),…,x(0)(n))为非负,用累加生成法对原始数列进行一次累加生成x(0)的1-AGO序列为:

x(1)=(x(1)(1),x(1)(2),…,x(1)(n)),其中x(1)(k)=■x(0)(i),(k=1,2,…n)。GM(1,1)的灰微分方程模型为

x(0)(k)+az(1)(k)=b(k=2,3,…,n)(1)

其中,GM表示Gray Model(即灰色模型),方程的阶数和变量均为1,x(0)(k)为灰导数,a为发展系数,b为灰作用量,z(1)(k)为白化背景值。相应的白化微分方程为

■+ax■=b(2)

记u=(a,b)T,Y=(x(0)(2),x(0)(3),…,x(0)(n))T,B=-Z■(2) 1-Z■(3) 1 ┆ ┆-Z■(n) 1

按最小二乘法得出灰参数■=(a,b)■=(B■B)B■B■Y。

GM(1,1)的灰微分方程的解为

■(k+1)=(x(1)(0)-■)e-ak+■(3)

将其累减还原得到非负原始序列x(0)的预测值为

■(k+1)=a(1)■(k+1)=■(k+1)-■(k)(4)

2 改进的SVR预测模型[3-5]

2.1 SVR原理 假定在航班流量预测问题中,待拟合样本数据集为(x1,y1),(x2,y2),…,(xn,yn)其中n为样本集容量。SVR在处理非线性问题时先用非线性映射?准(・)将样本数据x映射到高维特征空间H中去,并在这个空间中对函数f(x)=w・?准(x)+b做线性回归处理。根据SVR结构风险最小化原理,函数f(x)应使如下风险函数最小

R(w)=■w2+C■L(f(x■)-y■)(5)

式中w为回归系数向量,C为一大于零常数称为惩罚系数,控制对超过不敏感值误差的样本数据的惩罚程度,

L(f(x■)-y)为损失函数,依据航班流量预测的特点,这里笔者选取ε不敏感损失函数为式(7)。

L(f(x■)-y)=0,f(x■)-y■

ε为不敏感值,控制着模型精度。

由于要考虑允许拟合误差,引入松弛因子ξ和ξ*。于是航班流量回归估计问题就转化为在约束条件(8)下的最小化函数(7)的问题。R(w,ξi,ξ■■)=■w2+C■(ξi+ξ■■)(7)

s.t.f(x■)-yi?燮ξ■■+εy■-f(x■)?燮ξi+εξi,ξ■■?叟0i=1,2,…,n(8)

先对式(8)采用拉格朗日乘子处理,然后按照对偶原理将式(8)转化为下面的凸二次规划问题w(α,α*)=■(αi-α■■)yi-■(αi-α■■)ε-■■(αi-α■■)(αj-α■■)?准(xi)・?准(xj)(9)

s.t.■(αi-α■■)=00?燮αi,α■■?燮C(10)

这里α,α*是拉格朗日乘子,可以由式(9)求出,αi或α■■不等于零的项所对应的样本数据就被称为支持向量,此时拟合函数就变成f(x)=■(αi-α■■)k(xi・x)+b(11)

这里k(xi・x)=?准(xi)・?准(x)称为核函数,能够满足Mercer条件,xi为支持向量,x为待预测数据。

2.2 参数优化 SVR模型参数有惩罚因子C,所选用核函数的参数γ和ε不敏感值,恰当的参数组合可以提高回归模型的泛化性能。主要的参数选择算法有留一法、交叉验证法、试凑法、网格搜索法、梯度下降法和免疫算法等。本文采用网格搜索法和计算精度较高的交叉检验法确定参数。

3 灰色支持向量回归机预测模型

繁忙机场航班流量受诸多因素影响,有的因素数据不易测量,有的则尚未可知,所以本文利用灰色模型和支持向量回归机的优点,建立灰色支持向量回归机模型。

建模主要步骤如下:

步骤一:利用GM(1,1)预测方法得到非负原始序列x(0)=(x(0)(1),x(0)(2),…,x(0)(n)),x(0)(i)>0,i=1,2,…,n的1-AGO序列

x(1)=(x(1)(1),x(1)(2),…,x(1)(n)),x(1)(k)=■x(0)(i),k=1,2,…,n。

步骤二:核函数K(xi,x)及参数的选取。

步骤三:利用SVR方法,求出优化问题的最优解,找出支持向量。

步骤四:构造出回归决策函数f(x)。

步骤五:将1-AGO序列x(1)的预测值■求出。

步骤六:累减还原,得出预测模型,

■(k+1)=a(1)■(k+1)=■(k+1)-■(k)。

4 繁忙机场非常态高峰航班流量预测

4.1 选择最优参数 使用灰色支持向量回归机方法预测机场航班流量,首先确定惩罚因子C,ε不敏感值和核函数,以及所选取的核函数的参数。文献[5]研究表明:非线性输入值不能作为线形核函数的输入;出于对训练性能的综合考虑,经过比较,这里的输入核函数采用在处理时间序列问题时表现比其他核函数更佳的径向基核函数

k(xi,x)=exp(-γxi-x2)(12)

采用网格搜索法和计算精度较高的K-CV方法确定参数,基本原理是让C和γ在一定的范围划分网格并遍历网格内所有点进行取值,对于取定的C和γ利用K-CV方法得到在此组C和下γ训练集验证分类准确率,最终取使得训练集验证分类准确率最高的那组C和γ作为最佳的参数。

4.2 仿真实验及结果分析 以首都国际机场2009年~2013年春节期间航班流量数据中的旅客流量为例,对灰色支持向量机预测方法的实际预测效果进行验证。由于春节前后近6周都处于航班旅客流量高峰期,所以有必要对春节前后共6周每周的平均每天航班旅客流量进行预测。

以2009年~2010年的首都国际机场旅客流量数据即编号前24个作为学习样本(其中a~f表示春节月中第一周到第六周)。然后以2013年春节期间6周的平均每周的航班流量数据即编号后6个作为测试样本,进行仿真实验,同时,为了便于比较本文方法的有效性,还利用GM(1,1)模型和单一的SVR模型对原始数据进行预测。将3种模型的预测结果做出对比,取得的仿真实验结果。

从图1可以看出离原始数据最近的是灰色支持向量回归机预测数据,由此可知利用灰色支持向量回归机模型预测的结果精度比GM(1,1)模型和单一的SVR方法预测精度更高,结果较为准确可靠。由仿真实验结果能够得出灰色支持向量回归机模型在为繁忙机场航班流量预测方面优于GM(1,1)模型和单一SVR模型。因此,用灰色支持向量回归机模型对首都国际机场2016年的春节期间的航班流量进行预测,预测结果见表1。

5 结束语

灰色支持向量回归机模型发挥了中“累加生成”的优点,削弱了原始数据中的随机性,增强了规律性,同时避免了GM(1,1)模型存在的理论缺陷,尽管组合模型中有个别数据拟合误差偏大,但从整体预测效果看,仍然优于单一GM(1,1)模型或SVR模型。由于繁忙机场航班流量的产生受多种因素影响,包括当年年度国民经济增长水平、票价浮动等诸多因素,因此,下一步要做的是,预测繁忙机场非常态高峰航班流量时,不应仅仅考虑时间因素,也应综合考虑各种因素,以建立更准确地预测模型,为繁忙机场的应急管理提供更好的参考。

参考文献:

[1]李旭.昆明空域航班流量预测[J].中国民航大学学报,

2012,30(5):5-8.

[2]国栋,张竞博,何圣关.基于支持向量机的互连导线串扰分析及预测[J].科学技术与工程,2013,13(7):1816-1820.

[3]张卫华,孙浩,穆朝絮.基于支持向量机的交通安全预测模型及仿真研究[J].系统仿真学报,2009,21(19):6266-6270.

[4]冯兴杰,魏新,黄亚楼.基于支持向量机回归的旅客吞吐量预测研究[J].计算机工程,2005,27(12):172-173.

[5]刘思峰,谢乃明.灰色系统理论及其运用[M].北京:科学出版社,2008.

上一篇:基于元功能理论下的语篇分析 下一篇:基于试验研究基础上的日照纸涂药细节的分析