统计方法在移动通信网络优化管理的应用

时间:2022-10-06 01:26:42

统计方法在移动通信网络优化管理的应用

摘要:当前移动通信网络优化由于设备、时间、空间、工程经验和管理水平方面的差异,存在不同的运行质量评估体系;移动通信网优数据存在着数据量大和分布复杂的特性;并且在管理时必须考虑各地区的移动通信网络发展水平。为了使网络运营质量管理向精细化发展,需要对管理设计给出决策支持。首先,应用基于稳健统计量的盒须图模型,对话务统计指标异常值判定门限进行设定,该方法符合数理统计规律,并且经实验证明合理数据占比大,有一定指导意义,并且提高了效率。其次是应用K均值聚类和Sil? houette值,探索地市管理分类,实验说明,此方法具有相当的参考价值。

关键词:移动通信;管理;盒须图;k均值聚类;Silhouette;话务统计

中图分类号:TN929.5文献标识码:A文章编号:1009-3044(2012) 05-1026-04

Statistic in the Mobile Communications Network Management Application

LI Yu-zhong

(Department of Electrical and Mechanical Engineering, Huizhou Economic and Polytechnic College, Huizhou 516057, China)

Abstract: At present,mobile communication network optimization due to equipment, time, space, engineering experience and manage? ment level differences, there are different quality assessment system. Mobile communication network have large data and its distrbution is unknown.It must be considered in management that the district development level of the mobile communication network.In order to man? age the quality of mobile communication network and give the decision support for management design,the statistics method must be used. In this paper,first,using box-plot model based on robust estimation to set traffic statistics KPI’s outliers threshold. Experiments show that there is a certain significance and effective.second, applying K-means clustering and Silhouette values, to explore the cities of classification. this method has considerable reference.

Key words: mobile communication network; management; box-plot; k-means; silhouette; traffic statistics

当前移动通信网络优化,各种运行质量评估体系并存,不同运营商,不同设备商的设备和不同地区都可能形成自己的考核评估体系。这些考核评估体系大多是基于设备商对各种移动通信网络的统计,以及DT、CQT等场测数据综合进行分析得出,能一定程度上反映移动通信网络的运行性能与质量。但是随着网络运营管理向系统化、精细化发展,原有的评估体系在某些方面不能适应当前网络优化工作的需要,如:对于各地区KPI(关键质量指标)纵、横向比较的标准。较低的指标使原有评估体系的局限性不断显现出来。要做到指标“与时俱进”的不断提高,又要切合目前的网络质量状态,达到最终的高指标、均衡化的目的,这就需要在指标门限制定的过程中运用统计学的若干方法。

联合国的专门机构国际电信联盟已为电信标准化部门制定了T标准。在文献[1]中,明确定义了(Qos)的概念、目标值等等。并且提到,在当前存在的移动系统中,信道阻塞率一般为5%~10%,而公共陆地电话网络到固定电路网络的阻塞率设计为1%。ITU给出的建议标准是一重要参考,但指标最低门限是各运营商根据实际经验、设备商的建议和统计自行制定。

本文的主要工作在于:

1)应用盒须图模型模型中的稳健统计量和异常值定义,对各种关键性能指标的异常门限或等级门限的制定给出鲁棒性强,符合数理统计规律的指导性建议。并应用盒须图的可视化功能,直观便捷的观察指标的统计规律,并对指标进行横向比较。

2)尊重地区差异,应用k-均值聚类的方法探索各不同地市之间在移动网络优化质量评价中的恰当分类。

1指标异常门限与等级门限

1.1网络均衡性

对用户而言,在平时进行通信时,若在不同时间、空间下有着不同的通话质量或者掉话率,就会引起用户总体的感知度差。当前由于移动通信话务统计指标的海量数据中,如果采用平均值得方式考核,就会忽略了指标的波动甚至异常。因此作为指标门限的制定的目的,要使网络KPI指标时刻和任何地点都有相对比较均衡的表现,并且要快速明显的找出突发事故,发现和判别异常值。另外,排除异常值干扰后,要对各指标设定门限等级进行好中差的评价。符合统计规律、并且引领向好方向发展的管理评价才能使网络优化工作臻于至善。

1.2盒须图模型

寻找合适的方法研究数据的合理范围,发现和处理粗大的异常值是十分重要的.统计学为解决相关问题进行了许多积极的有益的探讨,对单个变量且样本容量不大时,已有许多较好的检验方法,诸如:z-检验、Dixon检验、Grubbs检验、Nair检验、偏度-峰度检验等,它们都是以数据总体呈正态分布为前提[2]。然而对于由移动通信系统KPI指标影响因素很多,数据分布未知且比较复杂。

根据中心极限定理和通信干扰统计的相关的研究[3],移动通信网络指标在受不同随机因素影响的标准环境下,服从正态分布。然而在实际环境中,移动通信网络呈各种不规则的偏态单峰分布,难于用已知分布去拟合所有指标的数值分布情况。为此,本文采用盒须图模型结合稳健统计量的方法[4]。

图1盒须图模型

如图1,盒须图模型可以清晰地表示指标数据的分布特征,通过数据样本的计算能得出五个次序统计量:中位数、内四分位距、偏态、最大/小观测值和异常值。

1)中位数:描述指标样本的数据中心位置。

2)四分位数:第一四分位数(Q1),又称“下四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。第二四分位数(Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。第三四分位数(Q3),又称“上四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。

3)内四分位距:描述指标样本的数据离散程度。用盒形的高度表示。

4)最大/小观测值:描述指标样本合理数据存在的范围。用延伸的直线来表示,称为“触须”,触须的顶部和底部分别为样本指标数据中非异常数据的最大观测值。若没有异常值,样本的最大值为上触须的顶部,样本最小值为下触须的底部。

5)偏态(Skewness):描述指标样本数据中心偏离的程度。用盒中横线在盒子的位置表示。S=

异常数据(Outliers):大于盒形顶部或底部延伸1.5倍内四分位距的数据称为粗大异常数据。大于盒形顶部或底部延伸3倍内四分位距的数据称为极端异常数据在在图中红色‘+’表示该处数据为一粗大异常数据。

采用盒须图模型的优势[2],1.有强大的稳健性和耐抗性(抗崩溃),极端值几乎不影响。2.不需要分布的先验知识,对数据真实的呈现。3.能包含绝大多数带分布性质的合理数据,并且判断异常值是以四分位数和四分位距为依据,较为客观。多达25%的异常数据不能影响这个标准。4.可视化直观间接的观察数据的统计性质,可通过盒中横线、盒形长短、盒须长短和红十字观察到中位数、四分位距、合理范围和异常值等情况。此外,还可以观察到分布的偏态和尾重。若数据分布为正态分布,中位数和数学期望将重合,异常值判定约在±2.638σ以外,异常数据占全部数据不大于0.7%,与莱特准则接近。

1.3应用实例

我们以2010年11月1日到2011年2月23日,某省话务量最大的四个城市(一类城市)的寻呼成功率为例子,演示计算过程、画出盒须图(非异常数据占总数据比)。见图2:

我们再以这四个一类城市的2010.9.8~2011.2.23的PDCH复用度所有指标数据,应用盒须图模型,考察它的合理数据(非异常数

据)的占比,见表1。

另外,我们对某省21个地级市的2010.11.1~2011.2.23信道完好率指标做盒须图横向对比,观察它所呈现的数据特性,见图3。

根据以上的结论,我们可以验证用盒须图模型的方法观察数据:

1)异常数据只是占数据总体的少量部分,并且都有明显的离群的现象。

2)考虑了数据的分布形态,尊重了地市的现实情况。

3)直观、可视化,并为从事质量管理提供了如数据中心、分布离散程度等其他相信息。

2地市分类

由于各地市在经济发展速度、网络建设、人口和社会环境等各种因素的不均衡,要有根据的对不同地市分类比较,才能做到尊重地区差异的情况。因此,要科学合理的根据话务统计指标划分地市,必须要采用统计学的方法,为网优管理提供有效的决策支持。

因此,我们尝试用移动通信KPI、话务量和数据业务量等数据,采用K-均值聚类的方法来研究移动通信的地市分类。

本节我们将根据多维度评估对KPI的分类,分别对指标进行k-均值聚类,我们采用Matlab 7.1软件和数理统计工具箱的kmeans函数[5][6][7]来进行聚类。在这个阶段,K值(分类)的选择是是十分重要的,如果K取值过小,则不能发现有效的分类模式,使划分失去了意义;如果K值取值过大,分类指标将变得琐碎,各类之间的特征区分不是特别明显,对指导管理经营活动没有操作性。根据以往业务经验,分别取值2~5对样本进行尝试计算,然后用silhouette值观测区分确定有效的K值(分类数)。Silhouette值数据点与它本身聚类中的点的距离比上它与其他聚类中的点的距离,

S(x)=

minb(x,y)-a(x,y)

max(a(x,y),minb(x,y)),其中b(x,y)=avg(d(x,y)),是x点与除开与x在同一聚类的点的平均距离。a(x,y)是x点与其同处于

一个聚类的点的平均距离。[9]

2.1话务量、数据量分类

我们以2010年11月1日至2011年2月23日表示话务量的指标――TCH话务量(峰值)和表示数据量的指标――PDCH占用数(20点),先对日指标求最大值,然后进行二维K-均值聚类。

我们设分类数K=2,3,4,5进行K-均值聚类,画出Silhouette图。

从图4中我们可以看出,21个地市按TCH话务量(峰值)、PDCH占用数(20点)分类,当K=2和4,各组区分于其他组的Silhouette值大部分都比较大(大于0.6),并且没有负值,说明分类比较好。

表2 TCH话务量(峰值)、PDCH占用数(20点)K-均值聚类(2010-11-1~2011-2-23)

从表2中可以看出,地市关于话务量和数据业务量的分类,符合当前人们对该地市的社会经济发展各因素的理解,因此可以作为地市网优管理分类的重要参考。

3结论

移动通信网络指标异常值的挖掘是一个很有实际意义的问题。目前从物理上没有确切的模型做为发现异常值的先验参考;在少样本,其他因素剧烈影响的影响和非标准环境下,各指标分布情况复杂;从统计量的稳健性考虑去判别异常波动指标,因此采用盒须图模型做了尝试和数据论证。经过计算说明:采用盒须图次序统计量模型制定异常门限,能包含大多数指标数据;并且由盒须图直观方便的可视化功能,能迅速的将统计结果转化为视觉映像,用此方法计算简单,效率高,较为合理,有利于管理的横向比较,具有一定的实用价值。

为了对网络产生的话务统计数据进行研究,科学、客观的参照,并尊重地市网络建设、话务分布乃至社会经济等各方面差别的因素,必须对网络分类。本文尝试采用K-均值聚类方法对某省21个地市的移动通信网络的话务量、数据量分类,并结合各分类的Silhouette值选择K的大小。分类的效果说明这样的分类是有意义的。

参考文献:

[1] ITU-T Recommendation E.800 ,Terms and definitions related to quality of service and network performance including dependability [S]. INTERNATIONAL TELECOMMUNICATION UNION,1994.

[2]黄勇奇,赵追.遥感观测信息的探索性分析与研究[J].遥感信息,2006(5):24-28.

[3]张农.蜂窝移动通信中干扰的统计性质[J].邮电设计技术,2000(1).

[4] McGill R J, Tukey W, Larsen W A.Variations of Boxplots [C].The American Statistician,1978,32(1) :1216.

[5] Seber,G,A, F.Multivariate Observations [M].Hoboken, NJ: John Wiley & Sons, Inc.,1984.

[6] Kaufman L,P. J. Rousseeuw.Finding Groups in Data: An Introduction to Cluster Analysis[M].Hoboken,NJ: John Wiley & Sons, Inc.,1990.

[7] The Mathworks Inc.Statistics Toolbox[CP/DK].Matlab R2010.

[8]广州逸信电子科技有限公司.2010话务统计数据[Z].广州:广州逸信电子科技有限公司,2010.

上一篇:基于rsync的备份方案研究与实现 下一篇:移动互联网发展趋势的研究