流失预测专题分析成果在生产运营中的应用

时间:2022-06-09 04:58:09

流失预测专题分析成果在生产运营中的应用

摘要:以中国联通新疆分公司BI系统流失预测专题分析为背景,阐述了流失预测的实时过程及技术创新点,并通过实际的应用介绍了流失预测在生产运营中的实用性及重要性。

关键词: BI;流失预测;分析

中图分类号:TP311.52文献标识码:A文章编号:16727800(2011)012006903

作者简介:袁玮(1976-),男,硕士,中国联通新疆分公司信息化部工程师,研究方向为经营分析系统及BSS系统建设维护;王卫(1971-),男,中国联通新疆分公司信息化部工程师,研究方向为联通BSS系统建设维护。

0引言

随着电信行业竞争态势的加剧,存量市场已被划分殆尽,发展新用户也已变得越来越困难,因此,如何有效地挽留老用户,提升老用户ARPU值也逐渐成为了竞争取胜的关键。客户离网是移动通信运营商经营中面临的一个基本问题,也是影响经营状况的一个重要因素。一方面,客户离网会造成收入下降、市场占有率下降、营销成本增加、收入降低的问题;另一方面,恶意离网会造成客户恶意欠费,带来不必要的经济损失。因此,流失专题的功能便是展现已经流失用户的基本情况,并对客户流失进行有效预测,在流失前期对其进行有效维系,最大限度减少客户离网。

1成果内涵及意义

随着国民经济水平的不断提高,移动电话的普及率已经达到一个相对稳定且趋于饱和的状态,电信市场的竞争重点从增量市场逐渐转变到了存量市场,而且电信业的重组形成了3个全业务经营运营商,未来携号转网、基站网络资源共享等政策的推出更是将运营商硬件、网络等基础资源的优势平均化,面向用户的服务质量将成为竞争的关键点。在新疆地广人稀、经济发展较慢、老百姓收入及消费水平比较低的大环境下,新疆联通目前面临的主要任务是如何提升用户价值、及早发现将流失用户,根据用户的流失特征,及时的对有流失倾向的用户就行维系和挽留,稳定当前的网上用户。建立科学、准确的流失预警模型并通过实际营销执行的结果反馈不断优化是最关键的工作。

2成果实现过程

2.1公司领导高度重视,各个部门相互协调

新疆联通流失预警专题分析从2009年10月开始启动,该专题分析得到公司领导的高度重视,并由负责经营的领导亲自主抓,并联合个相关部门组成了专题组,并制定了详细的实施计划。在这个过程中,加深了公司部门之间的了解,沟通过程中相互交流,工作中相互配合,更好地营造公司内部和谐气氛。

2.2建立预测模型

在预测客户流失时一个很重要的问题是流失的时间问题,即一个客户即将要流失,那么他可能是什么时候流失。被预测为流失的用户如果很快就流失了,没有补救的余地,这样的预测即使很准确也没有多大意义。为此流失用户的定义至关重要,经过和业务沟通协商,确定了目标分析群体和流失的口径,分别对2g业务用户建立模型,下面介绍模型的建立过程。

2.2.1目标群体规则

观察期前3月排除公务,公免,测试,欠停状态异常用户(只取正常状态),不包含在时长

2.2.2模型时间跨度规则

观察期:2009年10月~2010年1月

过渡期:2010年2月

预测期:2010年3月

2.2.3选取参数,即确定特征、参数、变量规则

建立模型需要确定用户群体的基本信息特征,通话行为特征,消费行为特征,通话行为特征,客服通话行为特征,短信行为特征,缴费行为特征与其他行为特征,来为确定离网倾向。

2.2.4数据准备

根据上两个步骤确定的用户规则与时间规则,我们选定了以目前新疆省的符合规则的用户为建模数据处理目标用户群。根据分析,离网用户离网前通话行为突降较为明显。确定数据清洗原则,去除特异值,减少对结果扰动,保证结果一般性。

2.2.5指标筛选

数学模型的建立,首先需要进行相关指标的筛选,而在用户的订购信息、使用行为、缴费、客服等方面的指标以及衍生指标有非常的多,如何筛选出有关联性而重要的指标是数据建模最为重要的一步。流失预警指标筛选,采用统计学中常用的相关性分析、方差分析以及决策树等方法综合进行指标筛选,本次流失分析我们选择了100多个指标进行分析,通过相关性和方差分析筛选出关键指标。

相关性分析:

模型通过计算因素变量间的Spearman相关系数来测度变量间的线性相关性,计算过程为:首先把变量值转换为在样本所有变量值中的排列次序,再利用计算方法求解转换后的两个变量对应的排列次序的相关系数,具体计算公式如下:r=∑(Rxi-x)(Ryi-y)∑(Rxi -x)2•∑(Ryi-y)2(1)根据经验|r|值不同,表示不同程度的线性相关关系:

|r|

0.1

0.3

0.5

0.8

方差分析:

方差分析是利用样本数据检验待选指标对目标总体影响程度的一种方法,由于目标总体差异的产生来自两个方面,一方面由总体组间方差造成即指标的不同水平(值)对结果的影响,另一方面由总体组内方差造成即指标的同一水平(值)内部随机误差对结果的影响,如果某指标对目标总体结果没有影响则组内方差与组间方差近似相等,而如果指标对目标总体结果有显著影响,则组间方差大于组内方差,当组间方差与组内方差的比值达到一定程度,或着说达到某个临界点时就可做出待选指标对结果影响显著的判断。

(影响程度)1零通话天数38873132590.31500.75非常显著2交际客户数381925.71667.7229.02非常显著3当月通话次数356734.21562.4228.32非常显著4通话次数均值356.734.21562.4228.32非常显著5闲时通话次数245672.22271.4108.16非常显著6被叫通话次数2079202013.6103.26非常显著7充值金额640299.65752.6111.31显著8忙时通话次数188752.21915.398.55显著9主叫通话次数207512.72312.689.73显著10本地通话次数147276.21767.583.32显著11网外通话次数172455.22185.478.91显著12移动通话次数183714.42360.177.84显著13电信通话次数295582.35443.754.3显著14网内通话次数2295594237.854.17显著15联通通话次数2295594237.854.17显著16在网时长291383.5803636.26较显著17通话次数标准差58318.11792.532.54较显著18MOU值72894.7247029.51较显著19长途通话次数165196.66489.425.46较显著20月租费136736.9585923.34较显著21通话费44965.63372.113.33较显著 通过指标筛选,我们确定关键指标,为下一步模型的建立,打下坚实的基础。

2.2.6构建模型与模型训练

选择合适的数据挖掘模型算法,本阶段分别使用了神经网络与决策树方法进行模型的构建与训练。整个模型建立使用了SPSS公司的Clementine数据挖掘工具。

第二步我们使用了决策树算法,通过不断的模型训练,即输入不同月份的目标用户群体。或者输入同一月份不同的目标用户群体,我们根据已知的结果的用户的离网情况验证模型的准确程度与适用程度。我们可以看到:准确率已经可以达到70%左右,这是目前我们所能找到资料中较高的模型准确率。

2.3上线设计

设计上线方案,最终在新疆联通经营分析系统上应用。为了能让用户流失预警模型发挥最大的效果,我们精心设计了上线方案。用户的挽留工作是一个系统的工程,涉及的单位包括市场部,计费中心,客服中心等部门。同时,它也是一个闭环操作,挽留效果的好坏除了和模型数据的质量有关,还和挽留的实际,客服人员的沟通技巧等密切相关。并且所有数据都在新疆联通经营分析系统的页面上展示,方便有关人员查看。

2.4向地市分公司推广,成果落实

在2010年3月完成模型和上线等工作后,信息化部与业务部门、地市分公司进行广泛的沟通,并对地市各级人员进行了多次的培训。地市分公司也统一思想,群策群力,采取多种形式,将用户流失管理的措施进行本地化的推行。地市分公司围绕流失预警模型,采取了多种形式的用户保有活动,而且提高除了许多有价值的改进思想和方法,有效的保证了成果落到实处。

2.5市场部监控过程,及时反馈效果

成果实施后,用户的满意度是否得到了提高,市场地位是否已经得到了有效的提升?这些问题都需要市场部在全区市场进行调研,并分析结果反馈到执行的第一阶段,再次进入管理的闭环流程。从而达到不断改善,不断提高的目的。为了完成这项工作,市场部的领导和同事都高度重视,前后多次召开跨部门的协调与动员会议,策划了全省的维系活动“围堰计划”,制定了用户保有的总体策略和部署了相关的工作,提高了公司对成果的重视程度和应用热情,并提出了很多针对性强的建议。

3成果中主要创新点

3.1严谨的建模过程、事实验证

在建模的过程中,我们将新疆所有用户按照地市分别建立模型,从每个地市中随机抽取三分之二数据进行建模,用整体的数据进行验证。在建模的过程中,分别使用了决策树算法进行建模,神经网络算法建模,对模型的输入变量和权重进行不断的调整,反复采用神经网络进行预测,根据其验证结果,采用验证结果最优组作为模型的最终输出,并进行多月数据的跟踪效验。这个过程中,需要不断的变动模型的某些模块,反复验证一个限制条件对模型的输出的影响。模型建立中科学的设计参数,通过研究发现,对于用户流失的预警中,用户数据的变化参数可以增加幅变量与波动变量的两个维度,通过这两个维度,可以衡量用户在观测期内各个参数变动的幅度,从而衡量用户的稳定性,而稳定性变动是用户离网的一个比较明显的特征,所以通过引入这两个维度,使得参数的层次和设计更加合理。

3.2对流失预警用户进行分级、画像

根据用户流失概率的大小将流失用户分为五个等级,观察流失用户在各个地域的分布状况;同时根据预流失用户的通话行为及消费特征对预流失用户进行细分。分级和细分结果为业务部门的维系政策提供更加有效的指导,使维系挽留活动更具针对性。

4成果实际应用及推广价值

4.1直接效果――流失率的降低

自中高端流失预警模型首次在新疆联通经营分析系统上线运行以来,新疆用户离网率逐步下降,趋势十分明显。

图1离网率示意图

从图1可以看出,经过一段时间对预测离网用户挽留措施的实施,从2010年9月开始新疆联通的用户离网率得到了有效控制。

4.2经济效益――损失的减少与成本的缩减

项目实施后每月流失预测用户的覆盖率达到60%,预测用户的3至5个月的实际流失契合率达到70%以上,每月成功挽留用户带来的实际收益近30万元左右,上线至今挽留用户实际带来收益共940万元。

4.3社会效益――用户满意度提升

通过建立用户流失预警模型,通过更加深入的用户关怀,在用户中树立了新疆联通良好的服务形象,在面对未来新业务的竞争的用户的保留与争夺战中,为新疆联通继续保持竞争优势与用户优势提供了保证。参考文献:

[1]碰晓东,莫东松,刘勇,等.基于数据仓库的综合决策支持系统的设计研究[J].计算机工程与设计,2003(5).

上一篇:模拟通信系统基本过程的分析与探讨 下一篇:基于SMTP组件使用CDO.Message进行工资条批量发...