数据挖掘在电信行业的应用研究

时间:2022-05-17 11:40:18

数据挖掘在电信行业的应用研究

[摘要] 数据挖掘是一个应用统计学和人工智能等算法进行知识发现的过程。本文介绍了数据挖掘技术在国内电信行业的应用领域,并以客户流失分析作为实例,探讨了数据挖掘的整个应用过程。最后指出国内电信行业在数据挖掘应用中存在的问题。

[关键词] 电信 数据挖掘 客户流失 数据模型

一、引言

数据挖掘(Data Mining,简称DM)是指从大量不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、有用的信息和知识的过程。数据挖掘是目前国际上数据库和信息决策领域的最前沿方向之一,已经引起了学术界和业界的广泛关注,并且在一些领域内已有成功的应用,但数据挖掘技术在电信领域中成熟的应用尚不多见。下面对数据挖掘技术在电信行业的应用做一些探讨。

二、数据挖掘在电信行业的应用领域

近年来,随着电信行业竞争的加剧,国内电信运营商们都认识到了数据挖掘的重要性,中国移动集团正在规划数据挖掘的行业应用课题研究。

简单地讲,电信领域数据挖掘项目的业务问题就是,通过对电信公司大量的通话明细记录的挖掘,发现顾客的行为,提供有针对性的服务。这样不仅提高客户服务水平以增加顾客忠诚,更重要地是,去寻找那些企业利润贡献度高的业务的使用者,并挖掘其规律以增加这一类业务的销售,从而提升企业获利能力。回答这一业务问题,可以有多方面的数据挖掘问题。

1.通话时段的规律。什么时间是电话通话的高峰期?不同类型的电信业务高峰出现在什么时候等。

2.按市场细分的客户(如个人客户、政府部门、企业客户)通话规律。市场细分后同类型的顾客其通话模式是否相似?如果相似则如何等。

3.电话使用者何时在家。了解这一点可以使一些行业进行电话直销(比如银行业交叉销售保险产品)时效率更高。

4.国际长途的通话模式。因为国际长途利润率相当高,了解其通话模式从而采取相应措施提高其使用量会对公司业绩有显著作用。

5.因特网服务规律。比如顾客最常使用的ISP(服务提供商)、不同市场细分类型的顾客是否用不同的ISP等。

6.发现潜在的租用虚拟专用网络服务的顾客。这些顾客会有站点间大量的通话或数据传输,有时也会与其他企业间作大量的数据交换,此时如果作有针对的营销,他们就可能租用虚拟专用网络服务。

7.发现增加电话线路租用需求的客户。

目前,国内数据挖掘在电信行业的应用领域主要有:客户关系管理;客户欺诈分析;客户流失分析;客户消费模式分析;市场推广分析;确定信用风险等等。

其中应用最多的是客户流失分析,根据分析结果采取相应的行动挽留客户,降低客户流失率.当然还可以用数据挖掘技术,帮助电信做交叉销售,例如让买来电免费的客户买彩铃等,这里我们以客户流失分析为例说明。

三、数据挖掘的应用实例――客户流失分析

总体思路是这样的:根据以前拥有的客户流失数据建立客户属性、服务属性和客户消费数据与客户流失可能性关联的数学模型,给出各部分之间的关系,并给出明确的数学公式,就可以计算出客户流失的可能性。市场/销售部门可以根据得到的数学模型随时监控客户流失的可能性。如果客户流失的可能性过高,就可以通过多种促销手段提高客户的忠诚度,防止客户流失的发生,从而可以大大降低客户的流失率。基于严格数学计算的数据挖掘技术能够彻底改变以往电信企业在成功获得客户以后无法监控客户的流失,无法实现客户关怀的状况,把基于科学决策的客户关系管理全面引入到电信企业的市场/销售工作中来。

整个数据挖掘过程由业务问题定义,数据选择,数据分析和预处理,模型选择与建立,模型解释与应用等多个步骤组成。

1.业务问题定义。业务问题的定义要求非常明确。在客户流失分析系统中,需要明确客户流失的定义。在客户流失分析中,主要有两个核心的变量:(1)财务原因/非财务原因;(2)主动流失/被动流失。客户的流失类别根据这两个核心变量可以分为四种。而真正在分析客户流失的状况时,我们还必须区分公司客户与个人客户,不同服务的贡献率,或者是不同客户消费水平流失标准的不同。举例来说,对于用一种新服务替代原有服务的客户,是否作为流失客户?又或者,平均月消费额为2000元左右的客户,当连续几个月消费额降低到500元以下,我们就可以认为客户发生流失了。所以,客户流失分析系统必须针对各种不同的种类分别定义业务问题,进而分别进行处理。

2.数据选择。为解决问题,需准备数据并组织数据挖掘库,数据为客户费用变化情况。涉及到的数据有固定电话业务量、传统移动业务量和数据通信业务量的历史数据。电信行业有许多成熟的数据库应用系统,如网管系统、财务系统、计费账务系统、112障碍管理系统、缴费销账系统等,并产生了大量的业务处理数据。这些都为数据挖掘的开展提供了良好的数据支持。

3.分析数据。分析的目的是找到对预测输出影响最大的数据字段,和决定是否需要定义导出字段。例如客户流失的方式有两种。第一种是客户的自然消亡,例如身故、破产、迁徙、移民而导致的目标客户消失;第二种是客户的转移流失,通常指客户转移到竞争对手,并使用其服务,后一种流失的客户才是运营商真正关心的、具有挽留价值的客户。因此在分析数据时必须选择第二种流失客户数据参与建模,才能建立有效的模型。

4.数据整理。数据整理的主要工作包括对数据的转换和整合、抽样、随机化、缺失值处理等等。例如,按比例抽取未流失客户和已流失客户,将这两类数据合并填人表格中,构成建模的数据源。

5.模型选择与建立。建立模型是一个反复的过程,需要对数据进行分析并利用各种数据挖掘技术和方法选择合适的模型描述、表示数据,并得出规律。模型建立与调整是数据挖掘过程中的核心部分,通常由数据分析专家完成。需要指出的是,不同的商业问题和不同的数据分布属性会影响模型建立与调整的策略,而且在建模过程中还会使用多种近似算法来简化模型的优化过程。因此还需要业务专家参与调整策略的制定,以避免不适当的优化造成业务信息丢失。

6.模型的解释与应用。根据以上分析可以得出对研究问题的简单结果:(1)根据相对指标来判别客户流失,客户的个人通信费用约占总收人的1%~3%,当客户的个人通信费用远低于此比例时,就可能发生了客户流失;(2)对于因账户休眠发生的流失,可以认为持续休眠超过一定时间长度的客户发生了流失,这时需要对相关的具体问题加以考虑:持续休眠的时间长度定义为多少?每月通话金额低于多少即认为处于休眠状态,或者是综合考虑通话金额、通话时长和通话次数来划定休眠标准。

如发现一个忠诚的客户突然流失,根据数据挖掘分析寻找出流失的原因为:客户在使用一定年限后没有得到特别的关注或优惠政策,进而选择新的具有一定优惠政策的运营服务商,从而造成客户流失。通过对模型做出合理的业务解释,可以找出一些潜在的规律,用于指导业务行为。

四、国内电信行业数据挖掘应用中存在的问题

1.数据质量和完备性。国内电信运营商现有的、面向事务的数据在质量、完整性和一致性上存在许多问题,必须投入大量的精力去进行数据的抽取、净化和处理。此外,业务问题的相关数据有时难以全面收集。例如客户信用是客户价值评估中的关键因素,但由于国内未建立完善的信用体系,无法根据现有客户数据建立优质的信用评价模型,从而导致客户价值模型有效性的降低。

2.相应的人员素质。 在数据挖掘应用过程的多个环节中,人的主观辨识和控制是应用成败的关键,这就对系统使用人员提出了很高的要求。如果没有具备相应素质的使用和维护人员,必将导致分析系统与现实脱钩,无法达到预期效果。

3.应用周期。数据挖掘存在一个较长的应用周期。技术本身不能给使用者解决任何问题,只能从数据中把一些潜在的情况呈现到使用者面前,由使用者采取相应措施。数据挖掘应用的有效方法是:从一个较小的、关键的问题出发,建立起相对有效的模型,并通过应用实践不断检验和完善模型,逐步替使用者解决问题。

五、总结

数据挖掘是目前国际上数据库和信息系统最前沿的研究方向之一,已经引起了学术界和工业界的广泛关注,成为国际上一个研究热点。现在的电信市场上几家电信运营商竞争激烈,数据挖掘技术有利于企业运筹帷幄、掌握先机,保持在竞争中的领先地位,这也给数据挖掘在电信行业的应用带来了无限的商机。

参考文献:

[1]汤小文蔡庆生:数据挖掘在电信业中的应用[J].计算机工程,2004,3

[2]徐光宪刘建辉:数据挖掘在电信客户关系管理中的应用[J].中国数据通信,2005.4

[3]杨树莲:数据挖掘在电信行业客户流失分析中的应用[J].计算机与现代化,2005

[4]崔再彬:电信业如何应用数据挖掘[J].每周电脑报,2006.3

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。

上一篇:浅论操作系统与经济学的共性与区别 下一篇:组织学习能力研究综述