数据挖掘在电信业中的应用

时间:2022-07-31 07:53:18

数据挖掘在电信业中的应用

摘 要:随着电信市场竞争的日益加剧,有着海量数据电信部门迫切需要从中的到有价值的信息。利用数据挖掘技术得到做出营销决策的信息,在对过去的数据进行优化后进行挖掘,可以对客户获取,客户细分,客户赢利能力,客户的流失和保持分析来进行分析,最终得到做出营销决策的信息。

关键词:数据挖掘;电信;客户流失

数据挖掘是近年来伴随着人工智能和数据库技术发展而出现的一门新兴技术,就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。随着电信市场竞争的日益加剧,运营商普遍开始向“客户驱动”管理模式转变。电信部门有着庞大的数据积累和沉淀,直接从数据中很难得到比较有价值的信息,这种现状迫切需要利用数据挖掘技术得到做出营销决策的信息。

作为一种先进的数据信息处理技术,数据挖掘与传统的数据分析的本质区别在于它是数据关系的一个探索过程,而且多数情况下是在未有任何假设和前提的条件下完成的。数据挖掘具备多种不同的方法,供使用者从不同的纬度对数据展开全面分析。

(1)相关分析和回归分析。相关分析主要分析变量之间联系的密切程度;回归分析主要基于观测数据与建立变量之间适当的依赖关系。相关分析与回归分析均反映的是数据变量之间的有价值的关联或相关联系,因此两者又可统称为关联分析。

(2)时间序列分析。时间序列分析与关联分析相似,其目的也是为了挖掘数据之间的内在联系,但不同之处在于时间序列分析侧重于数据在时间先后上的因果关系,这点与关联分析中的平行关系分析有所不同。

(3)分类与预测分析。分类与预测用于提取描述重要数据类的模型,并运用该模型判断分类新的观测值或者预测未来的数据趋势。

(4)聚类分析。聚类分析就是将数据对象按照一定的特征组成多个类或者簇,在同一个簇的对象之间有较高的相似度,而不同的簇之间差异则要大很多。在过程上看,聚类分析一定程度上是分类与预测的逆过程。

数据挖掘在电信部门中的应用主要是通过对海量数据的挖掘,找出某一种客户的比较固定的行为模式,并对这种模式进行针对性的策略,目前主要的应用方面为:客户获取,客户细分,客户赢利能力分析,客户的流失和保持分析。

(1)客户获取的传统方式一般是通过大量的媒体广告、散发传单等方式吸引新客户。这种方式涉及面过广不能做到有的放矢而且企业投入太大。数据挖掘技术可以从以往的市场活动中收集到的有用数据(主要是指潜在客户反应模式分类)建立起数据挖掘模型。企业因此能够了解真正的潜在客户的特征分类,从而在以后的市场活动中做到有的放矢而不是传统的凭经验的猜想。

(2)细分就是指将一个大的消费群体划分成为一个个细分群体的动作,同属一个细分群体的消费者彼此相似,而隶属于不同细分群体的消费者是被视为不同的。比如将数据库中的数据按照年龄的不同来组织存放这样一个简单的动作就是细分。细分可以让用户从比较高的层次上来观察数据库中的数据,细分可以让人们用不同的方法对待处于不同细分群中的客户。数据挖掘中的分类、聚类等技术可以让用户对数据库中的数据按类别、年龄、职业、地址、喜好等企业感兴趣的属性进行客户细分。客户细分是企业确定产品和服务的基础.也是建立客户一对一营销的基础。

(3)就企业的客户而言,企业的绝大部分利润是来自于小部分的客户,而对于企业来说很难确定哪些客户是高利润回报,哪些客户是低利润回报甚至是负利润回报的。数据挖掘技术能帮助企业区分利润回报不同的客户。从而可以将资源更多的分配在高利润回报的客户身上以产生更大的利润,同时减少低或负利润回报客户的投入。为此,在数据挖掘之前,企业应该建立一套计算利润回报的优化目标方法。可以是简单的计算,如某客户身上产生的收入减去所有相应的支出,也可以是较复杂的公式。然后利用数据挖掘工具从交易记录中挖掘相应的知识。在实际应用中,利用数据挖掘工具为已经流失的客户建立模型,然后利用这些模型可以预测出现有客户中将来可能流失的客户,企业就能研究这些客户的需求,并采取相应的措施防止其流失,从而达到保持客户的目的,这种分析是目前各个电信运营商比较重视的数据挖掘分析。

当运营商面临海量的客户资料时,应如何才能够从中提取出有效的信息。数据挖掘所提供的数据探索能力得到了充分的发挥,下面简要地描述数据挖掘在管理中的应用过程。下面以客户流失分析为例,数据挖掘在分析管理中的应用过程分为如下的几个过程。

(1)定义主题。客户流失分析中的主题应当包括流失客户的特征;现有客户的流失概率如何(包括不同细分客户群的流失程度);哪些因素造成了客户的流失等。主题是数据挖掘的主要目标,决定了此后过程中数据挖掘的主要努力方向,因此在定义上应当十分明确。

(2)数据选择。数据选择是数据挖掘的前提,主要是确定数据字段的收集,因为并不是所有的客户信息都会对客户的流失产生影响,应尽可能地降低数据的复杂度以发掘较高的关联度,但是考虑到后期客户流失的多维分析,应当尽量确保客户信息的完整性,因此,应对客户的有价值信息予以区分收集,剔除部分冗余数据,减少数据噪音。此间要注意的是在客户流失分析上,从数据仓库中采集数据的主要目的是调查客户信息的变化情况,因此对数据采集时间间隔的设置显得尤为重要。若采集时间过长,可能在流失判断出来时客户已然流失;若采集时间过于紧密或者实时采集则需要考虑运营商现有系统的支撑能力。

(3)分析数据。分析数据主要是对提取的数据进行分析,找到对预测输出影响最大的数据字段,并决定是否需要定义导出字段。在分析数据时需要谨慎选择对预测相关的流失客户数据参与建模才能有效建立模型。分析数据过程还应包括数据清洗和数据预处理。数据清洗和预处理是建模前的数据准备工作,主要包括数据抽样、数据转换、缺损数据处理等。数据抽样是根据事先确定的数据进行样本抽取,选择抽样而不是对整体进行处理,以降低系统的处理量。另外样本一般分为建模样本和测试样本,一部分用来建模,另一部分用来对模型进行修正和检验。数据转换是为了保证数据的质量和可用性,比如某些数据挖掘模型需要对连续数据进行离散化、归一化处理等。缺损数据有时可以不做处理,由后面具体选择的数据挖掘模型来处理。

(4)模型建立。对数据进行分析并利用各种数据挖掘技术和方法在多个可供选择的模型中找出最佳模型。初始阶段可能模型拟合度不高,需要反复更换模型,直到能够找到最合适的模型来描述数据,并从中找到规律。建立模型通常由数据分析专家配合业务专家来完成,常用的流失分析模型主要有决策树、贝叶斯网络和神经网络等。

(5)模型的评估与检验。模型建立之后,一般要通过训练集的测试才能考虑下一步应用。比较常规的验证方法是输入一些历史的流失客户数据,运行此模式予以判断,比较数据挖掘的结果与已知历史结果的差异。客户流失判断一般存在两种错误结果。一是弃真错误,即原有历史客户具备流失倾向并且已经流失,但是模型未能够准确预测客户的流失倾向;二是存伪错误,即原有用户并未有流失的倾向,但被模型判断为具有流失倾向。

(6)应用模型。从前面的工作中可以得出一些简单的结论,比如通信支出越少的客户越容易流失、欠费频率越高的客户越容易流失等。除此之外,数据挖掘人员还应配合业务专家,根据数据挖掘分析寻找流失的原因,并找出潜在的规律,对未来的客户流失进行预测,指导业务行为。

随着电信行业竞争的日益加剧,客户关系和客户价值开发将成长为电信企业考虑的重点所在,而技术的不断进步将为深度的数据挖掘提供更多的支持,也必然会被越来越多地应用到运营商的客户关系管理之中。

参考文献:

[1]韩秋明,李微,李华锋.数据挖掘技术应用实例[M].北京: 机械工业出版社,2009.

[2]Pang-Ning Tan,Michael Steinbach.数据挖掘导论[M].北京:人民邮电出版社,2006.

[3]张俊妮.数据挖掘与应用[M].北京:北京大学出版社,2009.

[4]董琳.数据挖掘实用机器学习技术[M].北京:机械工业出版社,2006.

上一篇:借鉴国外经验,依托资源优势,大力发展海南休闲... 下一篇:浅析相干光及光的相干性