数据挖掘技术在客户分类管理中的应用

时间:2022-07-31 07:27:35

数据挖掘技术在客户分类管理中的应用

摘 要:客户是企业生存和发展的关键。保持、吸引客户和充分发掘客户的盈收潜力,是企业提高核心竞争力的重中之重。本文针对电信CRM系统中当下比较关注的移动电话客户信息原始数据,利用聚类分析中的K-means算法理论,采用SPSS数据挖掘工具实现对客户群的聚类细分,得到不同类型用户的类特征,从而为管理和营销人员制定管理和营销方案提供依据.

关键词:数据挖掘;聚类分析;客户分类

中图分类号:TP31

1 序言

随着市场经济的发展,社会生产力的提高,电信行业管理按照所关注的对象经历了大致三个阶段:生产时代、产品时代和顾客时代。在生产时代,社会生产力较为低下,物质较为欠缺,企业面对的是一个需求巨大而供给不足的卖方市场,更为关注的是产值。随着社会生产力不断提高,产品日渐丰富,消费者有更多选择余地,对产品质量要求也提高,企业重心从而转化为追求产品质量,产品多样化。随着电信行业竞争进一步加剧,产品同质化现象越来越严重,消费者成为产品生产、渠道选择、售后服务等企业活动的决定力量,企业经营的核心开始从产品、生产导向逐步转移到以客户为导向,客户的地位被提到了前所未有的高度。而数据挖掘能从大量数据中发现潜在和有价值的知识,从数据库提取相关数据,作为分析依据,对客户进行分类和预测,使得企业的营销决策更具有针对性,大大提高营销成功率,为企业带来更多效益。

2 数据挖掘过程

2.1 数据准备

数据挖掘需要用到大量数据,尤其是中国电信提供的是综合性,移动产品和固网类产品及丰富的增值业务组合在一起,要采集历史使用数据,需要从各不同系统采集数据。首先从CRM系统获取客户的个人属性资料、产品及套餐、发展渠道等数据;从资源管理系统获取移动产品关联固话及宽带等固网产品的地址资源等;从CBS系统获取近半年的长市话、短信、流量、漫游结算等原始清单级数据;从CRM营销维系系统获取用户所属网格单元、服务渠道、收入局向等数据;从工作流系统获取用户投诉建议方面的资料。

2.2 数据整合

该过程的处理主要是对来自不同表的数据进行整合,包括关联和追加两种方式,其中穿插着清洗数据、构建数据和格式化数据的操作。在数据处理过程中,先将用户资料过滤掉一些对分析无用的变量,对一些变量格式进行转换,再通过一些变量衍生出新变量,如通过身份证号码可以计算出客户的性别、年龄变量,通过捆绑固话对应交接箱得出“是否竞争区域”的变量等。这个过程需要对电信业务深入分析并充分发挥创造性,才能衍生出对分析有价值的新变量。通过整合所有在网用户资料后,就得到了进行挖掘所需要的用户基本信息数据。用户通话、短信、上网等使用行为方面的数据量非常庞大,这部分取近半年的历史数据和帐务数据,先在数据库中汇总好。将用户资料数据与使用行为数据关联合并后,即生成了样本数据。数据质量对数据挖掘来说是决定挖掘成功与否的关键因素之一,在数据清洗过程中需要对一些重要字段进行数据质量检查,对于少量字段存在缺失值问题,观察缺失值是否很多,如果数据缺失值较严重,就要对缺失值进行填充处理。如果包含缺失值的字段量很小,对预测的结果影响不大,可以过滤掉这些记录。

2.3 模型构建与分析

在聚类模型的选择上,主要存在着K-Means、TW0-STEP、Kohonen等聚类分析方法。我们采用了K-Means聚类模型,因为K-Means聚类算法适用于对大量数据进行聚类的情形,且具有结果比较容易理解,建模时间比其他两种算法快等特点。K-Means聚类模型分群的个数不宜太多,一般是7加减2个群。每个分群都有比较突出的消费行为特点,而且这些特点能够被利用于产品及营销方案设计、客户服务等方面。分别从通话时长、通话次数、短信、上网流量等角度进行分析。以通话时长为例,可以选择上班时间通话时长、下班时间通话时长、周末通话时长、国际电话通话时长、总通话时长、平均每次通话时长这6个变量作为聚类变量。通过复杂的运算过程,得到一些分类结果,再经过分析汇总,可大致得出如下分类:

(1)高端单位或商用客户,此类客户ARPU较高,白天上班时间通信行为繁忙,总通话时间长,而且长途和漫游次数最高,联系地区和号码数最多,平均通话时间也较长,说明用户业务使用频繁。联系客服次数也较多,说明用户对产品服务比较关心。语音、数据业务费都最高,对各类型业务应用较多,与他网号码互通比例高,说明用户对其它运营商有一定的关注了解程度。针对这类高价值客户的特点,可以对其进行定期外呼回访,提高用户感知。在制定优惠策略时设计针对性的费用优惠套餐来引导用户更积极的使用各类新业务。

(2)本地繁忙客户,此类客户主被叫次数及通话总时长都较高,以本地通话为主,单次平均通话时长较短,联系号码数也多,漫游少,短信和数据业务量也较少。针对这些特点,可指定相应策略,巩固发展这类客户,鼓励其延长单次通话时长,对于新业务的应用,需要进行针对性的推广,以发掘该类客户的长途潜力。

(3)资费敏感客户。该类客户占总用户的比例少,ARPU较低,通话次数手啊,但平均时长较长,可以猜测此类客户一般都是有事情才打电话。IP通话时间比例较高,夜间通话次数较高,可以看出其对资费比较敏感。该类客户有一定的新业务使用需求,可进行适当关注,长途费用占比不很低,可以挖掘该类客户的长途应用需求,进行外呼回访,了解需求,提高其忠诚度。

(4)网内联系紧密客户。该类客户互通电话或短信的同网占比最高,联系紧密。是最优质的客户群,他们对中国电信提供的服务较为依赖,交往圈子广,服务使用频繁,这类用户应该尽量提高服务质量。

(5)流量专家,该类客户ARPU值相对较高,数据业务费用占比最高,月均上网流量和上网时长最高。针对这类客户,如每月实际使用流量经常超过流量包限额,可以针对性营销流量加餐包,或引导客户提高流量套餐档次。

(6)短信专家,该类客户信用额较低,通话次数、时长都较低,联系地区和号码数也较少,但短信发送量较大。对该类客户,可设计一些短信套餐来保持客户,并利用客服系统向用户推荐,引导用户使用其他新业务。

(7)不常使用客户,这类客户ARPU、通信次数、通信时长、联系电话数均较低,属于较低值的客户群体。其对通信即不积极也不很消极,有一定费用优惠比例,也许是出于资费方面的考虑,可向该群体大力介绍中国电信相关业务,在其对产品套餐深入了解后,有可能选择适合自己的新业务,同时也提高了该客户群的价值。

3 结束语

本文对中国电信客户进行了分类,分析了各类用户的显著特性并给出了一定的市场建议。利用这个营销客户分群的结果可以做很多事情,比如:

(l)通过了解各客户群的优势和弱势特征可以识别新的营销机会,从而有针对性地进行差异化套餐设计。

(2)客服部门也可以参考这个用户分群结果对不同类型的客户进行有针对性的差异化客户服务。

(3)在设计促销活动的时候可以参考这个客户分群结果来选择正确的客户宣传范围。

(4)客户分群还可以和离网预测模型相结合,这对在进行客户挽留的时候了解挽留目标的特征也会有很大帮助。客户分群是从大众营销向差异化的一对一营销过渡的必由之路,也是保持竞争优势的基础,而数据挖掘可以助力于这个转变,为其提供技术保障。

参考文献:

[1]朱明.数据挖掘[M].合肥:中国科学技术大学出版社,2002.

[2]李德毅.数据挖掘研究现状.数据仓库之路[M],2000.

[3]张文彤.SPSS统计分析高级教程[M].北京:高等教育出版社,2007.

[4]杨继成,杨炳勋.专业技术人员科技论文写作教程[M],2009.

作者简介:中国电信股份有限公司汕头分公司,广东汕头 515041

上一篇:基于工作过程的《排版软件应用》课程教学研究 下一篇:物联网的安全问题及应对