论企业客户关系管理系统中数据仓库与数据挖掘的作用

时间:2022-02-24 11:19:12

论企业客户关系管理系统中数据仓库与数据挖掘的作用

【摘要】本文对数据仓库与数据挖掘技术进行了详细的分析,对数据仓库与数据挖掘技术在企业客户关系管理系统中应用的方式和技术进行了探讨。

【关键词】企业客户关系管理;数据仓库;数据挖掘

随着数据库技术、网络技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大。然而,如何有效地使用这些数据却成为一个问题,因为往往是数据丰富而知识缺乏,人们目前所使用的数据库技术无法将隐藏在数据背后的重要信息挖掘出来利用,所以如何迅速、准确、有效且适量地提供用户所需的信息,发现信息之间潜在的联系,支持管理决策就是数据挖掘和数据仓库要解决的课题,同时也是客户关系管理系统产生的必要条件和最终目的。

一、数据仓库与数据挖掘技术分析

1.1数据仓库

数据仓库是一个在企业管理和决策中面向主题的(Subject- Oriented)、集成的(Integrated)、反映历史变化的(TimeVariant)、相对稳定(Non-Volatile)的数据集合。我们可以从两个层次加以理解:首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重组,并及时提供给相应的管理决策人员,是数据仓库的根本任务。因此,从产业界的角度看,数据仓库建设是一个工程,是一个过程。

整个数据仓库系统是一个包含4个层次的体系结构,具体如下:

1、数据源:是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。内部信息包括存放于RDBMS中的各种业务处理数据和各类文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息等。

2、数据的存储与管理:是整个数据仓库系统的核心,数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库的核心,则需要从数据仓库的技术特点着手分析,针对现有各业务系统的数据,进行抽取、清理,并有效集成,按照主题进行组织。

3、OLAP服务器:对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。其具体实现可以分为:ROLAP、MOLAP和HOLAP。ROLAP基本数据和聚合数据均存放在RDBMS之中;MOLAP基本数据和聚合数据均存放于多维数据库中;HOLAP基本数据存放于RDBMS之中,聚合数据存放于多维数据库中。

4、前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。

数据仓库要求数据量大,数据正确全面,所以数据在进入数据仓库前必须经过提取、转换与集成,把数据按主题分类,形成多维数据模型。它以多维数据模型为基础,实现数据的分析处理,主要用于支持管理决策。数据进入数据仓库后,一般会被长期保存,基本不会进行修改和删除操作,主要实现数据的查询。

数据仓库与传统关系型数据库不同,主要区别在于数据仓库打破了关系数据库中数据的规范性,实现了数据的重组,增加了数据冗余度;其次传统关系型数据库为了实现数据处理的及时性,要求数据尽量少,而数据仓库为了更有效的实现数据查询,要求存储的数据尽量多,实现海量存储。

1.2数据挖掘技术

数据挖掘技术,是近几年国内外迅速发展起来的一门交叉学科,涉及到数据库、统计学、人工智能与机器学习等多个领域,并在金融、商业零售、电信以及生物医学和基因分析等领域得到广泛应用。

1.2.1数据挖掘的概念

数据挖掘(Data Ming),是指从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,提取的知识一般可表示为概念(ConcePts)、规则(Rules)、规律(Regularities)、模式(Patterns)等形式[3]。

数据挖掘是知识发现的过程,是将未加工的数据转换为有用信息的整个过程。该过程包含一系列的步骤:确定业务对象、数据准备、数据挖掘、模式评估和知识表示[4]。

1.2.2数据挖掘的技术与方法

数据挖掘方法是以数据库为对象,基于机器学习、科学计算、统计分析等技术,形成了数据挖掘方法和技术。一般,数据挖掘常用的技术与方法可以分为以下几个方面:

1)决策树方法

决策树方法是利用信息论的原理建立决策树,主要用于分类和预测。决策树是一种简单的知识表示方法,它将事例逐步分类成代表不同的类别。由于分类规则比较直观,易于理解,实用效果好,影响较大,因而得到广泛应用。决策树最早的算法是Quinlan提出的ID3算法,最流行的是其改进版的C4.5算法。

2)聚类方法

聚类分析是直接分析样本,按照各样本数据间的距离远近将样本数据分成若干个不同的类。一般,同一类中的对象相似度很高,不同类中的对象相似度很差。聚类分析属于无监督的分类方法。

3)统计分析方法

统计分析方法是通过统计学中的技术方法实现数据库的数据分析,发现数据间的关系和规律。常用的方法有:回归分析、相关分析、主成分分析等。

4)关联规则

关联规则通过对给定数据集中的数据进行关联分析,描述一个事物中某些属性频繁同时出现的条件,发现隐藏在其中的有趣的联系或规律。一旦建立起数据项间的关联规则,则其中某一项的属性值就可以依据其他属性值进行预测。

5)可视化技术

可视化数据分析技术在传统图表功能基础上进行了拓展,为用户提供交互式的数据浏览,帮助用户更清楚地剖析数据。当所要识别的不规则事物是一系列图形而不是数字表格时,人的识别速度是最快的。

二、数据仓库与数据挖掘技术在客户关系管理中的应用

2.1客户关系管理

客户关系管理(CRM)关注的是企业与客户之间实时、方便的信息交互,通过与客户多渠道的接触、交流和沟通,实现从“接触管理”到“客户关怀”的角色转变,企业的经营中心也从产品或市场转变为客户。客户关系管理最核心的任务是对企业运营过程中所得到的各种数据进行分析,进而为企业经营决策提供支持和依据。

从功能上来看,CRM系统可分为三种类型:

1)操作型CRM

操作型CRM也称为流程型CRM,主要用于客户信息的自动集成过程,实现企业各部门对客户信息的协同合作。

2)分析型CRM

分析型CRM用于分析操作型CRM中产生的各种数据,使用数据仓库和数据挖掘技术产生商务智能,为企业决策提供支持。

3)合作型CRM

合作型CRM用于企业与客户的合作服务系统,包括电话、呼叫系统、电子邮件等,它能实现客户信息的全面收集。

2.2数据仓库的形成

数据仓库是CRM的中央存储系统。在这个信息爆炸的时代,各个企业经过长期经营,收集了大量的客户数据。而这些海量、异构的数据被分散在不同部门,没有得到充分合理的利用。因此,首先要做的是对这些海量分散的数据进行清洗、集成和转换,建立一个整合的、标准化、结构化的数据模型,形成全面、一致和面向决策的数据,即数据仓库。对已形成的数据仓库,按照不同的主题,产生多个对应的数据处理模块,如普通客户数据模块,Vip客户数据模块,团体客户数据模块等,这种多数据模块的建设有利于分析不同客户的行为特点。

2.3数据挖掘技术的应用

使用数据挖掘技术对企业客户信息进行分析,从而挖掘出对企业发展有价值的信息,如:新客户开发、交叉销售及预测、客户信用分析、客户细分、客户类别分析等客户关系管理功能,为企业决策者提供更有效的的决策支持,最大程度地发挥企业CRM的作用。

近年来,随着市场竞争的加剧,企业要想获得一个新客户,所花费的开销往往是争取留住老客户的几倍。有统计数据表明:

1)公司一般每年平均流失10%的老客户;

2)企业留住5%的老客户,利润提升100%;

3)开发新客户的成本是留住老客户成本的5-8倍;

4)一个公司如果将其客户流失率降低5%,其利润就可能增加25-85%。

因此保持老客户就显得更有价值。那么,如何才能预防、减少客户的流失呢?一个非常重要的工作就是要找出顾客流失的原因。我们可以通过数据挖掘技术实现这一目标。

现以电信公司判断用户离网的可能性来做分析,首先进行数据准备,抽取一定量的用户信息,提取的信息主要包括:用户号码、用户类型、用户状态、话费性质(长话/市话)、欠费情况、投诉次数等,利用这些数据,我们来建立判断用户离网可能性的模型。

在数据准备和适当的预处理之后,我们采用决策树中的C4.5算法建立决策树模型。这里,我们引入了信息论中的信息增益率的概念并以此作为属性选择的标准,其核心是在决策树的各级节点上选择属性时用信息增益率作为属性选择标准。通过计算这些属性的信息增益率,找出“投诉次数”属性作为决策树的根节点。扩展决策树节点,进行分枝,其他中间节点也是选择各节点检测属性增益最大的属性,同级的预选属性的增益相同时,规定选择属性值个数较少的属性作为当前节点的分枝,最后,我们可以生成一棵决策树。生成的决策树还需要进行进一步验证,才能最终得到可用的分类模型。选择一些具有共同特征的已离网用户作为测试数据,输入属性值进行离网判断,检验模型的正确性,生成最终的决策树模型。使用生成的决策树模型,对比用户的信息是否贴近离网用户的特征属性值,能大致预测出该用户的离网可能性,对离网可能性高的用户,根据其特征属性进行挽留工作,从而预防、减少客户的流失。

三、结束语

在企业客户关系管理系统中有效利用数据仓库和数据挖掘技术,可以为企业高层决策者提供准确的客户分类、忠诚度、赢利能力及潜在用户等有用信息,指导他们制订最优的企业营销策略、降低银行运营成本、增加利润,加速企业的发展。相信未来会有更多的行业加入使用客户关系管理的行列中,通过数据仓库和数据挖掘技术挖掘出对自身发展有用的信息,也必使客户关系管理的目标得到更好的实现。

参考文献

[1]余英泽,廖里,吴渝. 一种新型的数据分析技术——数据挖掘[J]. 计算机与现代化,2000(1).

[2]王实,高文. 数据挖掘中的聚类方法[J].计算机科学,2000(4).

[3]白雪.数据挖掘技术在客户关系管理中的应用研究[J] .大众科技,2012 (2).

[4]Han Jianwei,Micheline Kamber.Data Mining Concepts and Techniques[M].Morgan Kanfmann Publishing,2000.

[5]陈安.数据挖掘技术及应用[M].北京:科学出版社,2006.

[6]董宁.数据挖掘技术在CRM中的应用[J].计算机工程与设计,2007(6).

上一篇:用友:“2P”决胜未来 下一篇:用“正能量”打赢中国式的“保胃战”