基于数据挖掘技术的客户关系管理系统研究

时间:2022-09-29 04:18:24

基于数据挖掘技术的客户关系管理系统研究

摘要:本文针对某烟草企业客户关系管理应用的现有需求和发展趋势以及客户关系管理理论的特色,提出基于数据挖掘技术的客户关系管理优化策略,讨论了数据挖掘技术在客户关系管理中的具体作用并对CRM中的数据挖掘过程进行了分析和研究,描述了原型验证系统的具体实现,探讨了实用化的可行性。

关键词:客户关系管理数据挖掘关联规则

中图分类号:TP311 文献标识码:A文章编号:1009-3044(2007)12-21511-03

The Design and Implementation on Client Management System of Tobacco Enterprises

XU Le-ping

(Hefei University of Technology,Hefei 230001,China)

Abstract:On the basis of the existing demand and development tendency of customer relationship management application in some tobacco enterprise and the characteristics of customer relationship management theory, this thesis proposes the optimization strategy of customer relationship management based on data mining technology, and analyzes the concrete function of data mining technology in customer relationship management and studies its data mining process, describes the concrete realization of prototype confirmation system and discusses the practical feasibility.

Key words:Customer relationship management; data mining; connection rule

1 引言

本文以一个烟草企业管理系统为背景,设计了一个原型验证系统。客户关系管理的思想贯穿了系统的整个实现过程。该系统解决了传统客户关系管理中存在的数据不一致、易丢失、只能进行离散的简单数据查询等问题,为数据挖掘技术在商业领域的实用化做出了有益的尝试,为提高客户关系管理的时效性提供了可行的技术途径。

2 系统背景与基础

目前,烟草企业的经营管理基本上已实现了电子化。烟草企业通过各种方法开发客户、巩固客户关系,然而在市场管理、销售管理、客户服务与支持中存在着许多问题。为解决问题,本文设计了一套新型的管理系统,在系统中全面采用了CRM的思想。该系统完全以客户为中心,严格按现代营销管理理念设计,注重对客户全方位的管理。它将有助于优化市场、销售、服务和支持等面向客户的业务流程,增强各部门间协同工作的能力,加快客户服务和支持的响应速度,提高客户满意度和忠诚度。同时,还可以对客户信息和营销信息进行智能分析,从而发展潜在客户和新的市场,扩大市场份额,增加效益。

开发中,本文有针对性设计的CRM系统以简单易用、注重客户分析、以销售过程管理和客户服务为主。由于客观条件限制,原型系统的数据都是本文参考其它数据库模拟输入的。虽然没有采用真实的数据资料,但是表结构和数据量等已能满足数据分析的需求。

3 系统功能描述

烟草企业客户关系管理系统的基本功能包括:销售管理、客户管理、市场管理、分析决策等四个功能模块。

销售管理:与客户或合作伙伴进行订单签约、完成销售行为而涉及的工作管理。其中订单是企业销售业务的主要数据载体,也是客户关系管理的主要数据分析来源,因此订单管理是客户关系管理系统的重要组成部分。退货管理主要完成对客户所作退货单的定义、维护和查询功能。在销售过程中,烟草企业客户管理系统可以及时提供客户的有关信息,增加业务员对客户的了解。

客户管理:客户信息中蕴含着巨大的价值,通过对客户信息的分析、挖掘可以深入了解客户的需求;发现客户进行交易的规律;发现价值客户的构成规律等等,这些信息将对正确决策,提升业务有着重要的意义。客户信息管理模块可完成对客户信息资料的录入修改查询等功能。通过反馈处理主要完成客户服务反馈单的录入、维护、关闭和查询功能。同时可以将某个客户反馈分解为多个任务来执行。客户关怀可以通过对客户对象挖掘功能,对客户和合作伙伴的历史交易信息进行分析,可以找出对企业的营业额、利润的产生至关重要的客户和合作伙伴――价值客户;可以找出与企业交易发生上升或下降情况的客户和合作伙伴――价值变动客户;可以找出对企业的产品或服务不满程度较高的客户和合作伙伴――问题客户。同时系统通过分析适时做出客户关怀建议,为企业巩固老客户,提高老客户的满意度和忠诚度提供了可能。

市场管理:市场管理是为销售开辟渠道,营造售前、售中和售后环境的行为管理。根据对市场情况的分析,创建市场活动项目,并对项目反馈信息进行编辑、对项目的执行情况进行评价。市场信息通过新增市场活动主要完成的是企业市场活动的信息录入、维护和查询功能。竞争管理是对企业竞争对手的信息进行统一化管理,主要完成与企业构成商业竞争关系的企业信息定义、维护和查询功能。包括竞争对手的基本信息、竞争对手产品以及产品比较。价格定位管理主要用于销售订单上的产品定价,本系统主要提供五种方式,即伙伴价格、会员价格、现金价格、促销价格和员工价格等。

分析决策:对客户、合作伙伴、竞争对手、市场、销售、服务、产品的各种信息进行数据挖掘、统计和分析,为企业发展提供决策依据。决策是企业管理者必须经常进行的工作。决策对企业的意义十分重大,可以说决策水平的高低,决定了企业的竞争力。烟草企业客户管理系统采用OLAP和数据挖掘方法,为用户提供了多种分析和预测工具,可以方便的对客户、产品、进程、任务、预算、计划、费用等等信息进行分类统计,用以分析销售、市场和服务业务的运行情况,从而做出科学、正确的决策。

4 系统结构描述

烟草企业客户管理系统(tobacco customer relationship management,即TCRM)是在Windows 2000, SQL Server 2000, VB6。0环境下开发,采用目前流行的C/S结构。前端客户系统采用VB开发,后台数据库采用SQL Server 2000系统。

烟草企业客户管理系统的系统结构图如图1所示。

(1)系统服务器

烟草企业客户管理系统服务器采用了先进的Microsoft SQL Server 2000数据库系统,它是一个开发大规模联机事务处理(OLTP)、数据仓库和电子商务应用程序的优秀数据库平台,连续两年在解决方案提供商整体满意度方面夺得最佳数据库产品称号,获得了数据库产品整体性能项目的第一,并且它是目前世界上最快的数据库系统。

图1 烟草企业客户管理系统的系统结构图

(2)业务处理模块

包括如客户信息的录入、编辑、查询,销售订单的执行等业务功能应用模块。这些应用程序采用VB生成,通过ODBC, ADO访问服务器中的联机事务处理(OLTP)数据库。分析决策应用模块为它提供了强大的信息及策略支持。

(3)分析决策模块

主要完成分析、数据挖掘并给客户提供决策支持功能模块。该模块充分利用了Analysis Services强大的分析及数据挖掘功能。这些应用程序采用VB生成,通过OLE DB, ADO访问PivotTable服务。

(4)Analysis Services

Analysis Services用于联机分析处理(OLAP)和数据挖掘,包括一个分析服务器,将数据仓库中的数据组织成用于分析的多维数据集,同时还提供对多维数据集信息的快速客户端访问,以便为复杂的分析查询提供快速解答。

烟草企业客户管理系统在Analysis Services中引入数据挖掘,用于在OLAP多维数据集和关系数据库中发现信息,以多维表单或关系表单的形式发送到客户端。系统根据烟草行业的特点,设定了一组挖掘模型,为用户提供强大的分析决策服务,用户可以对多维OLAP和关系数据源这两类数据应用数据挖掘模型,并且用户还可以根据需要对这两类数据自己定义新的挖掘模型。

(5)PivotTable服务

提供客户端OLAP数据访问功能,通过这一服务,客户端应用程序通过基于客户端的PivotTable服务组件连接到分析服务器,PivotTable服务与分析服务器进行通讯,以访问分析服务器上的OLAP数据和数据挖掘数据。同时,PivotTable服务也可根据用户的请求创建本地数据挖掘模型,当用户创建新的数据挖掘模型时,PivotTable将其存放在客户端计算机上。

PivotTable服务可根据用户的请求创建本地数据挖掘模型文件,处理来自服务器上的多维数据集或表的模型,或来自OLE DB关系数据库的模型。

5 OLTP数据库模型的设计与实现

准确地设计数据库以建立业务模型是至关重要的,因为数据库一旦实现完毕,再对其设计进行更改将花费大量的时间。另外,数据库设计的良好与否,将直接影响到整个系统的结构稳定与实现。在设计数据库时,一般采用下列基本步骤:

(1)收集信息;

(2)标识对象;

(3)建立对象模型;

(4)标识每个对象的信息类型;

(5)标识对象之间的关系。

OLTP系统主要记录支持日常操作所需的数据。经过对该烟草企业的实际业务的深入分析,烟草企业客户管理系统采用了账户、时间、库存事实表、销售事实表、部门、分类、工资表、顾客、奖励、开销事实表、库存、库存分类、商品、商品分类、员工等20个对象,并确定对象之间的关系。

6 数据仓库模型的设计与实现

为管理层提供及时的决策信息,为业务部门提供有效的反馈数据都需要建立一个整合的、结构化的数据模型,在此基础上对数据进行标准化、抽象化、规范化分类、分析。在烟草企业客户管理系统中,这个处理大量数据的数据仓库将复杂的客户行为数据集中起来,从本质上说就是按管理控制的需要重新组织数据,在有效组织数据的基础上提高管理效率。

设计数据仓库构架与设计基于实体关系建模的OLTP系统架构有很大的不同。OLTP系统的目的是捕获高比率的数据更改和添加,而数据仓库与OLTP相反,其目的是组织大量的稳定数据以便于分析和检索。由于目的不同,在数据仓库设计中有许多不同于OLTP数据库设计的考虑。必须将数据仓库数据组织起来以符合数据仓库的目的,即快速访问信息以进行分析和创建报表。本系统采用了多维度建模,用于数据仓库数据库的设计,其目的是组织数据以提高数据查询的效率。以多维方式建立数据模型可简化联机业务分析,提高查询和数据挖掘性能。通过创建数据多维数据集,可将存储在关系数据库中的数据转换为具有实际含义并且易于查询的业务信息。为了支持最终用户提出的问题,多维数据集将数据按多维结构组织到维度和度量值中。

烟草企业客户管理系统的数据仓库模型结构图如图2所示。

图2 数据仓库模型结构图

本系统主要采用了最常用的多维数据方式――星型架构。数据库中包括一张“事实表”,对于每一维都有一张“维表”。事实表中的每一元组包含一些指针(是外键,主键在其他表中),每个指针指向一张维表,这就构成了数据库的多维联系。在每张维表中除包含每一维的主键外,还有说明该维的一些其他属性字段。“维表”记录了维的层次关系。

对数据仓库模型执行查询分析,需要花大量时间在相关各表中寻找数据。而星形模型使数据仓库的复杂查询可以直接通过各维的层次比较、上钻、下钻等操作完成。

在转换数据库模式到星型模式时,分以下四个步骤进行:

(1)设计事实表

设计事实表的主要目标是最小化表的大小。事实表是数据库中最大的表,因为它们包含了基本的商业事务的详细信息。然而,一定要考虑存储和维护这些大表的成本。例如,大表的处理时间比较长、备份和恢复的时间比较长、执行查询的时间也比较长。降低事实表大小的最简单方法如下:降低列的数量、尽可能地降低每一个列的大小、把历史资料归档到单独的事实表等。

(2)设计维表

设计维表的主要目标是参考事实表的资料到一个单独的表。最常用的维数据应该直接参考事实表,而不是通过其它维表间接参考维度表。这种方法可以最小化表连接的数量,提高系统的性能。

(3)确定事实表和维表的关系

正确确定事实表和维表的关系对于建模十分重要。如果确定不正确,那么数据仓库的性能就比较差,在以后可能需要重新设计。重新设计一个可能包含了大量资料的数据仓库是一项耗费很大的任务。确定事实表和维度表的结构和组成的过程比较难。

(4)实现数据库设计

最后一步是在Microsoft SQL Server中物理地实现数据库。当创建数据库时,考虑分区策略,可以使用由SQL Server提供的可以并行处理资料的文件组。当创建用于存储事实和维度的表时,应该尽可能地考虑数据库的分区策略,把事实表分别存储在不同的文件组上。索引可以加速数据仓库的检索,应该在每一个维度表的关键词列上创建一个索引。

7 数据挖掘模型的设计与实现

数据挖掘模块分析关系数据库和OLAP多维数据集中的数据,以便发现感兴趣的信息。通过创建数据挖掘模型,客户端应用程序可以用数据挖掘算法发现OLAP多维数据集中的信息。

7.1 数据挖掘模型的构架

数据挖掘模型(Data Mining Model, DMM)是一个虚拟结构,它表示关系或多维数据的分组和预测分析。数据挖掘模型的结构在许多方面与数据库表的结构相似。但是,数据库表存储原始数据,而数据挖掘模型的结构表示定义数据挖掘模型的事例集,而所存储的是数据挖掘算法所发现的规则和模式。

下面举例说明事例和事例集的组成。数据库可能包含一个顾客数据表、一个定单数据表和一个定单项目表。表中的每条信息就是一个记录。对于每个顾客记录,可能有一个或多个定单记录,每个定单记录有一个或多个定单项目记录。定单记录和定单项目记录之间的关系意味着:对于每个顾客在此关系中可能存在许多记录。单个客户的相关数据的集合称作一个事例,而一组客户的相关记录的集合则称作一个事例集。定单项目信息可以看作是顾客事例的特性。

事例集只是查看物理数据的一种方式;实际上,相同的物理数据可以构造不同的事例集。客户事例集示例所依据的前提是您需要以客户作为焦点来挖掘定单项目信息。此焦点容易改变为以定单项目为焦点来挖掘客户的数据。此时物理数据不会更改,但是可以轻易构造独立的数据挖掘模型以反映焦点的更改,这样顾客信息就成为定单项目事例的特性。

数据挖掘模型将事例集按数据挖掘列的集合的形式存储起来,数据挖掘列用于定义数据挖掘模型的输入和输出。每个数据挖掘列可以包含几种不同的内容类型,这取决于该列在数据挖掘模型中的用途。每个列类型都有其自己的属性和行为。例如在客户事例中,对于每一客户示例,都有一个描述该客户的行。此行包含客户ID列和客户信息列,以及一个名为Order Items的列。Order Items列包含了一组行。每一行描述与客户行中指定的客户相关的订单项目。

客户的一些特性(如年龄和性别)可能会用来对将来客户的行为进行进一步的分类和预测。数据挖掘过程中最重要的任务之一就是确定每一个特性在分类和预测中的作用。

7.2 数据挖掘模型的训练

要确定数据挖掘模型中每个特性的相对重要性,需要对数据挖掘模型进行训练。数据挖掘模型可以使用OLAP多维数据集或数据仓库的数据进行训练,首先依据三个步骤将数据挖掘列依次添加到数据挖掘模型中:

(1)选择事例一一确定用于创建数据挖掘列的事例维度和级别;

(2)选择被预测实体一一创建可预测数据挖掘列;

(3)选择训练数据一一创建输入数据挖掘列。

然后对提交给数据挖掘模型的训练数据应用数据挖掘算法,建立能够基于输入列的值来预测或解释输出列的值的数据挖掘模型。

最后数据挖掘模型将保存对训练数据分析的结果和模型本身的抽象性(不保存用于训练的数据)。因而同一个数据挖掘模型可以应用于其事例集的其它数据,以提供预测分析。

数据挖掘算法是数据挖掘进程的中心,它使用数据挖掘列来生成预测模型,数据挖掘列能提供有关事例集的预测、变化或可能性的信息。许多数据挖掘算法是面向目标的,即给定一个事例集后,数据挖掘算法将对该事例(通常是事例的某个特性)进行某一方面的预测。大部分情况下都需要一个事例训练集,该训练集中事例的特性是已知的,对该训练集应用数据挖掘算法来构造数据挖掘模型,该模型对事例(事例的特性为未知)的特性具有预测能力。

在烟草企业客户管理系统中主要使用了两种数据挖掘算法:决策树算法和关联规则算法。

7.3 数据挖掘模型的建立和使用

烟草企业客户管理系统提供了两种建立和使用数据挖掘模型的方法:

一是根据以前的经验和需求,预先在系统服务器中设定一系列相应的数据挖掘模型,用户通过访问模块直接选择相应的数据挖掘模式进行数据的分析预测。

二是对于新的需求,用户可以自定义新的数据挖掘模型。

8 系统特点及优势

系统完全以客户为中心,注重对客户全方位的管理,实现各渠道的信息共享,改善部门间的沟通,提高员工的工作效率,合理安排业务活动,跟踪、把握商业机会;

客户可以自己选择喜欢的方式,同企业进行交流,得到更好的服务;

系统科学地分析客户类型和需求,实现个性化营销,可根据实际情况,进行灵活设置各种输入界面和内容,满足客户的各种需求,充分实现个性化;

提供便捷的客户服务,提升客户服务的满意度和忠实度,可帮助企业留住更多的老客户,并更好的吸引新客户;

系统安全可靠,提供功能权限管理,既保证了客户信息的共享性,又保证了客户信息的安全性。

参考文献:

[1]罗纳德・史威福.客户关系管理:加速利润和优势提升[M].中国经济出版社,2002,3.

[2]田同生.客户关系管理的中国之路[M].机械工业出版社,2001,8.

[3]吴为,杨斌,朱仲英.关于CRM系统技术的探讨[J],微型电脑应用,2002,9.

[4]中国人民大学统计学系数据挖掘中心.建立数据挖掘为基础的客户关系管理体系[J].统计与信息论坛,2002,7.

[5] 李宝东,宋瀚涛.数据挖掘在客户关系管理(CRM)中的应用[J].计算机应用研究,2002,10.

“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。”

上一篇:基于.NET的地区电网集成信息系统设计与实现 下一篇:移动IPv6中的实时业务与QoS