关联规则在旅行社CRM中的应用

时间:2022-07-28 09:50:47

关联规则在旅行社CRM中的应用

摘要:对于旅行社来说,CRM战略可以提高其核心竞争力,达到竞争制胜、快速成长的目的,如何利用数据挖掘技术从CRM数据中找出更有价值的知识和规则,无疑是人们非常关注的课题之一。本文介绍了数据挖掘中关联规则的概念及作用,对其Apriori关键算法给出了剖析,并结合在旅行社CRM中游客消费的旅游产品的特征的具体应用,进而阐明了基于Apriori算法的CRM数据挖掘,对于旅行社在新的竞争环境下增强优势的重要意义。

关键词:数据挖掘;关联规则;Apriori算法;CRM;旅行社;旅游产品

中图分类号:TP311 文献标识码:A文章编号:1009-3044(2007)12-21508-03

Application of Association Rules in CRM of Travel Agency

XU Hui-min

(College of Information Management of Chengdu University Of Technology,Chengdu 610059,China)

Abstract:For travel agents, CRM strategies may enhance their core competitiveness, to win their competition and the purpose of the rapid growth, How to use data mining technology from CRM data to identify the more valuable knowledge and rules, No doubt people are very concerned about one of the topics. This paper introduces Association Rules’ concepts and roles in Data Mining, and analyzes the key algorithm of Apriori, Combining characteristics of spending on tourism products by tourists in CRM of the travel agency, then expounds that CRM data mining based on Apriori algorithm has important significance for the travel agents to enhance their advantages under the new competitive environment.

Key words:Data Mining;Association Rules;Apriori algorithm;CRM;travel agency;tourism products

1 引言

面临残酷的市场竞争,所有的企业都在不遗余力地争取尽可能多的客户,与客户保持长期稳定地关系。客户关系管理(Customer Relationship Management 以下简称CRM)作为一种旨在改善企业与客户之间关系的新型管理理念应运而生,它的核心是“了解客户,倾听客户”,它的目标可以概括为“吸引潜在客户进入,提高现有客户满意度和忠诚度,降低客户流失”,总之一切的最终目的――提高收益与竞争力。作为旅游业三大支柱之一的旅行社要想从市场中胜出,实施CRM的重要性不言而喻。然而日积月累,CRM数据库中的数据日益增长,人们希望能够提供更高层次的数据分析功能,自动和智能地将待处理的数据转化为有用的信息和知识。数据挖掘正好为我们提供了解决上述问题的有效方法,它通过对客户需求进行深入地分析,发现数据之间的潜在联系,为我们提供自动决策支持。本文将就数据挖掘技术之一的关联规则在旅行社客户关系管理中的应用作一简浅讨论。

2 关联规则

随着数据库技术的飞速发展及人们获取数据手段的多样化,收集和存储在数据库的数据规模越来越大,人们对从这些数据寻找有价值的信息越来越有兴趣。关联规则作为数据挖掘的重要的研究方法之一,就是用于发现隐藏在这些大型数据集中有价值的数据间的相互联系的规则。它最早是由Agrawal等人于1993年提出的,最初是用来发现人们的购物篮中不同商品之间的联系,以期分析顾客的购买习惯。例如,我们对一个便民食品店Pos机及其后台数据库的联网分析发现,很多顾客在购买酱油、醋的同时,还同时购买料酒。除购物篮数据外,关联规则已广泛应用于其它领域,如生物信息学、医疗诊断、网页挖掘和科学数据分析等领域中。

2.1 基本概念

2.2 解决方法

一般地,给定一个数据集D,关联规则挖掘的任务,就是要通过用户指定最小支持度和最小置信度来寻找强规则的过程。因此,该任务又可以划分为以下两个子任务。

(1)寻找所有频集

通过用户给定的最小支持度,寻找所有频集。事实上,这些频集可能具有包含关系,一般地,我们只关心那些不被其它频集所包含的所谓最大频集的集合。寻找所有频集是形成关联规则的基础。

(2)生成关联规则

通过用户指定的最小置信度,在每个最大频集中,寻找置信度不小于最小置信度的关联规则。

2.3 Apriori算法与寻找频集

Apriori算法是挖掘产生布尔关联规则所需频集的基本算法,也是一个很有影响力的关联规则算法。该算法是根据有关频集特性的先验知识(prior knowledge)而命名的,它利用了一个层次顺序搜索的循环方法来完成频集的挖掘工作,即利用k-项集来产生(k+1)-集。具体做法:首先找出频1-项集,记为F1;然后利用F1来挖掘F2,即频2-项集;不断如此循环下去直到无法发现更多的频k-项集为止。每挖掘一层就需要扫描整个数据集一遍。为提高按层次搜索并产生相应频集的处理效率,Apriori算法利用了一个重要性质,即上述定理1所述,该性质可有效缩小频集的搜索空间。下面给出Apriori算法描述:

3 旅行社CRM简介

由于目前我国绝大多数旅行社提供的产品是预售游客进行旅游活动所需的各项综合性的服务或服务组合,而且是以包价形式出现的组合性旅游产品,其存在和发展总是离不开对客源市场和其他相关旅游企业的支持,由此决定了旅行社经营活动的重点是要积极主动的和客源市场和相关企业建立长期可靠的相互协作和信任关系,从而客户资源成为了旅行社生存发展的重要因素。而CRM将游客视为一种宝贵的资源,并纳入到旅行社的经营发展中来,旅行社的工作人员就可以对游客的兴趣、爱好、购买习惯的进行追踪服务,重视与游客的及时双向的沟通,围绕游客开展旅游产品的开发、推广,通过为游客提供全程服务提高顾客满意度和忠诚度,从而实现对游客服务的时间和空间的拓展和服务的增值,为旅行社带来盈利。

旅行社CRM采用B/S结构,多层软件架构确保了系统的扩展性和适用性:客户关系管理系统支持Microsoft SQL Server、Oracle等多种后台数据库系统;客户关系管理系统支持多种类型的客户端,如Web Browser、Wap Browser等;客户关系管理系统独立的应用层使得企业业务逻辑的更新和扩展更为方便和容易。同时,基于这种多层结构,应用智能负载均衡与集群等技术实现系统服务能力的扩展。模块设计如图1。

图1

4 关联规则在旅行社CRM中的应用

4.1 规则挖掘在这里将对游客消费项目(即旅行产品)的特征进行分析,判断出游客的行为方式和消费习惯,进而将游客分类,分析不同类型的游客的价值,确定旅行社的目标市场,制定出详细的计划。在旅行产品的众特征中,依据旅行社的自身经营特色,这里只抽取其最常见/重要的五种来刻画,并标记每种为――I1:体验性;I2:休闲化;I3:生活化;I4:娱乐化;I5:生态化。

采取VC编写程序进行实现,其中所用的数据如游客是否为重要客户是已经采集/分析过的,在此不累述。原始数据见表1,共取9条记录,假设最小支持度为2,最小置信度为60%。

在获得的候选3-项集C3时,首先假设C3=F2?茌F2,即为{{I1,I2,I3},{I1,I2,I5},{I1,I3,I5},{I2,I3,I4}, {I2,I3,I5},{I2,I4,I5}}。根据所述的Apriori算法的“一个频集的所有子集也是频集”性质,可以确定后四个项集不可能是频集,因此将它们从 中除去,从而也就节约了扫描数据库D以统计项集支持度的时间。

虽然C4=F3?茌F3为{{I1,I2,I3,I5}},但由于其子集{I2,I3,I5} 是非频集,因此C4=?I。Apriori算法因不能发现新的项集而结束。

此时我们再以频集{I1,I2,I5}为例,给出关联规则的生成过程。可知其非空子集为:{I1,I2},{I1,I5},{I2,I5},{I1},{I2},{I5},根据关联规则生成算法,有以下关联规则及其信任度:

因为最小置信度为60%,所以第(2)、(3)、(6)项将做为最后的规则被输出。

4.2 结果分析

从以上结果可以看出,该类型游客的消费项目的特征常是体验性、休闲化同时是生活化或者生态化的,在了解该类型游客的需求特点后,旅行社可对推出针对性强求的一对一的服务,为其设计相符的、个性化的旅游服务,才能让其深刻体会到旅行社让渡的顾客价值,最终实现旅行社的价值。

5 结论

关联规则中的Apriori算法能揭示大量数据间的关联关系,其在旅行社CRM中的应用的有效性和实用性就是一有力的证明。旅行社利用数据挖掘技术与CRM的有机结合,通过客户关系价值分类、有针对性的市场营销、高质量的游程管理和及时的游客跟踪服务,能够提供给游客更加个性化、人情化和标准化的旅游产品,从而提高游客对旅行社的满意度和忠诚度,相信未来旅行社的经营必将克服目前低赢利、低质量的问题,逐步进入低成本――高质量――高盈利的良性循环。

参考文献:

[1]R Agrawa,l T Imielinsk,i A Swam.i Mining association rules between sets of items in large database[M]. In: Proc 1993 ACM-SIGMOD IntConfManage-ment ofData (SIGMOD’93),Washington,DC, 1993

[2]Pan-Ning.Tan Michael Steinbach Vipin Kumar.Introduction to Data Mining[M].Posts & Telecom Press, 2006

[3]朱明.数据挖掘[M].安徽:中国科学技术大学出版社, 2002.

[4]毛国君 段立娟 王实 石云.数据挖掘原理与算法[M].北京:清华大学出版社,2005.

[5]杰姆G巴诺斯.客户关系管理成功奥秘[M]. 北京:机械工业出版社,2002.

[6]曹洪珍.旅行社如何在竞争中取胜[J].东北财经大学学报,2001,11.

[7]秦宇.对旅游产品优化问题的思考[J].旅游学刊,2003,5.

“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。”

上一篇:基于校园网的计算机网络性能测试与研究 下一篇:基于.NET的地区电网集成信息系统设计与实现