基于关联规则的商品推荐系统

时间:2022-08-01 04:38:40

基于关联规则的商品推荐系统

摘要:关联规则是数据挖掘中的一个重要问题,本文在研究关联挖掘的基础上,通过对过去客户的交易记录进行分析,建立关联规则,为客户提供商品推荐,从而也为电子商务网站店主提供正确的盈利导向。

关键词:数据挖掘;关联规则;商品推荐

中图分类号:N37 文献标识码:A文章编号:1007-9599 (2010) 04-0000-02

Commodity Recommendation Based on Association Rules

Duan Wanxin

(Chengdu Science&Technology University,Information Engineering College,Chengdu 610059,China)

Abstract:The association rule is an important question inData mining, this article in the research association excavation foundation,carried on the analysis of old customer's transaction recording,established the association rules, provided the commodity recommendation to customers, thus provided the correct profit guidance for the electronic commerce website shop owner as well.

Keywords:Data mining;Association rule;Commodity recommendation

一、引言

电子商务是传统商务活动的一次重大革新,它以网络为平台,可使买卖双方不用谋面、异地的进行各种商贸活动,销售商可以在网上推销商品,消费者也可在网上购物,从而实现商务活动的网络化。由于其的方便、快捷和低成本,电子商务在全球范围内迅速发展。电子商务系统规模也越来越大,商品数目客户数目呈指数级增长。为了方便客户的购买,同时也提高销售量,商品推荐技术广泛应用于电子商务网站中,扮演传统商业中销售人员的角色。现有的推荐系统中,大多都是利用客户对不同商品的偏好,即利用协同过滤算法计算用户之间的相似度进行推荐。但与此同时,商品之间也是有关联的。本文就将主要探讨利用关联挖掘技术为客户提供商品推荐。

二、相关概念

电子商务网站都会用数据库保存每个客户的购物记录,伴随着电子商务的发展,数据库中的数据越来越多。而在这些错综复杂的数据中,包含着大量有用的信息。数据挖掘技术是汇聚数据库、统计学、机器学习等不同科学的交叉信息技术。它可以从大量的数据中提取出有用的令人们感兴趣的信息。关联规则的挖掘则是数据挖掘中的一个重要问题。

在电子商务网站,每个客户都会购买多样商品。那么,这些商品之间是否存在某种联系呢?如果存在,又会是一种什么样的联系呢?从直观上理解,如果一个客户购买了牛奶,他可能同时也会购买一个杯子。正因为商品之间存在着这种联系,我们可以根据客户已购买的商品记录向他推荐他可能还会购买的商品。

关联规则可以寻找在同一个事件中出现的不同项的相关性,比如在客户所购买不同商品之间的相关性。利用这些关联,就可以得到客户的购买特性,并根据发现的这些规律采取有效的行动。这对店铺的市场定位、商品的采购等决策问题都有重大的指导意义。同时,也能为商品推荐提供帮助。

关联规则的目标是在数据项目中找出所有的并发关系,这种关系也称为关联。关联规则有三个度量。支持度反映在交易数据中发现该规则的频繁程度,置信度说明当“如果”部分为真时“那么”部分也为真的频繁程度。比如牛奶杯子规则,其支持度为15%表明15%的客户同时购买了牛奶和杯子,置信度为85%表明在所有购买牛奶的客户中,有85%的人也购买了杯子。而提升度反映在预测结果方面,规则比只是首先假设该结果会好多少,它是关于该规则工作情况的很好度量。这了挖掘出有意义的关联规则,一般都需要提供最小支持度和最小置信度。

关联规则挖掘问题可以分为两个子问题:

(一)找出事务数据库中所有大于等于用户指定的最小支持度的频繁项集

(二)利用频繁项集生成所有的关联规则,根据用户设定的最小置信度进行

取舍,最后得到强关联规则。

三、商品推荐过程

通过以上分析,该系统的具体实现主要可分为以下七个过程:

(一)获得商品交易数据。从交易数据库中提取用户的交易记录

(二)交易数据预处理。进行必要的数据处理,如使每项交易简化为只含有

购买项,从而给出哪些商品会与其他商品一起购买的信息等

(三)选择商品数据项集和层次。可根据商业的具体需要,选择感兴趣的数

据项

(四)生成规则。根据关联规则算法从(三)中所得有商品数据集中生成关

联规则

(五)规则分析。主要是根据提升度原则来评价分析所生成规则的工作情况

(六)把规则推荐模型安置在推荐系统中

(七)为特定客户生成推荐。主要是根据客户购物车和历史购物记录生成推

荐商品

基于关联规则的商品推荐系统的功能流程如下图所示。

四、算法分析

在关联规则的挖掘算法中,以Apriori算法最为著名,它是一种最为常用的关联规则挖掘算法。Apriori算法使用一个逐层搜索的迭代方法,它通过项目集元素数目不断增长来逐步完成频繁项目集的发现。首先产生1-频繁项集L1,再用L1用于找频繁2-频繁项集L2,直到不再能扩展频繁项集的元素数目而止。

Aprioir算法主要包含三个步骤:

(一)由频繁k-1项集通过自连接产生长度为k的候选项集

(二)对至少有一个非频繁子集的候选项进行剪枝

(三)扫描所有的事务来获得候选项集的支持度

但是,Apriori算法需要多次扫描数据库,以对候选项目集进行模式匹配,同时,它可能会产生规模庞大的候选集。为此,我们可以采用划分的方法,即先把数据库逻辑的分成几个块,每次只考虑其中的一个分块,对它生成所有的频繁项目集。接着再把所生成的频繁项目集进行合并,从而得到全局的频繁项目集。该改进方法可以只需扫描数据库两遍。第一遍对数据库进行分块,并应用Apriori算法对其生成局部的频繁项目集,并做为候选频繁项目集。在第二遍扫描中,通过计算每个候选频繁项目集的支持度,确定数据库的全局频繁项目集。

五、结束语

本文分析了一个基于关联规则的推荐系统。该系统利用数据挖掘技术对客户交易记录中的商品进行分析,从而为客户提供商品推荐。同时,该方法也可与基于客户相似性的推荐方法相结合,为客户提供更为个性化的推荐。

参考文献:

[1]朱玉全,杨鹤标,孙蕾.数据挖掘技术.东南大学出版社,2006,11

[2]朱明.数据挖掘.中国科技大学出版社,2008,11

[3]Bing Liu.Web数据挖掘.清华大学出版社,2009,4

上一篇:谈现代电网改造发展技术的分析 下一篇:基于SaaS和SOA的餐饮管理平台的研究与开发