个性化推荐引擎技术及在电子商务中的应用

时间:2022-04-06 05:24:31

个性化推荐引擎技术及在电子商务中的应用

【摘 要】本文介绍了个性化推荐引擎的定义,对个性化推荐引擎所依据的算法原理进行了详细的阐述,个性化推荐引擎技术实现了用户个性化的需求,提高了用户浏览搜索网页的效率。

【关键词】电子商务;推荐引擎;数据挖掘;个性化推荐

0 引言

随着电子商务的不断发展,其规模越来越大,可以提供的商品种类和数量也不断大幅度地增加。如何使顾客方便、快速的找到商品,顺利地完成购物过程成为电子商务企业亟待解决的问题,也是企业提高其自身竞争力的重要砝码。个性化推荐技术为解决这一问题提供了有力的支撑。目前,以搜索引擎为基础的推荐引擎技术为提高购物效率提供了强有力的技术支持。

1 关于推荐引擎

1.1 推荐引擎定义

推荐引擎的目的是解决信息过载问题,其本质在于通过对用户历史活动记录进行分析后,得出用户的兴趣特点等信息,进而主动为用户推荐其感兴趣的商品或信息。个性化是推荐引擎的精髓所在,通过对群体数据进行分析得出用户的个性化爱好,然后针对其个性化需求等给出相应的推荐。从长远看来,推荐引擎技术具有极为广阔的发展空间。

1.2 推荐引擎与搜索引擎的联系与区别

推荐引擎与搜索引擎有着一定的联系与区别。二者都是基于网络平台的工具,旨在发现答案或兴趣点;算法考虑的角度比较类似,不过算法思想存在很大的差异,搜索引擎给出的结果强调内容关联,而推荐引擎给出的结果则强调个性化;搜索引擎是帮助用户找到最为合适的结果,而推荐引擎可以帮助进行多样化体验进而满足其多个兴趣需要;海量数据的处理和计算是二者不可缺少的一部分;相比于搜索引擎被动等待用户搜索请求的情况,推荐引擎是主动为用户推送相关的服务。

2 推荐引擎技术原理

2.1 基于内容相似度的算法

该推荐算法是以从推荐物品或者推荐内容的元数据中找出物品与内容的关联性然后根据用户以往的兴趣爱好为算法的核心思想,这是在推荐引擎出现之初是使用最为广泛的推荐方法。例如:假设用户A、用户B、用户C都喜欢看影视剧,用户A喜欢看的电影a属于爱情、浪漫类,用户B、C喜欢的电影b属于恐怖惊悚类,电影c与电影a相似属于爱情浪漫类,则可以把电影c推荐给用户A。

基于该算法的推荐机制的不足之处在于:1)需要对商品进行分析建模,其建模的完整性与否直接影响到推荐的质量;2)在对商品进行建模的过程中往往会忽略人对物品的态度;3)存在“冷启动”问题。应用该推荐方法的网站有百度、优酷、gmail、google等。

2.2 基于协同过滤推荐算法

2.2.1 基于用户的协同过滤推荐

该推荐方法的基本原理是运用“K-邻居”算法,找出与当前用户偏好相同或相似的邻居群,然后根据邻居群的历史记录对当前用户进行推荐。例如,假设用户 A 喜欢物品 a,物品 c和物品 d,用户 B 喜欢物品 b,用户 C 喜欢物品 a 和物品 c;从各个用户的历史偏好信息中,我们可以发现用户 A 与用户 C 的偏好比较类似,同时用户 C 还喜欢物品 d,由此我们可以推断用户 A 可能也喜欢物品 d,因此可以将物品 d 推荐给用户 A。

该算法的领域扩展性比较好,其推荐多样性远远高于基于物品的协同过滤推荐。其不足之处在于算法具有时效性,无法离线计算;在大规模数据集上数据稀疏严重。

2.2.2 基于物品的协同过滤推荐

该推荐机制的原理同基于用户的协同过滤推荐机制类似,它是发现物品与物品之间的相似性,针对用户的历史偏好信息对用户作出物品推荐。例如,假设用户 A 喜欢物品 a 和物品 c,用户 B 喜欢物品 a,物品 b 和物品 c,用户 C 喜欢物品 a,从这些用户的历史喜好可以分析出物品 a 和物品 c 时比较类似的,喜欢物品 a 的人都喜欢物品 c,基于这个数据可以推断用户 C 很有可能也喜欢物品 c,所以系统会将物品 c 推荐给用户 C。

该推荐机制能够离线计算,不存在时效性的问题;尽管依旧有数据稀疏的问题,但是可以计算;能够有效地发现具有相同兴趣的用户的相似item。其不足之处在于多样性不如基于用户的推荐机制,对于兴趣单一的用户较为适用。

2.3 基于人口统计学的算法

该算法指根据用户的基本信息,从中发现用户之间的相关度,然后将相关用户喜欢的商品推荐给当前用户。例如,通过用户基本信息调查发现,用户A与用户C都是女性,且属于同一年龄段,则可以认为用户A和用户C相似,就可以把用户A喜欢的商品推荐给用户C。这种推荐方法的优势在于不存在冷启动问题,且适用于任何商品领域;其不足之处是对用户分类方法过于粗糙,无法深入发掘出用户偏好,且对于有些用户敏感的信息难以获取。

2.4 基于Topic model的算法

该算法的思想是为每个Item定义不同的topic标签,之后定义每个topic之间的相似度。用户选择topic后,基于其选择进行各个topic之间相似度的计算,最后生成推荐item集合。

在该推荐算法中,topic作为联系user与item之间的纽带,借助较好的用户回馈机制,就能够使系统更好地演绎。其不足之处是item之间相似度计算比较麻烦且topic定义繁琐。使用该算法作为推荐算法的主要有youtube、google news、jinni等网站。

2.5 基于关联规则的推荐算法

关联规则算法是数据挖掘算法中的经典算法之一,它主要是找出数据的依赖关系。通过进行关联规则分析,能够了解到什么样的物品被同时购买的几率比较大,或者了解到用户在购买一些物品后通常还会购买哪些别的物品。当挖掘出这样的具有关联规则的物品信息后,就可以基于这些信息为用户推荐关联商品。

2.6 混合推荐机制

在现行的多数网站中,并不是使用单一一种推荐模式,往往是集合各种推荐方法的优势,进而达到更好的推荐效果。目前常用的混合方法主要有加权混合、分区混合、切换混合和分层混合。加权混合指用线性代数中的公式将不同的推荐方法以一定的权重组合起来,利用测试数据进行反复实验以期达到最好的推荐效果;分区混合指将不同推荐方法的推荐结果显示在不同的区域,这种方式在当当网、亚马逊等网站中都可以看到;切换混合指针对不同的物品,不同的情况下采用最合适的推荐机制来向用户进行推荐;分层混合指采用多种推荐机制,并将一种推荐机制的推荐结果作为另一种推荐机制的输入,从而得出更为精确的推荐结果。

3 推荐引擎技术在电子商务中的应用

在推荐引擎技术出现后,用户在电子商务网站浏览的效率得到了很大的提高,它只显示用户想要看到的内容。试目前应用推荐引擎技术的电子商务网站很多,最典型的就是亚马逊,像淘宝网、当当网、京东商城、腾讯等大家所熟知的网站中也大量应用了推荐引擎技术。

推荐引擎在电子商务中的应用主要表现在如下几个方面:1)今日推荐:通常是基于用户近期的购买记录或者浏览记录,结合当下一些比较流行的物品等信息对用户进行推荐;2)捆绑销售:基于数据挖掘技术对用户的购买行为进行深入挖掘分析,找到其购买记录中具有关联的物品进行捆绑销售,如淘宝网中的搭配套餐;3)top排行榜:基于销售记录中销售数量最多的商品进行排行,向用户进行推荐。

4 小结

论文对推荐引擎的相关定义以及算法原理进行了较详细的介绍,推荐引擎能够促成更多的网上交易,具有很大的发展空间。但是,尽管推荐引擎在推动电子商务发展方面有很大的优势,但是其仍有其不足,比如“冷启动”问题,而且在涉及到用户个人信息时是否触及用户的隐私权还有待确定。

【参考文献】

[1]HAN Jiawei,KAMBER Micheline.数据挖掘概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,2007.

[2]张奇锋.潜力巨大的推荐引擎让互联网更懂你[N].广东科技报,2011-09-24.

[3]陈静.推荐引擎抢占行业先机[N].经济日报,2011-09-15.

上一篇:安徽科技学院植物标本室发展的历史、现状和展... 下一篇:企业生产经营管理系统的研究与实现