中小网商商品推荐的冷启动解决方案研究

时间:2022-04-30 03:11:00

中小网商商品推荐的冷启动解决方案研究

一、引言

1.推荐机制产生的背景。信息共享时代的来临,用户虽然享受着丰富信息所带来的满足感,但也面临着如何在茫茫信息大海中发现自己的目标信息的巨大挑战。然而经过信息搜索技术过滤后的信息仍然难以满足个性化用户的需求。此时个性化服务技术便应运而生了,推荐机制便是个性化服务的重要组成部分。以电子商务背景为例,电子商务中的推荐机制是基于消费者已有的信息和数据,通过科学性的预测,向消费者推荐令其感兴趣的商品或服务[1]。电子商务中应用的推荐机制,通过消费者与电商的互动,从而实现消费利益以及企业效益两全其美的局面。

2.推荐机制的发展沿革。在推荐机制的优越性以及电商市场的需求推动下,国外专家及学者对推荐机制的深入研究开始于20世纪九十年代,在电子商务推荐技术和机制的研究方面已取得较多的理论和应用成果。更多的学者把推荐系统视为一种数据库知识发现(Knowledge Discovery in Databases,KDD)系统或者电子系统[2]。推荐机制的优越性不仅在电子商务系统中淋漓尽现,在新闻行业、音乐推荐等领域也是推荐机制的用武之地。

从推荐技术上,推荐系统可以分为两类:一类是基于规则的系统,别一类是信息过滤系统。信息过滤系统又可分为基于内容过滤的系统和协同过滤系统。基于协同过滤的个性化推荐机制被认为是应用比较成功的一种推荐机制[1]。融合社会网络分析的协同过滤推荐机制,是通过研究社会网络而不是单纯性分割式地研究消费者个人或组织,通过协同推荐技术找出目标消费者的信息“最近”邻居用户,根据邻居用户对物品或服务的评分等,对目标消费者提供有效的推荐服务。基于社会网络的协同过滤推荐机制术结合了社会学、数据挖掘领域、人工智能、模式识别以及个性化推荐技术,克服了传统个性化推荐存在的新用户、新项目及数据稀疏性等部分问题,被认为蕴含较高的学术价值和乐观的实际运用前景[1]。

基于协同过滤推荐机制的成功运用案例便是亚马逊,其应用的推荐机制,是源于对用户过去行为的数据分析、群体浏览记录、交易记录而得的关联推荐以及基于用户评论评分和主观要求等个人反馈数据的推荐。亚马逊凭借其良好的推荐机制,其网上用户从访问到购买的转化率达到16.5%,在亚马逊网站上有35%的销售额是来自个性化推荐,有60%的销售额是间接受到推荐的影响[3]。

3.社会网络中个性化推荐机制。目前网络上个性化推荐的表现形式大概有个人化推荐、基因化推荐以及社会网络化推荐[3]种[4],其中社会网络化推荐是应用了社会网络分析的思想。根据社会网络的定义:“个体之间不同的社会交互,这些个体由于共同的兴趣爱好、物质利益或互相相识而联系在一起。”人处在社会网络中总是存在多种丰富的关系,因此,社会网络中存在大量的信息可用于分析和挖掘。社会网络化推荐机制借用web2.0技术,基于对用户需求、偏好性类似的客户群体,在对这类群体的过去行为记录和数据的调查和研究,然后为处在这个偏好性类似群体中的客户,提供相关产品推荐服务。社会网络化推荐机制融入了社会学概念,不同于个人化推荐只是单纯性地研究用户个人的历史数据,而是站在社会网络群体的角度对用户的行为进行分析。这种方式相对来说在人情化、实际性以及有效性方面更具有优越性。

其中最常用的推荐技术便是基于社会网络分析的协同过滤推荐。协同过滤推荐技术是利用用户爱好之间的相似性来进行推荐,通过类似用户对商品的偏好情况,通常主要以评价和打分的形式为标准[5]。然而这种传统的协同过滤推荐技术存在数据稀疏性、冷启动以及低效评价行为等问题。尤其对刚刚起步的中小规模B2C网商,由于经营时间短,用户量较少,用户购买数据有限,无法建立起完善的“用户-产品”样本数据库搭建社会网络,更无法基于网络进行数据分析形成推荐结果。学术研究中称这样现象为个性化推荐机制的“冷启动”问题。由于推荐功能处于劣势,中小规模网商在经营过程中丧失了有效的营销工具,拓展销售规模更是举步维艰。对于整个行业来讲,推荐工具的差异化会导致网商之间规模差距越来越大。因此,推荐机制的冷启动问题不但制约着小网商的发展,而且进一步导致行业竞争中的马太效应,不利于网购行业的发展。

因此,本文基于数据挖掘和社会网络分析的方法,设计了中小规模网商在经营初期进行商品推荐的冷启动问题解决方案,帮助小商家实现更加精准的商品推荐,促进网商销售规模增长。

二、方案设计

1.获取数据。冷启动问题的核心是经营初期用户购买数据稀少,难以搭建信息含量丰富的社会化网络。为了解决这一问题,我们选择利用内容挖掘软件对行业中的主流网商进行数据搜集和分析。本工作读取数据的过程借助了武汉大学信息学院老师编写的一款ROST(6.0版)软件。通过一系列简单的操作,我们可以读取到的数据集如表1所示。其中,同一行的数据表示该用户购买过该商品。

2.用户-产品网络关系图。基于社会网络分析的个性化推荐机制,借助社会网络分析技术分析并挖掘用户间的关系,首先要画出社会网络图,根据已经掌握的用户数据对用户之间的关系形象化成一张社会网络图,依据用户信息将用户之间的关系抽象表示为有向带权值的社会网络图的形式: G = ( V,E,λ)[6] 。其中,V 表示节点集,每个节点代表网络中的用户或商品; E 表示边的集合,表示两个个体之间存在的关系( 购买) ;λ 表示边的权重值,即购买次数。根据实际情况,网络图中的边是没有方向的,即社会网络图为无向图。

我们利用R统计分析软件的igraph包的作图功能绘制网络关系图,直观地展示用户-产品网络的结构。用户-产品网络具有独特的网络结构。由于我们关心的是彼此之间有联系的用户和商品节点,因此将度值(节点的连边数)为1的节点删除。

从图1可以看出网络存在着一定的人群分割,可以尝试对网络进行一些分析。首先我们提取出其中相对独立的子群。寻找子群的算法有很多,我们采用munity函数计算随机行走后仍在同一集群中获得节点的最佳分割。为了在网络图中展示这些子群,我们采用了不同的颜色来标记他们,如图1所示。其中根据聚集度不同,分别标记了黄、绿、青、蓝、紫色(由浅到深,代表聚集度越来越小)。

三、推荐结果分析

用户-产品网络已经被划分为相对独立的若干子群。这是我们推荐结果的基础——我们已经根据购买相同商品连接在一起的网络,对用户间的联系和用户间的相似性进行了计算和判断,得到了相邻的用户聚集子群。他们共同购买的产品就是我们进行产品推荐的参考集。

下面具体地看一下划分得到的商品集群。图2给出的是该子群的网络结构图,其中绿色(浅)的节点代表的是用户,蓝色(深)的节点代表的是商品;该子群的节点信息包括:用户夜森、rian01、newdancing、纪美妞,商品贝亲自然实感宽口径奶嘴(M)单个盒装、小白兔童书馆·启蒙大、Mentholatum曼秀雷敦护甲润手霜、日康乳牙呵护刷、AUBY澳贝益智玩具迪迪兔乐器、六必居芝麻酱、格力FSD-40B遥控落地扇。可以看出,这是婴幼儿的年轻父母群体,他们共同购买的产品是母婴产品和家庭用品。因此,可以认为基于上述方案设计得到的推荐结果是合理且有意义的。

四、研究意义与未来改进方向

本文针对中小规模网商在经营初期面临的推荐功能冷启动问题,利用数据挖掘技术获取用户和商品的购买关系数据,搭建了用户-商品网络关系图,利用R统计分析软件的相关功能对用户相似性进行分析判断,成功的划分用户子群,得到了商品推荐集。为小商家的产品推荐提供了可行的方法,有利于其经营初期的产品销售,有良好的应用前景。

目前,该方案设计中对用户相似度的计算还比较简单。根据研究进一步增强用户间相似性的准确度,可以在分析结果上的效率性和科学性具有很大的跨越。未来可以在现有的算法基础上进一步改进,不仅考虑目标用户与邻居用户之间直接的信任关系,更加全面地考虑与间接关系的二级邻居用户之间的信任关系,再计算用户间的相似度,结果可以更符合目标用户的需求。进一步提高社会网络分析的推荐机制的精确性,才能使这种推荐方案更好地服务于中小规模网商。

参考文献:

[1]万雪飞.基于社会网络的协同过滤推荐技术研究[D].电子科技大学,2010年

[2]张富国.基于信任的电子商务个性化推荐关键问题研究[D].江西财经大学.2009年

[3]范晓东.个性化推荐-电商B2C的高铁[J].互联网周刊,2011年16期:64-65

[4]张苗苗,张瑜.商业网站个性化推荐现状及对策分析[J].情报探索,2012年02期:36-40

[5]李慧,胡云.融合社会网络与信任度的个性化推荐方法研究[J].计算机应用研究,2013年:第31卷

[6]冯勇,李军平,徐红艳,党晓婉. 基于社会网络分析的协同方法改进[J].,2013年03期:841-844

注:本研究为北京大学生科学研究与创业行动计划支持项目,项目编号1302.

(作者单位:北方工业大学经济管理学院;北京 100144)

上一篇:山东省区域经济差异分析与协调发展研究 下一篇:企业员工预期管理博弈分析