一类考虑负面评价的个性化推荐系统构架研究

时间:2022-08-05 10:16:11

一类考虑负面评价的个性化推荐系统构架研究

摘要:该文重新考虑了用户的负面评价对改进推荐系统的作用,构建了考虑用户负面评价的个性化推荐算法框架。基于物质扩散算法和MovieLens标准数据集的数值实验结果显示,该算法框架不仅能够识别出并去除掉掺杂在用户推荐列表中的错误推荐信息,使系统中的冗余信息明显减少,还可以显著地提高系统的推荐准确度,改善推荐结果的质量。该工作开辟了利用用户负面评价改进推荐算法的新思路。

关键词:推荐算法;负面评价;物质扩散

中图分类号:TP312文献标识码:A文章编号:1009-3044(2012)03-0611-03

Frame Research of Personalized Recommendation Algorithm by Considering the Negative Ratings

SU Ying

(Business School, University of Shanghai for Science and Technology, Shanghai 200093,China)

Abstract: This paper introduces new recommendation algorithm frame by reconsidering the negative ratings. The numerical results based on MovieLens dataset and the mass-diffusion-based algorithm show that,the new algorithm frame can greatly reduce the redundancy, and also enhance the accuracy and improve the quality of the recommended results.

Key words: recommendation algorithm; negative ratings; mass diffusion

如何准确识别用户的需求,帮助用户找到自己真正需要的信息成为信息过滤技术的一大挑战。为了解决这些问题,推荐系统,也称为个性化推荐应运而生。个性化推荐系统被认为是信息爆炸时代解决信息超载问题的最有效的信息过滤手段。个性化推荐系统是建立在海量数据挖掘基础上的一种高级智能平台,通过记录用户的网站使用足迹,挖掘用户的兴趣特点,向用户推荐其感兴趣的信息或商品,为用户提供完全个性化的决策支持和信息服务,满足用户的个性化需求,改善用户体验。近几年,各种各样的推荐系统被广泛研究和应用,经典的推荐算法包括协同过滤算法,基于内容的推荐算法,基于网络结构的推荐算法和混合算法等等。

然而,目前对个性化推荐算法的研究都关注利用用户喜欢产品的信息预测可能感兴趣的产品,而用户的负面评价信息则没有引起重视。本文重新考虑了在很多推荐算法研究中被忽略掉的用户的负面评价信息对推荐算法改进的意义,构建了考虑负面评价的个性化推荐算法框架。

1负面评价对推荐算法改进的意义

现实中应用的推荐系统一般都会向用户提供一个统一的评价体系,方便用户对产品进行评价的同时,还可以使评分数据标准化统一化。几乎所有系统的评分数据都可以大致分为好评和差评两类:好评数据隐含了用户的偏好特征;差评数据隐含了用户的不喜欢产品的特征。以往的推荐算法研究中都会清洗掉用户的负面评价,但我们认为负面评价对于推荐系统具有重要意义,具体表现在以下三方面:

1.1利用负面评价可以减少数据稀疏给系统带来的负面影响

实际系统中收集的信息,常由于用户不愿意透漏自己的隐私等种种原因,严重缺省。随着维度增加,数据在它所占据的空间中将越来越稀疏,最终导致具有统计意义的数据样本稀少。推荐算法依赖于用户的历史数据,一般来说历史数据越多,系统的推荐准确度相对越高,因此数据的稀疏问题将直接影响系统的推荐质量。忽视用户的负面评价信息在一定程度上增大了系统的数据稀疏性,不利于算法的运行。我们认为用户的负面评价信息有助于降低系统的数据稀疏性,可以有效缓解数据稀疏带来的各种问题,因此用户的负面评价信息应该得到研究者的关注,并将其合理地用于改进推荐算法。

1.2负面评价可以帮助系统更准确地定位用户喜好

现有的推荐算法或者利用所有评分数据,忽略用户评分数据的高低差异,或者只利用用户正面评价的产品信息,清洗掉用户负面评价的产品信息。用户或产品相似性网络的构建过程中也都只考虑基于正面评价的信息,比如协同过滤算法,总是从偏好出发去搜索相似的偏好;基于网络结构的推荐算法,也只利用用户的喜欢信息去建立二分图网络。在很多情况下,忽视用户负面评价信息会影响推荐系统对用户兴趣点定位的精确度。如对于一部正在热映评价尚好的电影,有一小群用户打了低分,那么他们差评的 理由可能会非常相似,而对于打高分的大多数人来说,好评的原因却可能相差很远,比如,这些人中可能存在着盲从的随大流的评价者,他们的评价可靠性差,推荐能力很弱,难以刻画出用户的兴趣点。实际应用中,用户一般更倾向于进行正面评价,负面评价一旦出现就意味着用户的厌恶情绪鲜明强烈,因此我们认为用户的负面评价信息可靠性更高,可以帮助系统更准确地把握用户的兴趣特征。

1.3利用负面评价信息可以有效减少系统中的冗余信息

随着网络用户数量与产品种类的增加,推荐算法的扩展性问题将成为制约推荐系统发展的重要因素。数据量的急剧增加将给系统存储、更新带来越来越大的成本压力。随着计算规模和复杂度逐渐增大,推荐算法的性能将越来越差。如果可以利用用户的负面评价信息找到用户不喜欢的产品黑名单,就可以将其作为用户推荐列表的限制性条件,一旦用户推荐列表中的产品同时也在黑名单,系统就自动将它从用户的推荐列表中去除,从而避免向用户推荐其可能不喜欢的产品,减少用户的不满意度,增强用户对推荐系统的信任。因此利用用户的负面评价信息不但可以降低推荐列表的出错率,还有助于降低系统中的信息冗余,对于推荐系统扩展性问题的解决具有重要意义。

2利用负面评价的个性化推荐算法框架

无论哪一种推荐算法,算法的核心都是相似性搜索,既然通过用户喜欢的产品信息可以找到那些潜在的会得到用户喜欢的产品,那么通过用户不喜欢的产品信息也可以找到那些会让用户不喜欢的产品。基于这种理论假设,我们设计了考虑用户负面评价的推荐算法框架,如图1所示。

该框架的运行原理为:

1)考虑用户评分数据的好坏差异,对评分数据进行分类;

2)通过个性化推荐算法,基于获得用户好评的产品信息得到用户最初的推荐列表,基于得到用户差评的产品信息得到用户不喜欢的产品列表;

3)在过滤模块中,识别并剔除掉那些用户的推荐列表中存在的用户不喜欢的产品列表中的产品,精炼推荐结果。

4)为了验证该框架的运行效果,我们在算法框架的基础上设计了评价指标算法模块,可以从推荐准确度,推荐结果的流行性和多样性,推荐结果的信息量,以及去除的冗余信息量等角度对该算法框架进行评价。

图1考虑负面评价的个性化推荐算法框架

3数值实验

我们采用MovieLens标准数据库中数量级为105的数据集,基于物质扩散推荐算法,对该算法框架进行了数值实验。该数据集包含了943个用户对1682部电影的打分信息。根据打分规则的描述,我们假设用户对电影的打分大于等于3表示用户喜欢这部电影,打分小于3表示用户不喜欢这部电影,据此将数据集分为两部分:基于喜欢的82520条打分信息和基于不喜欢的17480条打分信息。为了考察算法框架的表现,我们把基于喜欢的82520条打分信息按照9:1随机划分为训练集和测试集,进行对照实验。当推荐列表长度L=10时实验结果如表1所示。

1)准确度。平均排序分是衡量推荐算法准确度的一个重要指标,测试集中用户喜欢的所有产品的排序分数的平均值越小,就说明推荐算法趋向于把用户喜欢的产品排在前面,推荐算法的准确度越高。

2)流行性。一个产品的度就是这个产品被收藏的次数,产品的度越大说明越流行。一般而言,推荐列表的产品平均度越小的系统,意味着系统不会总向用户推荐热门产品,用户满意度相对更好。

3)多样性。平均海明距离度量了不同用户推荐列表的差异化程度,最大值为1,即所有用户的推荐列表完全不同,最小值为0,

表1实验结果对比

即所有用户的推荐列表都完全一致。平均海明距离越大说明系统趋向于向不同的用户提供差异化更大的推荐列表,推荐列表的多样性更好。

4)信息量。平均信息量越大,说明每一个推荐结果对用户的效用越大,意味着推荐结果传递的新信息更多,带给用户的意外感更强。

5)冗余度。由于利用负面评价的算法,可以用用户不喜欢的产品列表精炼推荐结果,因此推荐列表总长度更小,推荐列表的信息冗余明显减少。

综上,利用负面评价的算法在以上五个评价指标的表现均优于经典的物质扩散推荐算法。

4总结

在推荐系统的实际应用中,用户的负面评价具有稀缺性,但用户的负面评价信息却能够比大量存在的正面评价信息更准确地反映出用户的兴趣特征,具有重要的研究价值。本文重新考虑了用户的负面评价对改进推荐系统的作用,构建了考虑用户负面评价的个性化推荐算法框架。基于物质扩散推荐算法和MovieLens标准数据集的数值实验证明,利用负面评价的推荐算法框架能在一定程度上减弱庞大数据集数据稀疏性的影响,通过去除冗余信息还能提高系统的推荐质量,可作为目前推荐系统扩展性难题的解决方法之一。

下一步的工作将关注对负面评价信息的影响进行控制。推荐系统的最终目的是向用户推荐他们喜欢的产品,而并非不喜欢的产品,并且负面评价中也存在着不准确的信息,因此如何平衡正面评价和负面评价将是未来的工作重点。

参考文献:

[1]刘建国,周涛,汪秉宏.个性化推荐系统的研究进展[J].自然科学进展,2009,19(1):1-15.

[2]刘建国,周涛,郭强,等.个性化推荐系统评价方法综述[J].复杂系统与复杂性科学,2009,6(9):1-10.

上一篇:基于QT 4.7的ARM嵌入式Linux的游戏程序开发实... 下一篇:基于USkin软件换肤功能的实现