云模型与用户聚类的个性化推荐

时间:2022-09-13 12:54:56

摘 要:针对传统推荐系统数据稀疏、相似性计算方法导致共同评分用户少的问题,提出利用云模型定性概念与定量数值转换的优势,研究云模型、用户聚类个性化推荐改进算法。用户对项目属性评价的偏好,转换为用户对加权综合云模型表示的数字特征的偏好。利用改进的聚类算法,对评分数据、原始用户属性标准化后的信息进行聚类;同时考虑用户兴趣的变化,结合用户之间项目属性评价的综合云模型的相似度、用户对项目评分的聚类、用户属性聚类这三种方法产生的邻居用户的并集进行推荐。理论分析和实验结果表明,提出的改进算法不但解决数据稀疏性带来的共同评分用户少的弊端,即使是在新用户的情况下,仍能获得较低的平均绝对误差和平均平方误差。

关键词:综合云模型;属性评价;评分聚类;属性聚类;协同过滤

0 引言

亚马逊、当当网、数字图书馆等,几乎都不同程度地使用个性化推荐系统,向用户推荐图书、论文、商品等项目,实现个性化服务[1]。其中,协同过滤推荐算法是最成功的个性化推荐技术之一。但因用户评分数据的稀疏性,导致传统推荐质量下降。

为解决数据稀疏性带来的传统基于向量相似度的问题,比较典型的方法之一是将利用云模型实现定性、定量知识转换的优势应用到推荐中:由云模型计算用户评分特征相似度 [2]、项目评分特征相似度[3]的协同过滤算法;在云模型计算项目评分特征相似度的基础上,预测未评分项目的评分,然后利用云模型计算用户相似度,最终获取用户邻居再进行推荐[4],但没有利用有益于推荐的用户、项目属性;利用云模型填充评分矩阵,结合项目属性加权推荐[5] 、结合云模型通过比较项目属性相似度的推荐[6],在类内利用云模型获得项目邻居,进行类内评分填充,结合云模型的用户相似度进行推荐[7],这三种方法也没有充分利用用户属性信息;研究云模式在用户行为相似度、用户等级的模式,并通过聚类算法改进推荐算法[8]。以上改进算法都没有考虑综合云模型下的推荐。

本文在前面研究的基础上,利用用户对项目各个属性的评价值和评价时间,计算综合云模型的用户项目属性评价相似度,获取基于属性评价的用户邻居。利用改进的聚类算法Kmedoids,根据用户评分对用户聚类,获得基于评分的用户邻居。对用户原始属性进行标准化,再进行Kmedoids聚类。结合综合云模型的属性评价、用户评分聚类、用户属性聚类产生的邻居的并集,向目标用户推荐项目。实验验证,提出的方法有效地缓解推荐算法数据稀疏的问题。

1 云模型

云模型能够实现定性概念与其定量数值表示之间的不确定性转换模型,反映自然、社会中的模糊性、随机性,已经应用于电子商务、模糊评测等领域[9]。

定义1 一维云模型。设T={x}是用精确数值表示的定量论域,C是定量论域T的定性概念,若T中的元素x对C的隶属度μ(x)∈[0,1]是一个具有稳定倾向的随机数,μ:T[0,1],x∈T,xμ(x),则x在T中的分布C(X)称为云(Cloud),每个x叫作一个云滴。云的数字特征用期望Ex、熵En和超熵He来表示。Ex为云滴的重心位置,反映云滴在论域中的分布期望;En是定性概念亦此亦彼的度量,反映定性概念在论域中被接受的范围。超熵He是En的熵,用于度量熵的不确定性,由熵的随机性、模糊性决定[9]。

定义2 综合云模型。将两朵及以上的同类型子云进行综合,产生一朵高层概念的父云。计算所有子云的数字特征,得到作为父云的综合云的数字特征[9]。例如:由论域中的b个同类型子云C1(Ex1,En1,He1),C2(Ex2,En2,He2),…,Cb(Exb,Enb,Heb),可产生作为父云的综合云C(Ex,En,He),并且

2 云模型与用户聚类的个性化推荐

2.1 综合云模型的用户―项目属性评价相似度

上一篇:基于主成分分析禁忌搜索和决策树分类的异常流... 下一篇:钢铁企业铁水运输调度优化与仿真