各种用户建模方法在个性化服务中的比较研究

时间:2022-10-05 07:41:28

各种用户建模方法在个性化服务中的比较研究

摘要:用户建模是个性化服务的核心技术,针对目前用户需求和个性化服务中出现的问题,通过研究国内外用户建模的现状,以建模获取方法、模型表示等为切入点,比较分析主流建模方法的使用情况和各自的优劣,总结出用户建模重点研究方向和研究热点。

关键词:个性化服务;用户建模;领域本体;比较研究

中图分类号:TP301 文献标识码:A 文章编号:16727800(2013)009001002

基金项目:2012年河南省科技厅重点攻关项目(122102210540)

作者简介:董峰(1972-),男,硕士,黄河科技学院副教授,研究方向为计算机网络与应用;王燕(1981-),女,硕士,黄河科技学院讲师,研究方向为人工智能、数据挖掘。

0引言

近年来互联网得到了迅速的发展,用户不仅是互联网的使用者,也是互联网的创造者。可以说“Web 2.0”已经不是一个概念,越来越多的学者和用户将此概念付诸行动。通过互联网购物的人越来越多,将电子商务领域推向了互联网的最前端,用户希望能在购物环境中得到个性化的服务。用户兴趣和需求不同推荐内容的系统,它主要通过用户建模、项目匹配和推荐输出3个阶段来实现。在个性化推荐系统研究的早期,用户建模技术并没有得到应有的重视。大量的研究集中在实现个性化服务的具体技术上,如推荐技术、信息检索技术、用户聚类技术等,用户建模技术只是这些研究中几笔带过的陪衬[1]。随着研究的不断深入,用户建模技术逐渐变成个性化系统创建的核心技术。

1用户建模综述

1.1用户建模概念

20世纪70年代初,Allen等人提出用户建模的雏形,用户建模取得了长足的进步,特别是近几年,由于信息异构的问题,用户建模已经应用到许多学科。20世纪90年代个性化推荐研究被提出来,随着Web 2.0技术的成熟,得到了迅猛发展。虽然用户建模技术涉及人机交互、数据挖掘、哲学和心理学等领域,在工程学的角度认为用户建模指从相关用户行为、兴趣的信息(如浏览内容、行为、背景知识等)中归纳出可计算的用户模型的过程,并以此来预测用户未来的行为和意愿。针对用户建模的过程,许多研究中认为“一个完整的推荐系统用户建模过程包括数据收集、模型表示、模型学习与模型更新4个子任务。”[2]王巧容等人[3]将用户建模分为5个模块:输入、输出、建模时间、建模对象、建模算法。

我们以5年为一个阶段,调查个性化服务与用户建模的研究情况,通过对国内外数据库分析,国外的个性化服务起步较早,而且用户建模得到了相应的重视,直到目前为止比例呈现上升状态。在国内,对个性化服务方面的研究逐年增加,但是对用户建模方面涉足的较少,个性化服务中的用户建模问题在国内是一个比较新的研究课题,如表1、表2所示。

1.2用户建模分类

从目前的研究情况看,以用户建模的获取方法为依据可划分为显式和隐式建模。显式建模主要是通过直接询问用户有关的兴趣和偏好或是允许用户自己定义和修改他们的用户模型来实现;而隐式建模则是通过跟踪用户的行为和交互来评估和推测用户模型[4]。用户模型的表示方法主要分为关键词表示法、主题表示法、基于向量空间模型的表示法、基于本体的表示法和基于神经网络的表示方法等。从用户在建模过程中的参与度可分为用户手工定制建模、示例用户建模和自动用户建模3类。

2用户建模比较分析

2.1建模获取方法比较分析

根据用户建模的获取方法,可以将建模分成显式建模和隐式建模两种。早期对用户建模主要集中在显式建模上,第一种途径通过用户对网页上的内容的兴趣度进行标注,当用户检索时提供个性化的查询结果;第二种途经在用户检索的过程中,收集用户对查询结果的评价信息,系统采用关联性反馈的方式改善检索的内容,通过网页排名最后指向相关页面[5]。这种方法可靠性较强,用时少,但是有时涉及到用户的隐私,需要用户较高的参与度,容易让用户产生厌倦感。基于这些缺点学者们开始研究隐式用户建模,可以通过用户浏览网页的行为,例如:停留时间、翻页、打印、收藏情况,挖掘出用户的兴趣特征。也可以通过挖掘服务器日志信息的方式,主要包括用户的IP、访问时间、所在地区等信息。但是隐式建模的方式还会出现很多问题,例如,有一个人搜索裤子的品牌,经过数据挖掘判断出他是一位时尚人士,系统推荐的是时尚品牌,可是他要给年迈的母亲买礼物,可见推荐结果不理想。隐式建模不需要用户的参与,但是数据挖掘信息量大,难以准确定位用户需求,目前研究的重点是显式和隐式相结合的用户模型获取方法。

2.2用户模型表示比较分析

(1)关键词列表表示法。

关键词列表表示法是指对用户感兴趣的信息用关键词列表。如用户对名人传记感兴趣,则关键字列表表示为{政治名人,文艺名人,科技名人,军旅名人}等。关键词既可由用户指定,也可以通过学习规则或算法自适应获得。

(2)利用向量空间模型表示用户兴趣。

(3)基于本体的表示法。

本体属于哲学定义,随着语义网研究逐渐深入,计算机科学在本体论上的研究也越来越深入。对于本体引用最为广泛的定义是1993年Gruber提出的“概念化的明确的规范说明”。根据本体主题可分为领域本体、通用本体、表示本体、任务本体等,领域本体描述的是特定领域中概念与概念之间的关系,提供了某个专业学科领域中概念的词表和概念,如社区本体,石季辉等[6]利用领域本体理论创建了Web社区环境下的用户兴趣模型;旅游本体,陈钰等[7]中以旅游领域为背景,提出了旅游信息语义检索系统;音乐领域,SeungminRh[8]利用语义网技术,扩充音乐领域知识和规则,提出一种自适应的音乐推荐方案。可见,国内外在本体表示方法研究中,关注点主要放在领域本体上,而且研究范围已经涉及到了各个领域。

3结语

个性化服务是解决用户个性化需求的根本途径,本文通过文献综述和数据分析,得出用户建模是个性化服务的关键问题,也是国内研究的薄弱之处的结论。从用户建模分类的角度,对显式建模和隐式建模、关键词列表、向量空间模型和基于本体的表示法进行比较研究,表明显隐结合的混合用户建模获取方法是最合理的,在个性化服务领域则是使用本体的表示法是未来的研究重点和发展方向。

参考文献:

[1]张炜.个性化推荐系统中基于本体的用户建模研究[D].南京:南京理工大学,2007.

[2]吴丽花,刘鲁.个性化推荐系统用户建模技术综述[J].情报学报,2006,25(1):5561.

[3]王巧容,赵海燕,曹健.个性化服务中的用户建模技术[J].小型微型计算机系统,2011,32(1):3946.

[4]戢渼钧.面向个性化服务的用户建模相关问题研究[J].情报杂志,2006(3):7779.

[5]BRILL E,SERGUEI VASSILVITSKII.Using connectivity distance for relevance feedback in search:America,US20070239702 A1[P].2007.

[6]石季辉,于长锐,刘兰娟.基于领域本体的社区用户兴趣模型[J].情报科学,2011,29(4):608614.

[7]陈钰,张功亮.一种基于领域本体的用户建模方法[J].计算机与数字工程,2011,39(2):8489.

[8]SEUNGMIN RHO, SEHEON SONG. Implementing situationaware and useradaptive music recommendation service in semantic web and realtime multimediacomputing environment[J].Multimedia Tools and Applications,2013, 65(2): 259282.

上一篇:10大高科技材料将改变数码产品的形态 下一篇:精巧优雅 妙趣盎然