基于本体的个性化信息推荐系统研究

时间:2022-07-12 10:59:22

基于本体的个性化信息推荐系统研究

【摘要】本文从本体的概念出发,在分析传统信息推荐系统弊端的基础上,将本体与信息推荐系统融合,克服了传统信息推荐技术的不足之处,构建了基于本体的个性化信息推荐系统模型,使文档信息和用户模型的匹配成为了语义层次的匹配,以期能为提高信息推荐系统的精准度提供帮助。

【关键词】本体;个性化信息系统;信息推荐系统

互联网近十来的飞速发展,使之成为了人们获取信息的主要渠道之一。人们在互联网上获取信息不仅方便,而且得到的信息量比较全面,最重要的是互联网上的信息查询不受时间和空间的限制。同时,网络信息的海量性增加了用户信息查询的负担,导致了人们很难在浩淼的信息海洋中找到自己真正感兴趣的信息。用户对信息有不同的需求,而现在互联网对用户的表达相同的信息查询需求返回的是同样的信息内容,不会考虑用户的个性化。在科技飞速发展的环境下,我们不仅要满足用户信息查询的方便性的要求,还要在实现这个前提下尽量保证返回信息的质量,这样个性化的信息服务就应时而生。个性化的信息服务因能根据用户的不同信息查询需求返回用户真正感兴趣的信息而逐渐取代了传统的信息服务模式成为一种新的信息服务方式。

1.本体的概念及应用

从20世纪90年代初ontology(本体)引入计算机领域以来,不同研究者给ontology(本体)的定义虽然形式各不相同,但从真正涵义上来讲都是统一的,他们都认为本体都是对一个共享的概念模型的形式化描述。即本体的本质是概念模型。它对某个领域的具体的现象或知识进行抽象,形成该领域人们共同认可的概念或知识及其之间的关系,最后形成计算机可读的一种描述。简而言之,Ontology(本体)就是从不同层次形式化描述领域内的概念,概念含义及之间关系的理论,是领域内部各个概念之间进行交流的语义基础,这就把简单的术语明确到了某个领域。本体是以获取所属领域内的知识,提供对该领域的共同理解为目标的。

本体是用计算机可以理解的形式化语言来描述概念的,解决了人与计算机,计算机与计算机之间的沟通问题,所以被应用在信息交流的很多领域。本体能够明确概念的含义及概念之间的关系,所以在信息检索中引入本体理论后,用来描述查询需求的关键词之间的语义关系会更加明确,可以建立词语间的网状结构,这就提高了检索提问式的有效性和准确性。同时信息检索系统引入本体后能为用户提供多个检索口,用户不仅可以直接从自己比较熟悉的检索口进入系统查询信息,也可以比较完整地找到自己真正需要的信息。另一方面本体也为词语、术语的标准化、形式化提供了理论基础,在信息检索过程中,系统可以参照本体对异构信息进行标引,整合,解决了异构信息之间的交流问题,从而帮助用户在异构信息源中查询信息。领域本体的使用不仅使专业领域内问题的研究变地更加确定,也能够帮助多领域间的信息集成,交流和合作,即使是新用户也能简便而全面地了解本领域知识。

在知识管理中,利用本体规范知识概念及其之间的关系,能有效地将隐性知识转化为显性知识,知识的搜索和共享的几率大大提高,继而为知识共享和知识重用提供了可能。

2.个性化信息推荐系统

个性化信息推荐系统是使用多种数据分析技术,在特定类型的数据库中进行知识发现的一种应用技术,本质上是一种“信息找人”的服务模式。它根据用户的特点和兴趣主动、及时、准确地向用户提供所需信息,再根据用户对于推荐内容的反馈进一步改进推荐结果,继而达到为用户推荐真正所需信息和为用户提供更优质服务的目的。

为了缩短用户寻找到兴趣信息的时间,提高浏览的效率,个性化推荐系统向用户推荐与其兴趣模型相匹配的信息,或者是与目标用户具有相近兴趣模型的用户群浏览过的信息。个性化信息推荐系统根据推荐技术的不同可以分为三种:基于规则的系统,基于内容的系统和基于合作的系统。

2.1 基于规则的推荐系统

基于规则的推荐是根据事先生成的规则向用户推荐其感兴趣的信息的一种信息推荐方式。假如事先生成的一个规则为“如果用户对图书馆学感兴趣的话,则数字图书馆也是其感兴趣的内容”,当用户再次浏览有关图书馆学的网站信息时,系统则可以同时向用户推荐数字图书馆的相关信息。由此可以看出,一个规则本质上就是一个If-Then语句。基于规则推荐信息的基础是系统管理员根据用户访问记录所制定的推荐规则。基于规则的信息推荐系统的优点是方便,简单,直接,容易实现。其缺点是系统事先制定的推荐规则质量很难得到保证,而且随着规则的愈来愈多,系统的管理也变的越来越艰难。

2.2 基于内容的推荐系统

基于内容的推荐是指通过比较资源与用户模型的相似程度向用户推荐信息的一种信息推荐方式,最终系统把与用户兴趣模型相匹配的信息反馈给用户。这种推荐方式优点是实现简单,适合处理文本信息,推荐的结果查准率比较高。缺点是它要求内容与用户兴趣的精确匹配,所以查全率有待提高。基于内容的推荐系统的典型结构如图2.1所示:

图2.1 基于内容的推荐系统

2.3 基于合作的推荐系统

基于合作的推荐和基于内容的推荐不同,它不是通过比较资源和用户兴趣模型的相似性,而是通过比较用户兴趣之间的相似性,依据目标用户具有相同或相近兴趣的用户对资源的评价向用户推荐信息的。合作推荐是一个较常用到的一个信息推荐方式,其中具有相同或相近兴趣模型的用户可看做是一个个的用户类。系统在推荐给目标用户信息时通过参照同类用户的兴趣,不仅可以使目标用户发现新的感兴趣的信息,也能提供一些难以用具体概念表达的信息,如质量等,避免了内容分析的不完全和不准确。但是基于合作推荐的前提必须是某些信息必须被用户类中的某个或某些用户浏览过,否则不能把这些信息推荐给其他用户。如果某个人的兴趣比较特殊,不能归为任何一个用户类,则这个用户也可能无法获得个性化系统推荐的信息。基于合作的推荐的典型结构如图2.2所示:

图2.2 基于合作的推荐系统

3.引入本体后的个性化信息推荐系统

个性化信息推荐系统的目的是向具有不同兴趣的用户推荐个性化即满足其需求的信息。现有的推荐系统虽有优点但也不可避免的具有一些缺点,如基于内容的推荐中关键词之间是没有任何语义关系的,但是现实中还存在同义词等,系统是将信息和用户兴趣进行精确匹配的,所以一些表达方式不同但本质相同的信息就可能不被推荐,从而导致查全率不高等。因此为了提高系统推荐的质量,就要在信息推荐系统中引入本体的理论。本体作用是在领域中提取共同认可的词汇形成概念,进而对概念及其之间的关系进行形式化表达。它能充分考虑关键词之间的关系,这样系统在向用户进行信息推荐时就不再是单纯的关键词匹配,有助于提高推荐信息的质量。

3.1 引入本体后基于规则的推荐系统

基于规则的信息推荐系统的中的规则是系统管理员根据用户的访问记录制定的,可能每个访问记录就对应一个规则,所以规则就变得多而乱,难以管理,而且很难处理复杂抽象的用户请求。例在图书馆领域内的以下三个规则:

(1)如果用户对图书馆自动化感兴趣的话,则情报检索系统也是其感兴趣的内容。

(2)如果用户对图书馆自动化感兴趣的话,则检索系统也是其感兴趣的内容。

(3)如果用户对图书馆学感兴趣的话,则用户对检索系统也感兴趣。

在数字图书馆领域,概念“图书馆学”和概念“图书馆自动化”之间是父类和子类的关系,“情报检索系统”与“检索系统”具有相同的内涵,由此规则(1)和规则(2)其实实质相同,规则(3)中“图书馆学”是“图书馆自动化”的父类,用户在实际的选择中如果对父概念感兴趣则一定也对其对应的子概念感兴趣。而以上三个规则中认为“图书馆学”,“图书馆自动化”,“情报检索系统”和“检索系统”四个概念之间是没有任何联系的,所以就造成了规则的繁多。

在本体中我们已经定义了“图书馆学”是“图书馆自动化”的父类,“情报检索系统”与“检索系统”是同义词,所以以上三个规则就可以缩减为“如果用户对图书馆学感兴趣的话,则用户对情报检索系统也感兴趣”一条规则,如此就大大减少了规则的数量,节省了储存规则的空间,方便系统对规则进行管理。引入本体后基于规则的信息推荐模式如图3.2所示:

3.2 引入本体后基于内容的推荐系统

基于内容的推荐系统中关键词之间的匹配是精确匹配,而表达不同本质相同或者具有上下位关系的关键词之间就不能形成联系,从而影响查准率或查全率。如基于规则的信息推荐系统中的关于数字图书馆的例子,在引入本体后用户如果输入的查询关键词是“图书馆自动化”,系统则会考虑到“图书馆自动化”和“数字图书馆”的上下位关系,最终把关键词为“图书馆自动化”的信息资源也推荐给用户。本体也可以引入用户的查询语句中,如用户要查询“情报检索系统”的相关信息,系统考虑“检索系统”和“情报检索系统”的同义关系,把“检索系统”也当做用户的兴趣之一,修正用户兴趣模型。基于内容的信息推荐系统中,在用户兴趣模型和信息资源中引入本体后,表示资源的关键词和用户模型关键词之间就不再是简单的匹配,而是会考虑到关键词之间的语义关系的语义层面的匹配,推荐结果的质量大大提高。引入本体后基于内容的信息推荐系统过程如图3.4所示。

3.3 引入本体后基于合作的推荐系统

基于合作的推荐系统是根据用户兴趣模型之间的相似度来推荐信息的。用户模型是用关键词表示的,所以分析用户兴趣模型的相似度就变成了用来表示兴趣模型关键词的匹配,可能也就会出现和基于内容的推荐一样的问题。

如某个用户的兴趣关键词之一是“图书馆,另一个用户的兴趣关键词之一是“图书馆自动化”,因为不理解两个关键词之间的上下文关系,所以系统就会认为这两个关键词是不匹配的,继而认为两个用户的感兴趣的内容是不一样的。引入本体之后,表示各个用户兴趣的关键词之间就有了语义关系,如上下位,同义词关系等,这就增加了系统分析用户兴趣的准确度,扩大了相似用户类。系统在某个用户的表示兴趣模型的关键词中引入本体分析,形成新的兴趣模型关键词集,接着与系统中储存的经过处理的其他用户兴趣模型再进行匹配,就会大大增加匹配的可能性。具体过程如图3.6所示。

4.结语

文中在分析现有个性化信息推荐系统的基础上,发现了基于规则的信息推荐技术存在规则多而繁,不易管理;基于内容和合作的信息推荐技术存在关键词之间缺乏语义关系的弊端,于是在现有个性化信息推荐技术的基础上引入了本体理论。引入本体后的信息推荐系统在用户兴趣模型的表达上考虑到了关键词之间的关系,能更为准确地表达用户的兴趣所在,用来表示文档内容的关键词之间也具备了同义或上下位等语义关系,能更详细而精确地表达信息内容。在传统信息推荐系统的基础上引入了本体的理论克服了现有三种推荐技术的不足之处,使得文档信息和用户模型的匹配成为了语义层次的匹配,提高了推荐结果的质量。

参考文献

[1]刘凯.信息可视化概念的深入探讨[J].情报杂志,2004 (12):20-25.

[2]李健康,张春辉.本体研究及其应用进展[J].图书馆论坛,2004,24(6):80-86.

[3]仇利克.领域Ontology的构建方法论及其存储研究[D].[硕士学位论文].青岛:中国海洋大学,2006.

[4]李衍淼.基于本体的智能信息检索系统研究[D].[硕士学位论文].山东:山东科技大学,2006.

[5]史忠植.知识发现[M].北京:清华大学出版社,2002:135-155.

[6]潘红艳.个性化信息服务的研究与实现[D].[硕士学位论文].大连:大连理工大学,2005.

[7]宋丽哲,詹赤兵,王胜海.基于本体的数字图书馆个性化用户模型表示[C].第三届全国信息检索与内容安全学术会议论文集,2007:392.

[8]宋丽哲,詹赤兵,王胜海.基于本体的数字图书馆个性化用户模型表示[C].第三届全国信息检索与内容安全学术会议论文集,2007:394.

[9]潘红艳.个性化信息服务的研究与实现[D].[硕士学位论文].大连:大连理工大学,2005.

上一篇:基于计算机数据库安全管理的分析与探讨 下一篇:基于物联网的智能家居的研究及实现