基于本体的智能参考咨询系统研究

时间:2022-08-31 06:44:38

基于本体的智能参考咨询系统研究

摘要:针对目前现有的虚拟参考咨询系统存在的缺点,提出一种能在语义理解层次上进行知识表示和推理的虚拟参考咨询系统,通过应用本体进行知识表示和推理,实现语义层次的信息推理,提高了用户问题解答的准确性和图书情报机构的工作效率。降低了咨询工作的维护成本。

关键词:本体;虚拟参考咨询;知识库;语义

中图分类号:TP311文献标识码:A 文章编号:1009-3044(2010)16-4507-02

Research of Ontology-based Intelligent Reference System

YUAN liang-huan

(Library of Anhui College of Traditional Chinese Medicine,Hefei 230038,China)

Abstract: In order to solve existing virtual reference system shortcomings,A virtual reference system that can understand semantic and reasoning on knowledge is proposed,By the application of ontology to knowledge representation and reasoning,through information reasoning in semantic level, it may improved the accuracy of answer and efficiency of Library and information institutions, At the same time it reduce the cost of Maintenance costs of reference service.

Key words: Ontology ;Virtual Reference;Knowledge base;semantic

参考咨询是图书馆服务的一项重要内容,在开发和报道文献资源、为读者提供信息服务等方面一直发挥着重要的作用。随着信息科学和网络技术的飞速发展与普及,信息资源正向数字化和网络化发展,更多的用户开始使用网络获取信息并且希望可以不受时间、系统、资源、地域等限制,尽快获得可靠的答案,传统的信息咨询方式已不能满足读者需求和信息资源数字化、网络化发展的需要。虚拟参考咨询的出现为图书馆信息咨询的发展注入了新的活力,也带来了新的挑战和发展机遇,目前各图书馆普遍采用的是表单填写、Email、FAQ(Frequently Asked Questions,常见问题解答),IM(Instant Messaging,即时通讯)等方式来实现,这些咨询方式在一定程度上满足了读者的需求,同时也存在一些问题:FAQ大多采用关键词匹配技术,答案准确率低,解决的问题比较简单,表单、Email等不能实时回答读者问题,IM需要学科专家和图书情报人员花费大量时间在线等待读者提出问题,极大的降低了工作效率,且读者仍然受咨询人员工作时间的限制,不能即时获得问题答案。

因此,图书情报服务部门需要开发基于网络环境下的智能化咨询服务机制,为用户提供一种智能化参考咨询服务,真正保障用户检索获取信息的效率,为读者提供网络时代实时、动态、智能、便捷、高效的信息服务。

本文提出了一个基于本体的智能虚拟参考咨询系统模型,并讨论了实现系统的关键技术。通过本体进行知识表示,建立基于本体的系统知识库,对读者以自然语言提出的问题进行分析后,通过本体确定关键词所表达的概念语义,从语义上理解、处理和检索读者提出的问题,为准确解答读者问题提供了保障。

1 基于本体的智能咨询系统

建立本体模型的过程包括,用自然语言和图表描述领域模型,形成本体原型;使用知识表示语言把本体模型进行编码,形成便于交流、无歧义的可被机器解释的本体。在建立智能参考咨询系统知识库时,根据知识分析和设计支持系统(KADS)的三层结构划分方法,可以划分为领域、功能和任务模型,然后根据本体获取方法建立知识库以及任务求解方法如:推理功能,求解功能和查询等,最后实现问题的分解和输入输出转换。

智能咨询系统由问题分析处理、本体库、本体推理、信息检索、知识库、结果分析等组成。其中关键技术主要有知识的表示,基于本体的知识库的构建,基于本体的推理。系统结构如图1所示。

1.1 基于本体的知识表示

由于读者的知识结构、认知水平、表达方式的差异,要实现咨询系统的智能化,首先必须解决读者提问的语义理解问题,现在网上的信息表达一般是以自然语言来表达的,但是机器并不能理解其中的含义,因而无法实现自动推理,唯一的方法是把这些信息和资源变成有语义的知识[1-2]。

本体主要研究客观事物存在的抽象本质。本体通过某种语言对概念化对象进行表示和描述[3]。将概念化对象C定义[4]为一个三元组C=〈D,W,R〉,其中D是一个领域,W是该领域中相关的事务状态(state ofaffairs)的集合,R是领域空间〈D,W〉上概念关系(conceptual relation)的集合。按照表示和描述的形式化的程度不同,可分为四种类型:非形式化、半非形式化、半形式化、形式化语言[5]。形式化程度越高,越有利于计算机进行自动处理。

本体阐述了相关领域的知识结构,提供该领域知识的共同理解,对给定的领域,它的本体就构成了该领域的知识表示系统的核心,本体定义了或确定了知识表示的词汇,使知识共享成为可能。因此本体被引入知识工程领域,用于知识表示、知识共享。引入本体有效地解决了知识表示问题,提高了咨询系统的智能性。

1.2 基于本体的知识库的构建

知识库(Knowledge Base)是知识工程中结构化,易操作,易利用,全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。这些知识片包括与领域相关的理论知识、事实数据,由专家经验得到的启发式知识,领域内有关的定义、定理和运算法则以及常识性知识等。

目前图书情报服务机构建立的知识库有两大类:一是案例库,通常直接来源于用户问题和图书情报服务人员的归纳总结,如FAQ。这类知识库的不足之处在于它们不具有推理机制,只是通过简单的关键词匹配来解决问题。如果用户的问题不在库中,就无法解答;另外,即使用户的问题在库中,如果用户的提问方式不一致及使用的关键词不同也导致问题无法解决,二是提供咨询知识的知识库,此类系统按照文献特征来组织知识,是面向管理的,需要读者熟悉图书情报知识。因此有必要建立一种面向用户使用的且适用于机器推理和知识共享的知识库系统。

构建基于本体的知识库的优点主要有:1)知识片是模块化的,有利于知识共享、重用;2)适应不同知识结构和认知水平的读者;3)提高系统解决复杂问题的能力。知识库中的知识按层次构造。最低层是“事实知识”,中间层是用来控制“事实”的知识(通常用规则、过程等表示);最高层次是“策略”,它以中间层知识为控制对象。策略也常常被认为是规则的规则。知识库按层次构造使得其中的知识在被使用的过程中能够有效地存取和搜索,库中的知识能方便地修改和编辑,同时,对库中知识的一致性和完备性能进行检验。

基于本体的知识库的构建方法如下:

1)确定建立知识库的目的和范围,建立领域知识框架;2)确定领域内的术语、概念;3)定义领域内概念与概念之间的关系,给出概念、关系的形式化描述,领域知识库模型;4)建立领域中的理论知识、事实数据库;5)建立典型方法库。如果对于某些问题的解决途径是肯定和必然的,把问题解决途径直接存储在典型方法库中,可以让读者更快捷的获取答案。

1.3 基于本体的推理

本体的推理就是对读者提出的问题进行分析提取关键词,根据语义分析结果,搜索与核心关键词有关的本体,提取知识库中的知识提交给读者[6]。

设Oi(1≤i≤n)是领域学科中的本体集合,每一个本体Oi的对应的概念词典为Ti(1≤i≤n)。

对问题进行分词处理,得到关键词集合KS(keyl,key2,…)。

确定与问题相关的本体,过滤掉与领域问题无关的本体,应有KS∩Tsj≠Φ,s1≤sj≤sk.,如KS∩Ti=Φ,0≤i≤n,则此关键词与领域无关。

对过滤后的本体进行相关度排序,选择相关程度最大的本体。

求相关度的具体方法为:①确定关键词性质,如概念、属性等。②求与关键词定义相关的术语集合以及直接相关术语集。③根据两者的交集元素的频度、关键词性质进行加权计算得出相关度。

问题模式分析,根据问题特征可以将问题分为Why,What,How三种类型。例如,读者输入问题:“什么是文献传递?”和“如何进行文献传递?”,不具有模式分析模块的系统会列出数据库中所有含“文献传递”的答案,使用模式分析后,系统将问题分为What型和How型,对于第一个问题给出文献传递的定义,对第二个问题给出使用方法,如库中没有具体实现步骤则给出联系方式。

根据相关度分析后得出的本体,进行问题类型分析,然后采用深度优先搜索或广度优先搜索进行信息检索。如果需要还可以对问题进行进一步分析,在领域内构建多个子本体(或子领域),对问题进行语义扩展,然后根据关键字来搜索问题答案。

其工作原理框图如图2所示。

2 结束语

基于本体的智能参考咨询系统,使用本体建模方法、形式化的知识表示,有利于知识的重用与共享。基于本体的语义扩展可以提高问题检索的效率和质量,本体的引入可以提高问题解答的准确度,模型的形式化描述,使系统结构、文档和编码更加清晰。本体工程的开发是一个反复迭代的过程,基于本体的智能参考咨询系统需要在实际应用中反复地加以完善和修改,还需要在实际应用中与领域专家交流进行评价。

探索和研究图书馆参考咨询系统的智能化进程,能积极地促进我国图书馆咨询服务国际化发展,满足不断增长的各类型读者的信息需求,为广大用户提供快捷方便,安全可靠的优质服务。

参考文献:

[1] Frank Manola.RDF Primer[EB/OL]./TR/rdf-primer/.

[2] Ivan Herman.Web Ontoogy Language(OWL)[EB/OL]./2004/OWL/.

[3] Gruber T.R.A Translation Approach to Portable Ontologies[J].Knowledge Acquisition,1993,5(2):199-220.

[4] Guarino N. Formal ontology and information system[A],Formal ontology in information system[C],Trento: IOS Press, 1998:6-8.

[5]Uschold M,Gruninger M.ONTOLOGIES:Principles,methods and applications. Knowledge Engineering Review,1996,11(2):93-155.

[6] 武成岗,等.基于本体论和多主体的信息检索服务器[J].计算机研究与发展,2001,(6).

上一篇:基于单片机的篮球计时计分器的设计 下一篇:关于中职学校《VB程序设计》课教学的实践与探...