基于语义网的本体技术应用

时间:2022-06-11 10:40:13

基于语义网的本体技术应用

摘 要:为研究基于语义网系统的知识本体构建方法,提出并设计1个本体构造的框架. 在本体的建立过程中,充分利用已大量存在的概念模型,从而在一定程度上减轻术语收集的工作量. 为提高本体的构造速度,提出一系列本体构造辅助方法:借助转换准则,直接把已存在的概念模型元素转换为本体元素;利用概念量化技术,设计1个分类算法,通过求术语之间的语义亲和度、结构相关性以及术语类之间的联结紧密度,使本体构造中的术语分类可以自动进行,从而为领域本体的构造提供有效可行的方案.

关键词:本体;资源描述框架;语义网

中图分类号:TP311.52 文献标志码:A

Application of ontology based on semantic Web

NIU Wenqi

(School of Sci.,Anhui Agricultural Univ.,Hefei 230036,China)

Abstract:To study the construction method of knowledge ontology based on the semantic Web system,an ontological construction framework is proposed and designed. The existing conceptual schemas are fully used during the ontological construction,thereby the work strength in the term collection is decreased. To raise the speed of constructing ontology,several auxiliary methods are proposed:the conceptual schemas’ elements are directly transformed into ontology’s elements via exchange rules;by using conceptual quantitative technique,a classifying algorithm is designed,which implements automatical term classification by solving the ontological affinity,constructional dependency and coupling compactness between items. So an effective feasible solution for domain ontology construction is given.

Key words:ontology;resource description framework;semantic Web

0 引 言

现今的网络是松散、开放的资源集合,最大的弊端是智能化程度低、网络信息资源不能得到充分利用,提供给用户的信息也不尽如人意.为了解决这些问题,WWW创建者 BERNERS-LEE[1]于2001年正式提出语义网.在语义网的构建中,知识表示、知识本体和智能主体是其不可分割的重要组成部分.其中,知识本体是整个网络设计的中心.由于本体在语义网中扮演非常重要的角色,因此开展对本体的应用研究在语义网实现中具有重要意义.

应用于计算机领域的本体[2]从概念上说是个实体,就是把现实世界中的某个领域抽象为一组概念及概念之间的关系.从本质上理解,本体就是许多主体共同协定的对特定领域共享理解的表示.开发本体的目的是使人类、计算机能够对知识实现共享和重用,方便地进行知识的交互和协作.

1 本体的开发方法

本体的开发应该是相对稳定的,独立于具体的应用.对本体的研究和开发目前已经涉及到多种领域,如企业本体、医学概念本体、电子商务供应链本体等.其中,比较著名的企业本体研究工作,包括多伦多大学的TOVE(Toronto Virtual Enterprise)研究项目和英国爱丁堡大学人工智能应用研究所的Enterprise项目.多伦多大学企业集成实验室采用Gruninger & Fox的“评价法”(又称TOVE)构造本体,而爱丁堡大学人工智能研究所采用Mike Uschold & King的“骨架”法构造本体.

这些工作从各自的实践经验出发,描述各自本体构造的过程、方法和步骤,但也存在一些片面性和不足,主要反映在两个方面:一方面是缺少对本体建模工程标准、指导原则进行落实,并且属于可操作性强的方法;另一方面是针对建模工程中某些特定阶段的分析、建模方法进行深入研究,并且使之具有良好应用价值,但却缺少将它们与整个建模工程集成的研究.

本文借鉴信息系统开发的生命周期方法,将本体的开发划分为规约制定、概念化和实现3个主要阶段.规约制定阶段的主要任务是以文档的形式详细说明开发本体的目的和应用领域,预期本体的用途和最终用户;概念化阶段的主要任务是统一开发人员对领域概念化模型的认识,并以1种明确的方式详细记录概念化模型;实现阶段的主要任务是使用形式化语言对领域本体模型进行编码,使计算机能够理解和处理.

2 概念化阶段

由于建立本体的真正目的并不是建立本体本身,而是为应用系统提供1组公共的领域概念和知识结构,因此概念化阶段是本体开发的重点.概念化阶段的主要工作包括术语收集、分类以及概念的定义,通过抽象出领域概念和关系,准确地定义领域概念的属性和属性域,最终产生1个覆盖本体需求信息的概念与关系集,构造出体现领域概念间层次关系的领域概念层次树.

2.1 术语收集

如果通过对应用领域专家进行反复调研和讨论来收集术语,将耗费大量的时间与精力.鉴于这种情况,提出利用大量已建立好的领域UML概念模型[3,4],通过概念模型与本体之间存在的内在联系,直接把已存在的概念模型元素转换为本体元素.主要采用如下转换规则:在概念模型中的类对应本体中的事物;概念模型中的关系,除了起到连接作用的关系以外,都对应本体中的相互作用(公共属性).通过以上转换,把概念模型初步转化为本体中的本体元素,再利用恰当的术语对这些本体元素进行标志.最后,通过对大量的概念模型转换,可以使本体逐渐趋于完善,节省术语收集时间.

2.2 术语分类

术语分类[5]是本体开发的关键步骤.由于术语是抽象的字符,如果仅仅人为地进行分类,不仅浪费大量的时间,而且对术语的归类也不够准确.为了准确而有效地进行分类,采用术语量化技术,分别从语义及结构这两个角度对术语之间的紧密程度进行量化:利用“语义亲和度”表示两个术语之间语义上的紧密程度,即语义相似度;用“结构相关性”表示术语之间在概念模型中存在的结构上的紧密程度;将术语分类后所产生的术语类别称之为工作域,用“联结紧密度”量化两个工作域之间的关系,最后通过工作域的合并,形成领域概念层次树.

定义1 用Affinity(ti,tj)表示两术语之间的语义亲和度.

从语义上讲,不同的术语之间具有不同的联系,其中术语与术语之间所存在的基本语义联系有4种,分别为:两术语在领域内是同义词(SYN);两术语语义之间存在包含关系(BT);两术语的语义在领域内具有某种联系(RT);两术语的语义在领域内无关(IT).对语义亲和度进行量化按照分类的原则,不同种的语义联系赋予不同的值.在工作过程中对语义亲和度的量化进行如下取值:

(3)选定1个阈值h,把工作域划分矩阵中的元素与阈值h比较,大于或等于者,进行合并产生新的工作域.然后,从工作域划分矩阵中划去合并工作域对应的联结紧密度,同时插入新工作域与其他工作域比较产生的联结紧密度.

重复第(2)和第(3)步,直到不能再产生新的工作域为止.至此,对收集的术语进行工作域的划分,构造出概念层次树,它体现出领域概念间的层次关系.

3 本体的实现

在全球经济一体化和信息化飞速发展的背景下,企业信息化已成为决定企业成败的关键因素,而企业建设信息化的关键点在于信息的集成和共享.本文建立的企业管理知识本体就是为了捕获相关领域的知识,确定该领域内共同认可的词汇,提供人和机器对该领域知识的共同理解,实现信息资源在不同信息系统之间的共享与重用,方便地进行知识的交互和协作.本文以销售管理为例,说明企业管理知识本体设计的实现过程.

在企业管理信息系统中,销售管理为与客户或合作伙伴进行订单签约、完成销售行为而涉及的售中工作管理.图1为销售管理UML模型对象图,图中销售管理所涉及的基本类与关系都通过视图清晰地体现出来.通过前面介绍的元素之间的转换规则,将已存在的概念模型元素转换为本体元素,进行术语收集工作.

针对术语收集阶段所收集到的术语,对术语之间语义亲和度、结构相关性及类的联结紧密度进行计算,按照工作域的划分方法对术语进行工作域的划分.划分的工作域见图2.

各类属性分别如下:一般顾客(顾客号,姓名,地址,电话,订单列表);团体顾客(部门号码,团体名称);一般订单(订单号,日期,信用卡号,总金额,项目列表,顾客号);团体订单(购货单编号);销售代表(姓名,电话);项目资料(项目编号,项目名,单价,订单列表);订单资料(订货数量);送货资料(已送数量,小结,日期);销售资料(顾客列表,每周记录列表,销售代表列表);目录(项目列表).

相应地对企业管理信息系统中的各个模块,通过术语收集、分类、工作域的划分,再结合领域特点,建立系统的概念层次树,并且通过抽象出的领域概念和关系,对领域内的概念及属性进行定义.在实现阶段,采用资源描述框架描述本体模型,主要采用斯坦福大学研制开发的Protégé-2000[6] 作为本体开发工具.

所建立的企业管理知识本体模型的部分代码如下:

rdfs:comment="公事、作业,商品交易中的一系列工作或过程."

rdfs:label="业务">

rdfs:label="付款">

rdfs:label="信息">

5 结束语

建设本体的作用主要是:能够在人与软件之间对信息结构达成共识,方便人机对话;能够使本领域的知识得到共享和重用;使领域内不同的系统和模型之间能够进行互操作.在对特定领域本体的构造和设计进行比较深入的研究后,提出利用UML概念模型,通过概念模型与本体之间存在的内在联系进行术语收集,再利用所提出的术语分类方法,建立领域概念层次树,实现企业管理知识本体,使得企业管理信息系统能够屏蔽由于系统开发者不同而造成的对领域概念理解上的差异,实现系统在概念和语义层次上满足信息交换语义化的需求.

参考文献:

[1] BERNERS-LEE T,HENDLER J,LASSILA O. The semantic Web[J]. Scientific American,2001,284(5): 34-43.

[2] BENSLIMANE D,LECLERCQ E,SAVONNET M,et al. On the definition of generic multi-layered ontologies for urban applications[C]// Computers,Environment & Urban Systems,2000,24: 191-214.

[3] Object Management Group. The unified modeling language specification[S/OL].[1999]. http://.

[4] CASTANO S,de ANTONELLIS V,FUGINI M G,et al. Conceptual schema analysis: techniques and applications[C]// ACM Transactions on Database Systems,1998,23(3): 286-333.

[5] GRUBER T. Toward principles for the design of ontologies used for knowledge sharing[J]. International J Human & Computer Studies,1995,43(5/6): 907-928.

[6] NOY N F,SINTEK M,DECKER S. Creating semantic Web contents with Protégé-2000[J]. IEEE Intelligent Systems,2001,16(2): 60-71.

注:“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。”

上一篇:浙教版初中数学课题学习策略探讨 下一篇:基于网格和最近邻居的聚类算法