多维概念格与领域本体互构建方法研究

时间:2022-04-22 03:36:22

多维概念格与领域本体互构建方法研究

摘要:多维概念格与领域本体具有相同的代数结构,也就是格结构,使得二者之间很容易产生一种映射关系。该文提出了多维概念格与领域本体的映射机制,以此为理论依据,设计了多维概念格与领域本体互构建方法,并通过实例给以实现。为领域本体的知识表示提供了新方法,也扩展了多维概念格的应用领域。

关键词:多维概念格;领域本体;映射;互构建

中图分类号:TP18文献表示码:A 文章编号:1009-3044(2010)16-4342-03

Mutual Building Algorithm and Implementation of Multi-dimensional Concept Lattice with the Domain Ontology

GUO Xian-e, ZHANG Jie

(School of Mathematics and Computer Science, Shanxi Datong University, Datong 037009, China)

Abstracts: Multi-dimensional concept lattice with the domain ontology have the same algebraic structure, that is Lattice structure, and it is easy to produce a mapping relationship between the two. A mapping mechanism of multi-dimensional concept lattice with the domain ontology was presented in this paper, and as a theoretical basis, algorithms were designed to each other and achieved through examples. So the paper provided a new approach for knowledge representation of the domain ontology, and also extended the applications of multi-dimensional concept lattice.

Key words: multi-dimensional concept lattice; domain ontology; mapping; mutual build

1 概述

目前,国内外大量的文献都将形式概念分析或本体作为概念知识处理的有效方法来进行深入研究。文献[1]是基于形式概念分析的本体构建、合并与展现;刘宗田等在文献[2]中提出基于形式概念分析的领域本体构建方法;等等。本文提出了多维概念格与领域本体的映射机制,以此为理论依据,设计了多维概念格与领域本体互构建方法。

2 基本概念

2.1 多维概念格定义

多维概念格基于多维形式背景,引用多维数据序列对内涵进行不同维度的描述。多维概念格应用于空间数据背景,格中节点内涵的描述具有明确的维度标志。

定义1[3]称K=(G,Mn,I)为多维序列形式背景,其中G为有限非空事例集合(称为外延),Mn为压缩形式的n维数据序列集合(称为内涵),I是G与Mn之间的一个二元关系,即I?哿G×Mn:对于xIyn,表示x与yn间(其中x∈X,yn?奂y,X?哿P(G),Y?哿Mn)存在关系I,即事例x拥有属性构成的数据序列yn。则在此形式背景下,存在唯一的偏序集与之相对应,并且这个偏序集产成唯一的格结构。格中的每一个元素是一个二元组(X,Y)。

定义2[3]当且仅当二元组(X,Y)满足性质:

X=g(Y):g(Y)={x∈G|?坌yn?奂Y, xIyn}

Y=f(X):f(X)={yn?奂Mn|?坌x∈X, xIyn }

时,称二元组(X,Y)关于I是完备的。

定义3[3]由定义1和定义2所诱导的格L就称为多维概念格。它与概念格不同之处在于,概念的内涵是n维有序的数据序列,相当于属性串集合。

2.2 领域本体定义

定义4[4] 领域本体是特定领域内共享概念模型的明确的形式化规范说明。

定义5 领域本体的逻辑结构可以看成一个五元组,O::={C,AC ,R,X,I},中文表述:领域本体::={概念,属性,关系,公理,实例}。详细说明:C:概念,表示领域内对象的集合,包括概念的名称与其他概念之间的关系,及用自然语言对概念的描述。AC表示概念C所对应的属性集合。 R:概念之间的关系。概念之间的基本关系共有4种:Part-of、Kind-of、Instance-of、Attribute-of。Part-of表达概念之间部分与整体的关系;Kind-of表达概念之间的继承关系;Instance-of表达概念实例与概念间的关系;Attribute-of表示概念的属性关系。X表示概念或概念之间的关系所满足的公理。I表示领域内概念实例的集合。

3 多维概念格与领域本体的映射机制

3.1 多维概念格与领域本体的相关性

多维概念格与领域本体在客观上存在着相关性。具体表现为如下几点:

1)多维概念格将概念分别从内涵和外延两方面进行描述,丰富了概念的属性集和实例集,更重要的是,它能够发现蕴含在多维形式背景中的隐含概念,并自动分析出隐含概念的内涵和外延。因此,多维概念格是一种协助领域本体概念描述的非常有效的描述工具。

2)多维概念格作为形式概念分析理论的核心数据结构,能深刻的反映出概念节点之间的继承关系,这对进行概念聚类,确定概念的类属关系是特别有利的。

3)多维概念格较一般概念格增加了维度的描述,能够对不明显的概念间的关系进行推理,实现概念间关系的部分推理功能。还可以对概念进行合并、编辑等运算,进行概念重构。因此,多维概念格是协助进行领域本体概念分析的有效分析工具。

4)多维概念格是一种建模工具,支持用户在给定数据的基础上进行领域分析和建模,多维概念格hasse图可以使得概念间实现可视化。因此,多维概念格是协助进行领域本体建模的良好的建模工具。

3.2多维概念格与领域本体的映射机制

多维概念格与领域本体表现的相关性,使得二者之间很容易产生一种映射关系,如图1所示。图中从本质上揭示了多维概念格与领域本体二者之间如何映射的问题。特别地,领域本体的公理集与多维概念格蕴含的关联规则也符合此映射规则。

4 多维概念格构建领域本体

4.1 基于多维概念格的领域本体构建方法

给出基于多维概念格的领域本体构建方法。

1)将多维概念格进行转换处理,得出领域本体概念层次模型;

2)根据领域本体概念层次模型映射出领域本体原型;

3)对领域本体原型进行扩充,包括:对领域本体属性的扩充、对领域本体实例的扩充、对领域本体公理的扩充和对领域本体非分类关系的扩充。

4.2 基于多维概念格的领域本体构建方法实现

依据基于多维概念格的领域本体构建算法,针对文献[3]的实例给以实现。

例1 表1是某班学生选课情况表,G为学生序号(共3人),学生所选课程名用字母表示,I 为G中的对象拥有的多维数据序列。该例中课程名、必修课程与选修课程、春季与秋季,分别对应1、2、3三个维度,是一个3维形式背景。

形式背景K=( G,Mn,I)中的G={1,2,3},Mn是一个三维序列,其精简序列为:Mn={3,3,3}

当min_support=2时,相应的Hasse图如图2所示。

将多维概念格进行转换处理得出领域本体概念层次模型。见图3。

根据领域本体概念层次模型映射出领域本体原型。本体原型可表述为:

节点#1:({概念:选课},{属性:NULL},{关系:所有节点的根节点},{公理:NULL},{实例:1,2,3});

节点#2:({概念:aW},{属性:必修a,选修W},{关系:节点#5、#6的父节点,节点#1的子节点},{公理:春季选a秋季选W},{实例:1,2});

节点#3:({概念:GzX},{属性:选修GX,必修z},{关系:节点#6、#7的父节点,节点#1的子节点},{公理:春季选修G,秋季选修X必修z },{实例:2,3})

……

节点#6:({概念:aGzWX},{属性:选修GWX,必修az},{关系:节点#2、#3的子节点},{公理:NULL},{实例:2})

5 领域本体建构多维概念格

5.1 领域本体建构多维概念格方法

依据多维概念格与领域本体映射规则,很容易地从领域本体抽取出多维概念格,方法如下。

1)对领域文档的预处理, 获取领域中的“对象-属性”关系;

2)依据“对象-属性”关系,生成多维形式背景;

3)依据形式背景构造多维概念格。

5.2 领域本体建构多维概念格方法应用

依据领域本体构建多维概念格的方法,从领域本体中抽取多维形式背景与多维概念格。

例2 针对文献[4]交通领域中具有属性“陆地上的”概念层次模型片段,如图4所示,给出其多维形式背景与多维概念格,画出hasse图。

本体原型的表述:

节点1:({概念:交通工具},{属性:NULL},{关系:所有节点的根节点},{公理:NULL},{实例:黄包车、马车、自行车、摩托车、汽车、火车});

节点2:({概念:陆上交通工具},{属性:陆地上的},{关系:节点3、4、10的父节点,节点1的子节点},{公理:NULL},{实例:黄包车、马车、自行车、摩托车、汽车、火车});

……

节点10:({概念:火车},{属性:陆地上的,铁路上的},{关系:节点2的子节点},{公理:NULL},{实例:火车})

从本例中概念层次模型与本体原型抽取出2维形式背景,图5所示。其中,a,b,c,d,e分别表示属性:人拉的,脚踏的,动物驱动的,汽油驱动的和电力驱动的(添加属性),字母所带的下标表示维层跨度,如:d2表示属性d的维层跨度是2。

相应地,易得多维概念格及hasse图(见图6),多维概念格的全部概念在图6中标出。

6 结论

本文分析了多维概念格与领域本体原型的映射机制,提出了合理的映射规则;增加了对领域本体概念模型的抽象描述环节,设计了多维概念格与领域本体互构建算法与具体实现。提高了多维概念格与领域本体的复用程度,便于多维概念格与领域本体的重用、共享和互操作,利于本体的映射、合并、联盟等再工程。

参考文献:

[1] 徐红升.基于形式概念分析的本体构建、合并与展现[D].郑州:河南大学应用数学系,2007.

[2] 黄美丽,刘宗田.基于形式概念分析的领域本体构建方法研究[J].计算机科学,2006(1):210-239.

[3] 郭显娥,王俊红.多维概念格与关联规则发现.计算机应用,2010.30(4):1072-1075.

[4] 张云中.基于形式概念分析的领域本体构建方法研究[D].吉林大学硕士学位论文.2009.

上一篇:Flex RIA技术在ERP系统中的应用 下一篇:嵌入式Linux2.6的实时性研究与改进