浅谈网格环境下元数据的数字图书馆互操作研究

时间:2022-08-14 11:51:37

浅谈网格环境下元数据的数字图书馆互操作研究

【摘 要】 本文从互操作、协议互操作和语法结构互操作角度出发,对实现数字图书馆系统间互操作中所诸类问题进行了较为深入的研究。

【关键词】 语义网格 元数据本体 数字图书馆 互操作

Based on grid environment of the ontology metadata interoperability of digital library

Quan hong

(xinjiang shihezi university library Xinjiang shihezi 832003)

【Abstract】 This article from the interoperability, protocol interoperation and grammatical structure interoperability Angle, to realize digital library system interoperability between the kind of problem that makes deep research.

【Key words】 Semantic Grid meta data ontology Digital Library interoperating

1 网格环境下元数据的数字图书馆互操作问题的提出

数字图书管理是当前的一个重要管理指标,主要是通过建立相应的管理机制,形成资源共享的应用模式,尤其是将独立的数字图书馆形成有机的管理方式,形成协同工作的综合方式,并采用统一的界面提供对外的服务模式,并建立起规范化、具体化、统一化的综合运用方式,这种自下而上的信息综合服务平台,能为资源的整体衔接提供更多的知识运用模式,形成有机的统一体。从当前的数字图书馆技术运用来看,采用分布式搜索、原件数据采集等不同的应用方式,确定了一定的进步,但是还存在更多的问题,例如,不同主体之间的相互操作,解决不了数字图书馆的语义操作模式,本身存在一定的差异性,这种本体之间的映射反应,通过建立相应的术语模式与与具体语境相吻合,形成整体知识的相互运用,其次,还存在有跨语言、跨文化的互操作方式,都不利于整个数字图书的整体技术提升。

1.1 元数据结构标准框架

元数据结构作为一种图书馆解决语义互操作的重要基础工具,在整个标准化框架的运用中起着很大的作用,通过数字图书馆的资源结构模式分析,将可以标示的资源进行细化,并将元数据与资源属性进行深入的描述,这种具体的操作方式,有利于整个数据资源的整体作用发挥,并在资源构建中形成信息结构的整体定义。元数据的主要构成就是通过数字对象构成的资源库,包括有数据格式、元数据标准化方案、注册系统等多个整体设计与原件构成整,能为整个数组图书馆的技术语义互操作打下良好的运用基础。

从当前元数据的标准框架结构来看,主要有三部分组成,意识数字图书馆的统一元数据标准,语义规则以及元数据扩展机制的形成,在核心元数据的标准化分析中,按照扩展机制的整体运用模式,定制科学有效的元数据使用方案,将中文名称、标识等定义性的元素进行整合,形成不同值域、数据库、注释等的整体融合,并将录入格式进行整体的综合管理,形成资源利用的综合方式。

1.2 元数据互操作模型

在采用元数据的技术处理中,实现数字图书馆语义的互操作主要有两种不同的方式与途径,在具体的操作过程中,主要是采用元数据的有效使用与共享本体的整体运用。在相应的技术层面,要充分掌握元数据的技术综合管理,尤其是掌控好元数据在描述信息资源特定情形下的微观结构,加强对DL的资源综合管理,是实现资源发现的关键技术,并能有效实现资源利用与互操作的综合管理,从当前的语法袁术以及语义元数据的控制层面来看,这些语法元数据的内容存在非上下文的信息,能提供文档内容的语义;而语义数据描述的文档内容牵涉到具体的信息领域,要借助上下文的解释来完成。

在不同元数据的要实现相互的操作方式和功能运用,也可以通过两种相应的管理措施,一是有数据的使用者,将一种元素标准中的元素映射为另一种相应的标准化的元素,形成两两映射的整个关系网络,突破更多数据源在标准状况下很难实现的问题,另外一种途径就是基于转换板的思想模式,将全部的元数据映射成一种兼容性很强,数据相对全面的技术模式,并通过转换板的实现来形成不同数据源之间的映射作用,更加具有很大的优势。

2 网格环境下元数据的数字图书馆语义互操作策略

互操作的策略主要是采用元数据的基础运用,形成特定语言环境下的微观结构模式,尤其是结合DL各方面的技术参数,实现资源管理的综合模式,并具体实现资源的整体利用情况。

2.1 语义互操作

语义互操作是指在网络操作的环境中,形成双方透明化的资源访问模式,更好的将对方资源运用到整个综合管理模式之中,将元数据本身的意义在具体的操作中发挥出来,客服在资源描述中出现的语义的障碍,譬如语义差别、多版本等多方面的问题,从具体的应对方式来看,主要有数据衍化、元数据映射、中心数据处理等方式,能全面的解决遇到的相应问题。

2.1.1 元数据模型衍化

元数据的模型衍化是当前数据管理的一个重要应用要求,在原有数据的系统管理模式基础上,采用元数据的增加减少等方法,形成全新的元数据系统,有利于整个数据模型的衍化功能。

通过这种模型衍化的技术系统运用,在确保基本结构的基础上,将共同数据的元数据形成基础性的技术处理,并进行深化、细化的综合管理,采用这种衍化的技术运用,可以采用多种方式,尤其是通过编码形式、语言翻译等方法,在确保数据源基本内容没有改变的条件下,进行相应的元数据模型的创新,更好的实现兼容性的元数据模型,并有全新的变化、拓展等,实现整个系统的结构优化。

2.1.2 应用方案

作为一种全新的应用方案,要针对不同的应用范围与相应的客户要求,采用现代化的元数据规范化操作,并引进先进的国际技术,形成规范化的编码管理体系,形成基本构建的有机组合模式,构建需求与资源特点相结合的应用模型。

这些现代化的应用模型与技术采用的综合管理,从多元数据的标准化中选择相应的元素进行分析,并通过裁剪、扩展、修改等方式,创建全新的元数据要素,将这些标准化的元素通过吸收或者整合的方式,将特定的元数据用户构建在一个元数据体系中,形成一对一特定的应用元数据标准化管理。

2.1.3 元数据映射

元数据映射则是对存在于不同应用领域的元数据格式进行转换,即为一种元数据格式的元素和修饰词里找到有相同功能或含义的元素和修饰词在另一种元数据格式里找到有相同功能或含义的元素和修饰词,通过一对一、一对多、多对一及多对多等多种映射方式,解决语义互换及统一检索问题。

2.1.4 元数据格标准框架

元数据格标准框架是规范设计定制某类特定资源所用的元数据标准时需要遵照的规则和方法,它是抽象化的元数据。它从更高层上规定了元数据的功能、数据结构、格式、设计方法、语义、语法规则等多方面的内容。

2.2 元数据语法结构互操作

元数据的标准化操作是当前语法结构中的一个重要模式,尤其是通过计算机的全面处理功能,建立相应的表示方法与相应的描述规则,将元数据的描述语言与语法结构进行细化,并通过采用语法结构的物理解决方式。根据不同的对象,进一步形成分句法与模式结构的运用,共同决定元数据的模式。并在此基础上,构建全面化的解决模式,形成元素机器解读的编码的方式,形成解决语法、结构互操作的标准化管理模式,形成不同系统之间的整体管理,从而有效解决元数据的互操问题。实际上,XML,RDF,XST从不同角度起着类似的作用。

(1)XML。XML语言实现了知识的“机器可读性“(Machine Readable)”。XML语言不仅具有很好的跨平台性,作为一种界定文本数据的简便而标准的方法,使用标记来说明用户所描述的概念,使用属性来控制数据的结构,XML通过其标准的DTD/Schema定义方式,允许所有能够解读XML语句的系统辨识用XML-DTD/Schema定义的元数据格式,能够有效的解决对不同元数据格式的解读问题。

(2)RDF。RDF资源描述框架,通过对结构化的元数据进行编码、交换及再利用,提供了各种不同的数据体系之间的语义、语法和结构的支持。RDF有3个部分组成:RDF DataModel,RDF Schema和RDF DataMode提供了一个简单单功能强大的模型,通过资源及其相应值来描述特定资源;RDF Schema则对RDF的语义进一步扩展,提供描述相关资源以及这些之间关系的机制,并提供RDF核心类(Core Class)、核心属性(Core Attribute)和核心限制(Core Constraint)、等机制来定义资源的类;RDF (Syntax)则构造了一个完整的语法体系以利于计算机的自动处理,它以XML为其主语言,通过XML语法实现对各种元数据的集成。

(3)XML与RDF的融合。分析RDF和XML两种模型语言的各自特点,可以看出RDF虽然提供丰富的语法描述支持,但对本地使用约束模型只提供有限的支持;XML虽然提供明显结构、技术和数据类型约束的支持,但是只提供很少的语义支持,而这些语义知识对于实现元数据域的可扩展动态变换是十分必要的。因此,最合理的方法是利用RDF模型和XML模型的互补性,结合使用。

2.3 语义互操作协议

语义互操作协议是指在网格中的组织通过一种联盟的形式,彼此约定同一规则,遵守相同的协议,在应用层面上进行数据的和检索。对于资源异构,目前比较的一种解决方案就是采用开放文档先导OAI-PMH协议是互操作的框架。

OAI协议(Open Archives Initiative)是一个旨在促进网络信息资源与共享的合作组织,意在开发文档先导,由国际组织提出的基于元数据的互操作框架方法,在其框架中主要有数据提供者DP(Data Provider)、服务提供者SP(Service Provider)。用公用元数据格式DP将其表达,并通过OAI协议提出统一的标准化界面,向外部揭示自身的元数据,SP则通过OAI协议获一步的信息增值服务。此方法通过元数据收获模型,可解决各数据库在元数据格式上的异构性问题,以实现资源的整合检索。旨在促进网格信息资源开发、与共享的合作组织。OAI的起因是为了加强以学术交流为目的的对电子印刷文档的访问,以及保证科学数据在将来被访问的需求。OAI-PMH于2001年4月了它的开放文档元数据采集协议(open archive initiative protocol for metadata harvesting,OAIMH)。OAI-PMH的目标是通过元数据采集模型实现在网格信息的不同组织之间的互操作,提供一个应用无关的元数据互操作框架。OAI-PMH通过简单的开放式元数据传输协议,来实现各图书馆之间的互操作。虽然OAI的标准元数据比较简单,以无修饰词的DC为核心,运用于一些复杂数据结构时存在障碍,但随着电子政务的深化、电子档的大量产生以及这些数据与OAI之间转换技术的进一步完善和成熟,OAI-PMH在数字资源网络化与共享方面将有更为广泛的前景。OAL元数据收割框架。

参考文献:

[1]毕强等.语义网格环境下基于元数据本体的数字图书馆互操作研究[J].图书情报工作,2009(8):17-20.

[2]诸云强.地球系统科学数据共享关键技术研究[M].北京:科学出版社,2009(2):20-21.

[3]董 惠等.数字图书馆本体应用环境研究[J].中国图书馆学报,2009(5):52-58.

[4]朝乐门.基于语义Web的知识处理流程及其技术框架研究[J].中国图书馆学报,2009(5):59-68.

[5]张继东.基于OAI的数字图书馆网格系统构建与研究[J].情报理论与实践,2010(9):107-110.

[6]毕强等.元数据标准及其互操作研究[J].情报理论与实践,2007(5):666-670.

[7]焦玉英等.异够分布信息检索系统整合研究[J].中国图书馆学报,2008(2):51-55.

上一篇:基于工作过程的静态网页设计 下一篇:基于CT图像的金属块二维坐标检测算法