分布式信息资源元数据标准化研究

时间:2022-08-01 11:25:56

分布式信息资源元数据标准化研究

摘 要:元数据标准化是推进分布式信息资源一体化建设、实现信息资源共享的关键。基于分布式信息资源元数据标准化基本要求,提出分布式元数据标准规范,并设计了用于元数据标准、管理以及共享的平台,即分布式信息资源元数据标准注册系统的总体框架。

关键词:分布式信息资源; 元数据标准化; 元数据标准; 元数据注册系统

中图分类号:TN915 文献标识码:A

文章编号:1004-373X(2010)11-0147-04

Research on Standardization of Distributed Information Resource Metadata

LI Zhen-fu1, ZHANG Jun-xing1, LI Yi2

(1. Xi’an Communication Institute, Xi’an 710106,China; 2. Shaanxi Electric Power Research Institute, Xi’an 710059, China)

Abstract: The metadata standardization is a key factor for carrying forward the integrated construction and sharing of distributed information resource. On the basis of the fundamental requirement for the standardization of distributed information resource metadata, the metadata standard specification of the distributed information resource is proposed, and the overall framework for the metadata standard registry system of the distributed information resource is designed for the metadata release, management and sharing.

Keywords: distributed information resource; metadata standardization; metadata standard; metadata registry system

随着信息技术的快速发展和社会信息化建设的不断深入,信息资源在数量和复杂程度上的同步增长使信息搜集和检索技术越来越难以满足大部分用户的信息需求。特别是分布式信息资源,由于信息生产的多目的性和无序性,使信息资源在空间分布上显现出复杂的格局,离散分布于不同地区、行业和组织之中,导致信息“富集”与“贫集”现象的产生[1]。由于标准难以统一、数据异构等原因,给信息资源的检索、共享、利用带来各种困难。元数据在大型企事业单位中应用广泛,被称为信息系统的“DNA”,结构化的元数据不仅能够描述数据信息,还可以规范信息的数据结构和目录内容[2]。统一的元数据描述框架可以进行真正意义上的信息资源整合,面向公众提供统一的信息查询,提高检索的精确率,促进信息资源的共享和利用[3]。只有通过标准化、格式化的程序描述数据才能确保数据交换和数据重复的最小化。面对日益增长的分布式信息资源,用于数据收索、获取和分析的标准化元数据就显得非常必要[4]。

1 基本要求

1.1 需求驱动

元数据标准化要紧贴现实需求。只有以现实需求为依托,设计出来的元数据标准才有实际价值。因此,信息资源元数据标准规范的设计要立足于分布式信息资源元数据用户实际需求,设计出来的元数据能够对分布式信息资源尽可能全面地描述,以满足信息资源不同应用主体对信息资源的需求。这些需求主要包括对信息资源的描述与评价、快速发现和定位、管理、数据维护以及获取等。

1.2 个性化

不同领域的元数据有不同的功能需求,因此会有不同的标准。制订分布式信息资源元数据标准时,应该以应用为背景,以满足分布式信息资源的管理、共享为目的,在详细分析分布式信息资源特性的基础上,体现实际应用的需求特点,制定出满足要求的元数据标准规范。

1.3 简洁性与准确

分布式信息资源元数据的标准要尽可能的简洁。只有简洁易于掌握的元数据标准,才能被广大元数据标准化工作人员接受,并很快运用。同时,为了最大限度地满足用户的需求,要求对分布式信息资源的描述要准确,而不准确、不相关的信息比没有信息的危害还要大。在保证元数据标准能够对分布式信息资源进行准确描述的基础上,使标准构成尽可能的简洁。

1.4 互操作

互操作性是分布式信息资源元数据的重要特征,是实现分布式信息资源互操作的基础。分布式信息资源元数据只有具备良好的互操作性,才能实现不同系统间的信息资源互操作,进而满足分布式、异构信息系统信息资源管理共享的需求。

1.5 可扩展

标准是标准化活动的成果之一,标准在标准化过程中得到不断发展完善。标准化的主要内容就是制定标准,实施标准,进而修订标准,又实施标准[5]。因此,分布式信息资源的元数据标准规范也不是一成不变的,它会随着信息资源对元数据功能需求的改变而不断改变。所以分布式信息资源的元数据标准要有可扩展性,要能实现元数据标准的可持续发展,以满足分布式信息资源元数据发展需求。

2 分布式信息资源元数据标准规范

2.1 层次结构

元数据一般为树状结构,可以按一定的层次进行组织。分布式信息资源元数据从层次上可分为元数据子集、元数据实体和元数据元素。元数据元素是分布式信息资源元数据最基本的信息单元,不可再分割;元数据实体是同类信息资源元数据元素的集合,是比元数据元素高一层的概念,它们之间是包含与被包含的关系;元数据子集则是相互关联的信息资源元数据实体与元数据元素的集合,用于说明信息资源某一方面的内容。分布式信息资源元数据的层次结构如图1所示。

图1 分布式信息资源元数据层次结构

2.2 核心元数据的数据模型

遵循分布式信息资源元数据标准的建设原则和流程,以实现信息资源的发现、定位、检索与管理以及获取为目的,设计资源信息核心元数据模型,如表1所示。

为了保证元数据的通用性,其元素尽可能地在现有元数据标准元素中选取,如表中部分元素是复用国际通用元数据标准DC元数据的元素。根据信息资源的特殊要求,对通用标准进行扩展,考虑到分布式信息资源对安全性的要求,特别增加了限制子集。

核心元数据元素按功能分为六个子集,分别为资源限制信息子集、资源内容信息子集、数据质量信息子集、资源标识信息子集、分发信息子集、负责方信息联系子集。新增的资源限制信息子集,用于描述分布式信息资源的管理使用权限、资源安全限制等级分级以及资源安全保密期限,以便对信息资源的安全进行控制。资源内容信息子集重点说明了信息资源的基本数据组成,信息资源内容的基本情况。数据质量信息子集包含数据志和概述,数据志用来说明信息资源的生产依据和过程;概述给出了数据质量按特定数据生产标准进行评价的结果,由于分布式资源对数据质量的要求比较高,所以数据质量信息显得尤为重要。资源标识信息子集包含有信息资源惟一标识符、信息资源的摘要信息、信息资源的状态,用于信息资源的检索和发现。分发信息子集主要用来描述信息资源获取的信息,包括分发者信息、数据分发格式信息以及用户获取信息资源的途径。负责方联系信息子集主要为信息资源的获取、分发、管理以及维护提供保障,可重复使用。

上一篇:基于DSP的FFT算法在无功补偿控制器上的应用 下一篇:基于串行通信的智能家居上位机设计