数字图书馆信息体系结构的设计

时间:2022-10-22 10:39:31

数字图书馆信息体系结构的设计

摘要: 数字图书馆的信息体系结构将分散在异地的数字化信息统一起来,构成一个虚拟的而且具有优化结构的相关有机实体,为数字图书馆的应用提供统一的资源访问,而且能方便地对资源进行管理。

关键词: 数字图书馆信息体系结构设计

数字图书馆设计信息体系结构的目的在于使其丰富的信息资源能够合理地、规范地组织,一般按类型组织资源库中的信息,提高信息资源的网络化共享程度,最大限度地满足用户的信息需求。

一、数字图书馆信息体系结构的设计要求

第一,必须给用户及其应用程序以相当的灵活性。用户查检资料方法和途径的多样化,要求在组织数字化信息时不能在用户检索资料的方法、专业性程度或文献检索的序列上有所倾向。

第二,藏品结构应易于直接管理、跨库连接及快速查询。数字图书馆是以相对较少的专业人员管理非常庞大的馆藏,体系结构应能使这些人员在管理方面尽可能摆脱日常事务。同时体系结构的设计要易于实现不同类型资源库的连接和满足用户快速检索的需求。

第三,信息体系结构应能反映经济、社会和法律等构件在信息基础中的发展,特别是应能识别信息是否有价值,可否类化和条件化,可否传递到无国界的非安全网络上,等等。

二、数字图书馆核心服务的主要特征

数字图书馆体系结构中的内容是以数字对象形式存储的,数字对象是用全局唯一的持久名字――句柄标识的,句柄用命名服务器注册,用名录服务器解析出句柄标识的数字对象的位置。数字对象的存储和访问是由仓储服务系统实现的。索引服务提供发现数字对象的机制,使用户易于从馆藏中寻找和发现所需的对象。用户接口网关提供以人为中心的数字图书馆的功能入口。

三、数字对象系统

数字对象是数字图书馆体系结构中存储信息的基本逻辑单位和实体,是以一定结构的数字形式表达信息内存的一种方法,是网络环境下的数字资料。可以说数字图书馆是由数字对象构筑而成的,数字图书馆中的信息以数字对象形式存储、访问、传播和管理,数字对象存放于仓储中,其形式如一篇文章、一张图片、一部音乐作品或是一段影像。数字对象是由数字资料(或数据)和其唯一的标识符――句柄组成的,其中关于数据的信息称作元数据。

四、仓储服务系统

仓储也称为数据仓库或资源库,是―种专门类别的仓库,特别适于保存含有价值信息的材料,主要是分布式信息仓储,基本存储单元是数字对象,整个系统就是为了存储、访问、管理数字对象而设计的。存放数字信息的仓储有多种类型,如FTP文档、web服务器、在线数据库等。

仓储服务系统通常是由关系型数据库来管理、应用程序通过资源库提供的库访问协议RAP(Repository Access Protocol)来访问资源库,可实现存储、访问、复制、移动和删除数字对象等操作。RAP定义了外界访问仓储的最基本的接口。如果一个数字对象的句柄解析成相应的仓储,则认为该数字对象包含在此仓储中,只有通过向相应的仓储发送服务请求才能访问该数字对象。

五、名录服务系统

名录服务系统也称为命名系统,是针对长期标识符即数字对象名字的分配、管理及解析的综合系统。句柄系统(Handle System)是美国国家研究创新公司(CNRl)为数字图书馆提出的第一个完整可用的名录服务系统或URN系统。作为CNRI开发的第一个命名系统,句柄系统显然独立于RUN系统开发,但它与URN是兼容的;系统在整个因特网范围内为用户提供安全的名录解析和分布式的句柄管理服务,提供手段使句柄与数字对象关联,使地址与数字对象关联,并对系统中的人员、计算机资源、网络、数据仓库、数字对象、Web服务器等进行识别、监控和调度等。

名录服务系统类似于DNS(域名系统)和URL(统一资源定位器),包括开放的句柄协议、名字空间和句柄协议的具体实现。名录服务系统具有唯一性、持久性、可扩展性、多实例、国际字符支持、分布式的服务和管理、安全有效的解析等特点。分布式的计算机系统可以存储数字资源的名字或句柄,通过句柄协议,将句柄解析成数字资源所在仓储的地址信息,从而使用户或可以通过句柄访问和使用这些资源。数字资源的存储位置发生变化时,句柄不变,只是由句柄系统修改句柄与地址信息间的对应关系,因此资源的名字是持久性的。

名录服务系统或句柄系统是由位于顶层的全局句柄注册系统和位于底层的多个局部句柄服务系统共同组成的层次服务系统。全局句柄注册系统提供解析句柄和管理句柄名字空间的功能,是一个集中管理的注册服务,所有的命名授权均必须用全局句柄注册系统注册。局部句柄服务系统管理由自己命名授权的句柄,为这些局部名字提供解析和管理服务。同时,局部句柄服务系统和多个仓储相关联,实现了仓储与名录服务系统的交互,如仓储要求删除句柄的请求,可直接发送给与其绑定的局部句柄服务系统。

六、索引服务系统

索引服务系统是数字图书馆信息体系结构的重要组成部分,提供了使用户通过查询能够很容易地从馆藏中寻找和发现所需数字对象的机制。系统的资源发现功能由索引服务器和索引管理器两部分合作完成。索引管理器选择执行查询的索引服务器,在索引服务器中执行查询,合并来自索引服务器的结果。

1.索引服务器

索引服务器是收集关于数字对象的信息。这些信息可以是数字对象的替代信息,如传统图书馆编制的机读目录,也可以是对象的全部内容,如全文搜索引擎使用的全文信息。这些替代信息被组织成结构化的索引,保证了搜索引擎在响应请求时的查准率和查全率及检索效率。查询请求返回的是一个结果集,每个结果都是符合查询要求的数字对象的唯一标识符,通过名录服分解析该标识,就可访问相应的数字对象。

2.索引管理器

选探索引服务器并执行查询。索引管理器必须了解各个索引服务器所存储的数字资源,定期更新索引服务器中的源列表,以及描述源的元数据和内容摘要。同时,为了对各个索引服务器的查询结果进行合并、排列,索引管理器还必须了解有关查询结果集的信息。

七、用户接口网关

提供以用户为中心的数字图书馆功能接入点、用户接口网关负责向用户提供查询界面,接受用户的检索请求,然后将用户的检索请求进行语义规范和语法转换,选择合适的馆藏服务进行搜索和访问,并对返回的命中结果根据相关性、资源类型、数据格式等进行过滤、排序或做具体显示处理。用户接口网关可支持Netscape或IE在任何计算机系统上运行。

上一篇:计算机网络实验室的构建 下一篇:提高高中思想政治课教学有效性的三点体会