拓片著录与网络利用技术在现代图书馆中的应用

时间:2022-10-18 10:15:28

拓片著录与网络利用技术在现代图书馆中的应用

[摘要]基于CALIS“十五”期间全国高校专题特色数据库建设的实践,针对拓片文献在现代图书馆收藏与利用过程中的关键问题:拓片著录规范与数字化整合技术、拓片数据库平台选用与拓片元数据的组织和标引、拓片文献信息的网络与维护逐一进行较为详细的分析和介绍,概括性地总结出一套解决方案,以期为图书馆拓片文献的开发利用提供系统的理论参考。

[关键词]拓片 著录 标引 元数据 特色数据库

[分类号]G255.I

1 引言

拓片是通过捶拓的方法,将镌刻在金石器物上的铭文与图画拓印到宣纸上的一种特殊文献。拓片以其较高的史料价值、艺术价值及文物价值,历来被视为中华民族文化的瑰宝。但由于拓片文献载体的特殊性,图书馆在收藏管理和提供阅览服务时面临区别于一般文献的问题和困难。收藏管理的首要问题是拓片的著录与分类保存,目前指导图书馆文献分类著录的“分类法”尚不能满足对拓片详细分类著录的需要,常规图书资料的排架借阅管理方式也不适用与拓片。拓片的珍贵性和安全保护的要求决定了拓片阅览服务的局限性,这些都是长期以来影响图书馆拓片资源利用的主要因素。笔者所在的洛阳师范学院图书馆是一所利用地域文化优势收藏墓志拓片在国家同类高校中数量较多、质量较高的图书馆,本馆参建的中国高等教育文献保障系统CALIS“十五”专题特色数据库子项目“河洛文化文献专题数据库”(项目编号4401―2―070,2007年结项获三等奖),依据国家“数字图书馆标准与规范”对馆藏拓片进行著录与建库,借助现代数字图书馆网络技术,较好地解决了拓片保存和利用之间的矛盾,使珍贵的拓片资源得到了有效利用。本文结合实践就“拓片原件的著录”和“拓片数字图像的建库与网络”进行介绍和探讨。

2 拓片原件的著录

“拓片原件”指的是从器物上捶拓而得的原拓拓片实物,主要区别于同一拓片的复制品或数字图像。拓片原件的著录是从目录学的角度,对拓片的诸多著录项目依照一定的著录法则进行著录,同时兼顾到拓片数据库元数据制订时拓片元素名称与著录项目的对应关系。

典藏号项:典藏号的主要功能是便于排架和检索。典藏号以数字编码或以字母、数字相结合混合编码构成,有以下几种形式:①文献类别代号+顺序号+盒号;②文献类别代号+朝代号+年代号+盒号;③文献类别代号+盒号+顺序号;④朝代号+别页序号+盒号;⑤朝代号+盒号+别页序号;⑥分类号+别页序号+盒号;⑦分类号+盒号+顺序号。收藏单位可根据情况选择一种标识系统作为典藏号,如RUB 0001:1,RUB表示文献类别(墓志拓片),0001表示顺序号,:1表示盒号。

原题名项:原题名是指墓志本身原有的题名。一般位于墓志首行,记述死者的朝代、官职、籍贯、姓氏等。但少数墓志的题名在志文的末尾。如《曹夫人李氏墓志》,首行为撰文者,末尾题“扶风曹氏夫人陇西李氏墓志铭并序”,此种情况,仍视为原题名著录。

名称项:原题名情况比较复杂,有的含有朝代、历任官职、任职地点、皇帝赐名等多达几十字,如《孙汉绮墓志》,原题名为“宋故推忠翔戴功臣光禄大夫检校持保使口即和州诸军事行和州刺史充木州团练使兼御史大夫上柱国乐安郡开国候食邑一千户孙公墓志铭并序”,作为题名项太烦琐,还有的墓志根本就没有题名或题名意义不明确。鉴于此,著录时可拟定一个简单明了的名称,说明某人之墓志即可。

责任者项:对创建拓片资源内容负责任的实体。责任者包括撰、撰并书、编、辑、述、篡、注、译、绘、篆、刻、书额、篆额、书盖、篆盖、摹、镌、造、立等不同的责任方式。著录时不同责任方式之间用逗号或分号隔开。

金石年代项:金石文字和图像内容产生与刻制的日期。1949年之前著录中历纪年,顺序为:中国朝代、帝号、纪年(相应的公元纪年)、纪月、纪日及依据。1949年之后著录公元纪年、月、日及依据。朝代著录推荐使用“中国历史朝代名称著录规范表”。

金石所在地项:著录墓志刻立、出土和收藏处所。以国家、省市自治区、县、乡、处所名称顺序著录。

语种项:拓片资源内容文字的语种。如汉、满、蒙、藏文、契丹、西夏文、阿拉伯文、英文、法文等。

版本项:因金石刻制、捶拓不同而产生的不同特征的拓片类型。版本特征如:捶拓时间、技法、色托、出版地、出版者、版次等。例:《陆亘墓志》,墨拓,初拓,1998年3月15日拓。

拓本形态项:拓片资源的外观形态。著录拓片的保存形式、托裱装订、数量、尺寸、附件等。

书法特征项:著录拓片文字的书体、书写特征、原器物铭文行款、存字数量等信息。除书体外,其他内容可选择著录。例:志正书,34行,行36字,志盖篆书,5行,行6字。

文献记载项:著录关于该墓志已有文献的记载情况:①其他文献中收录该墓志的情况记载;②关于墓主的生平事迹、祖系亲属以及撰文者、书丹者、篆盖者等的史料记载,如《屈突通墓志》:《千唐志斋藏志》上册9页有载;屈突通,两唐书中均有传。

附注项:对拓片资源内容的描述及对各著录项目的补充说明。包括金石附注、拓片附注、丛编、子目、提要、录文、著录文献等。

收藏历史:拓片流传历史及本馆获得方式的描述。包括拓片来源、购买价格、收藏沿革、题跋印记等。

关键词项:对揭示资源内容能起到关键作用的词汇。

权限项:拓片本身所有的或被赋予的权限信息。权限管理一般包括知识产权、版权等。这里主要指拓片的服务范围,如:限馆内阅览。

通过上述项目的著录,拓片的主要特征即可在目录中得以充分揭示,以便排架管理和读者检索利用。

3 拓片数字图像的建库与网络

3.1拓片图像数据的获取与预处理

・先期处理阶段:为保护珍贵拓片不至于在数字化过程中受损,加工对象必须在扫描或数码拍照前经过托裱或平整处理。

・获取设备与加工方式。设备:高精度专业数码相机和专业扫描仪等;加工方式:直接用数码相机或高精度专业相机加大型数字后背对原件进行扫描;或先用专业相机对原件进行传统拍摄,然后再用专业胶片扫描仪或高精度专业相机加大型数字后背对该胶片进行数字扫描。拓片在拍摄时对光线的要求很严格、讲究,光照要均匀、明亮,本身或周围环境不能有反光物体和其他干扰光线,要采用冷光源,不得使用卤素灯、荧光灯、水银灯、镁光灯。

・对格式、分辨率、压缩比的要求:①典藏级文件:文本格式TIFF,分辨率600DPI以上,不压缩存档;用途:出版印刷,不上网。可做格式转换和复制的母本。②复制加工级文件:由保存级TIFF文件1:1转换生成,文本格式JPEG/JFIF/PNG,分辨率300DPI,轻度压缩;用途:加工复制各种精度、大小的屏幕浏览图像的母本文件。③网上浏览级文件:因用途和使用对象不同可分为以下3级:大浏览级,以JPEG/JFIF/PNG

格式保存,分辨率200DPI,中度压缩,屏显尺寸相对较大。中浏览级:以JPEG/JFIF/PNG格式保存,分辨率150―100DPI,高度压缩。通常以屏幕显示尺寸为度;小浏览级:以256色的GIF或高度压缩的JPEG格式保存缩略图,分辨率72DPI,文件在20K以下。

・拓片图像文件的保存:①图书馆存储系统中,每个目录包含一个收藏识别号和一个描述图像的数字化对象识别号。两个识别号一起用于恢复系统中,从服务器存储的图像中取出相应图像。②数据存储写入DVD光盘。每一张光盘有唯一识别标签(按照光盘命名规则)。③按照收藏种类,建立目录结构,存储图像文件,如拓片目录:RUB/YUAN/2003/MUZ/A/,其路径名详解如下:RUB――拓片、YUAN――原拓、2003――2003年加工、MUZ――墓志、A―典藏级。④给拓片图像文件命名,同一资源生成不同类型的图像,每类图像中的每张图像文件名都有一个数字资源的唯一识别号。

3.2关于数据库的构建平台

・选择建库平台应遵循以下原则:①先进性:采用先进成熟的技术开发与建设;②标准化:遵守相关标准,如国际标准、国家标准、业界标准和CALIS标准等;③开放性:提供完整的权限控制机制和版权保持技术;④易用性:系统功能规范,界面友好、维护简单;⑤可扩展性:提供系统对数据的迁移和对应用的扩展功能。

・建库平台应具备的基本功能:①对象数据加工:包括纸本资源加工和电子资源加工。专用的电子书制作工具、OCR识别与编辑、电子资源的导人与格式转换等。②元数据标引:系统能够预置元数据模版;可根据特色库规范注册新的元数据格式和进行元数据格式转换。③保存和输出:系统应有审校功能,可按文献类型分库保存元数据。可选择导入导出格式,具有批量导出功能。④统计与检索:可对用户著录进行统计;提供基本检索、高级检索、二次检索。⑤信息:提供模板和自建模板。⑥管理及维护功能:具有系统管理员、建库人员和用户分级权限及数据库用户IP段、用户名、密码设置管理、自动或定制的数据备份、安全管理等。

3.3拓片数据库元数据方案设计

数据库元数据方案设计是数据标引的关键,是数据库建设的核心部分。使用当前具有权威的元数据规范标准是保障数据库质量与实现资源共享的前提。

3.3.1元数据结构分析 一般情况下,各类型资源对象描述元数据的基本框架都可由核心元素,资源类型核心元素和个别元素三部分组成。核心元素在各类资源对象中通用。在元数据的通用性方面,DC(Dublin Core)是最能满足通用性的元数据。CALIS“拓片描述元数据规范”核心元素复用DC的15个基本元素,支持通用的检索工具。资源类型核心元素根据资源对象特点、参照其他元数据标准制定,在同一类型资源对象中通用。个别元素以某种特定的资源对象为基础制定,仅适用于这类对象,不用于交换。应用时仅要求该种对象遵守其定义。

3.3.2元素组成的规则

――核心元素集复用DC的15个元素做为核心元素集,其复用原则:①采用“简单DC”(Simple DC),不推荐使用“限制性DC”(Qualified DC),即,当元素本身具备很强的专指性和完整的描述性时,可以不必扩展修饰词,这样,元数据规范也可以不受日趋复杂的限制性DC的修饰词体系的局限;②严格遵守DC的元素语义定义,核心元素集中元素的语义不允许有交叉;③核心元素并非必备元素,具体应用时允许只复用其中一部分;④允许复用“限制性DC”中的修饰词(Quali-fied),必须说明并严格遵守其语义定义;⑤允许复用时根据资源情况重新命名元素和修饰词。

――资源类型核心元素集:①在制定不同类型和不同资源的元数据标准时,可以根据资源对象共同特点,制定各自所需资源类型核心元素或修饰词,或者从其他元数据标准中复用元素或修饰词;②在制定此类元素或扩展修饰词时,必须保持与已经采用的核心元素在语义上没有交叉,如果是从其他元数据标准中引用,必须在命名域(Namespace)说明并严格遵守其语义定义;③“DC图书馆应用大纲”中的三个元素(Edition,Location,Audience)在描述文献资源时具有较强的通用性,需要时作为资源类型核心元素。

――个别元素集:此类元素为某资源对象所特有,只应用于该资源对象,一般需自定义,制定的规则与资源类型核心元素相同。

――与DC的映射:考虑到数据交换和检索的需要,所制定的元数据标准应与DC建立映射关系:①映射单位可以是元素,也可以是修饰词;②可以建立的映射关系有:一对一、一对多、多对一;③如有不能映射到DC的元素或修饰词,则无须强行建立映射。

依据“拓片描述性元数据规范极其著录规则”制定拓片元数据方案如表1:

3.4标引建库:元数据模板和标引字段的制订

多数图书馆不可能象国家图书馆或北京大学图书馆那样拥有一定规模的拓片馆藏而建立独立的拓片数据库,大多将拓片数据库作为馆藏数据库的一个子库来建。那么各子库间由于文献资源类型的不同,在文献标引时采用的元数据模板和标引字段也不同。例如,河洛文化文献数据库子库分类是依据河洛文化文献的内涵进行划分的,拓片文献被列入“河洛风土、金石信息”子库下的“河洛碑志拓片”和“洛阳师范学院馆藏拓片及志石”数据库中。这样划分的目的在于方便文献知识的组织与管理,便于分类和导航。但是,文献在标引建库时是依据文献资源类型的元数据字段进行标引的,如果按照数据库子库分类结构去建立元数据标引字段,由于同一个子库的文献可能包含多种文献类型,如河洛风土、金石信息子库包括金石拓片、古迹、器物、服装等文献类型;因而,在一个子库里,数个文献类型的元数据字段合在一起,模板标引字段就过长,标引时易造成效率低、错误多;而在一个子库里若按文献种类建立多个元数据模板,又势必同其他子库相同文献种类的元数据模板重复,易造成标引混乱。因此,在对资源数据进行标引时,应摒弃数据库子库概念的束缚,按照不同文献种类元数据建立不同的元数据标引模板,再按不同元数据模板分配相应的数据项目,进行标引分类,对于子库与子库间内涵相关的文献建立超链即可。实践证明这样做有以下优点:①可完全依照CALIS的元数据规范建立标引字段,保证了建库工作的规范化;②可使标引字段简明清晰,避免标引字段冗长,提高标引效率;③有利于标引任务的分配和管理;④有利于数据库的修改与扩展。

3.5网络

科学、合理、富有特色的页面和专题导航类目的设立直接关系到数据库的使用效率。数据库信息是利用系统的“向导”进行模板设计的:

・首先选择要的数据库,选定“数据库”菜单命令和适合内容的模板。

・定制字段。在模板中分别设置概览字段和细览字段作为数据库检索字段。设置时可将文献元数据的全部字段引入库字段表中,根据要求,在编辑字段工具栏中设置必备字段和可选字段。由于特色库拓片的元素名称项加上相应的元素修饰词,著录字段过多。为简捷起见,概览区字段只设置“题名”、“主要责任者”、“金石年代”、“馆藏信息”即可。细览字段可相对详细些,选择“题名”、“关键词”、“语种”、“主要责任者”、“其他责任者”、“金石年代”、“金石所在地”、“版刻与版本”、“书法特征”、“权限管理”、“收藏历史”等。

・配置检索选项。分为分类检索和字段检索两种:①分类检索是根据字段分类信息,从分类导航树上检索出符合某一分类的文献。导航类目为读者提供了多种检索途径,系统自带中图法分类导航树,也可根据需要建立其他分类导航树。在选定分类体系的基础上,系统自动生成导航树,只要将记录拖动到相应的结点,系统就可记录下对应的分类号,建立导航检索。②字段检索则是按字段信息进行的检索,分专项检索和组合检索。专项检索对某一特定的字段检索,组合检索可使用户利用多种运算符构造的检索式(如:比较运算符、逻辑运算符、属性运算符、限定运算符和加权运算符等)进行检索。

・为页面各部分背景、字段及字段内容颜色、字体大小、粗、斜体进行选择设计。

当完成以上设置,确认信息正确无误后,开始Web。

上一篇:面向Web3.0的分众分类研究 下一篇:3G网络技术在图书馆服务领域的扩展应用研究