民国地方文献报纸数字化探索与实践

时间:2022-04-12 02:44:07

民国地方文献报纸数字化探索与实践

关键词:地方文献;民国文献;报纸;数字化;数字资源建设

摘要:民国报纸在长期积累中形成完整系统的地方史料,已成为地方文献近代资料专藏的主体之一。但是随着时代的变迁,很多民国报刊都面临着遗失或是损坏的危险,从保护历史文化、抢救珍贵文献的角度来看,民国报刊的数字化有着十分重要而紧迫的意义。文章以作者实际经验阐述图书馆应如何进行民国报纸数字化工作,并针对民国报纸数字化资源在地方文献工作中的作用提出个人的认识。

中图分类号:G250.7文献标识码:A文章编号:1003-1588(2016)12-0098-03

1民国报纸在地方文献中的重要地位及数字化的意义

报纸是地方文献专藏建设中不可或缺的类型之一,包括地方上出版的综合性报纸及内容上具有地域特征的专业性报纸。由于具有涵盖内容广泛,出版周期短,信息报导及时等特点,使得报纸的情报性极强。民国报纸作为地方文献中近代资料的重要一环,以当时人报道当时事物,在内容上相对客观、准确。随着连续性的出版,民国报纸在长期积累中形成完整系统的地方史料,已成为地方文献近代资料专藏的主体之一。随着时代的变迁,很多民国报刊都面临着遗失或是损坏的危险,从保护历史文化、抢救珍贵文献的角度来看,民国报刊的数字化有着十分重要而紧迫的意义。

2国内图书馆民国报纸资源建设及服务现状

目前,国内图书馆对民国报纸的数字资源建设大体分为:外购商业数据库和自建数据库两种。从单一品种的资源完整性和用户体验角度看,商业数据库明显优于自建数据库。但自建数据库也有其优势,主要体现在对资源的选取上。自建数据库一般以地方资源建设为方向,因而有其独特性。

笔者选取国家图书馆、北京大学图书馆以及首都图书馆、上海图书馆四家图书馆,从数字化报刊品种、资源数量以及服务方式等方面看民国报纸资源建设现状(见表1)。

在对以上数据进行采集时,笔者发现当前图书馆报刊数字资源以期刊为主,报纸资源在品种上所占比例较小。从服务方式上看,能够提供跨地域免费公开信息的图书馆比例较小。而两个省馆所建设的报纸资源均为在当地创刊、发行的报纸,属地方文献范畴。

3地方文献民国报纸数字化建设实践

3.1加工品种选取并调研

本阶段需要依照一定的原则或需求选取报纸加工品种,并对选取品种的现有纸质破损情况、印刷清晰度情况、内容的信息价值情况及连续性情况有基本的了解,就选取原则而言具备以下情况者优先选择:①年代为清末民初的且只以纸质载体形态保存的品种宜最先选取。民国时期老报纸保存期限较短,受到空气中有害物质及湿度等环境因素的影响,加之读者的反复翻阅,年代越久远的越不容易保存。②具有地域特征的专业性报纸品种优先考虑。该类报纸一般不易被其他地域外机构所关注,因而降低重复建设的概率。③馆藏文献内容完整性强的品种优先考虑。图书馆文献数字化脱离不开坚实的馆藏建设。报纸作为连续出版物,馆藏收录的完整与否决定了品种的收藏质量,零散或缺失严重的报纸种类一般不会优选选取,除非具有极高的珍稀性。

在确定对某种报纸进行数字化加工后,还要对报纸的不同载体版本进行选择。报纸的文献载体形态有纸质和缩微胶片两种。目前国外的一些图书馆数字化项目,如:澳大利亚国家图书馆的报纸信息化项目采用缩微胶片进行数字化制作,原因是缩微复制比原报扫描要快速且价格低廉。但从实际数字化后的图像质量来看,缩微复制差于原报扫描,这种情况在原件印刷质量较差的文献上表现得尤为明显。因此,对于加工文献载体类型的选取上,笔者建议在纸质报刊形态较完好的情况下遵循纸质文献即原始形态优先的原则。

3.2加工标准制定并扫描

所制定的加工标准应包括:文件扫描标准、唯一标识符标注规则和存储规则。以上标准规范均是在加工过程中必须要参照的,因此在扫描前要将标准和规则制定完备。

3.2.1文件扫描标准。根据中华人民共和国文化部的行业标准《WH/T46-2012图像数据加工规范》要求,报纸数字化扫描标准具体内容见表2。考虑到数据质量以及未来灵活转换,笔者建议存档文件选取色彩为24位彩色。

3.2.2唯一标识符标注规则。对象数据的唯一标识可以理解为扫描图像或元数据文件定义的名称。清晰的唯一标识体系能够使资源管理者仅通过文件名称便可了解数据对应的纸质文献信息,从而节省了大量数据查找时间。唯一标识符一般为数字型,包括资源信息和数据序列两部分,如报纸品种代码+出版时间+版号+其他辅助信息。

3.2.3存储规则。文献加工前需制定统一的存储规则,以便于加工数据的管理。报纸数据一般按照报纸品种、数据格式、对象数据文件三级顺序进行存储。数据存储时应将加工过程中的说明文件一并存入。

3.2.4元数据设计并著录。元数据是数字资源需求分析和系统设计时需要首先考虑的因素,是数据加工制作和系统设计与功能实现的基础。元数据方案决定了系统的整个架构以及系统设计的需求,设计时必须详尽地考虑和满足资源管理、保存、揭示、检索、利用等各方面需求。这里所设计的元数据并非将报纸作为一种文献载体进行揭示,而是将报纸的内容作为可查阅、检索的信息载体而进行描述。

根据文献加工深度不同,报纸元数据的设计一般分为三个层级:版次级、篇目级和全文级。版次级元数据一般所具有的元素详见表3。篇目级元数据可分为以版为单位设计的元数据和以单篇文章为单位设计的元数据,后者较于前者灵活性更强,因此,篇目级元数据一般以文章为单位进行描述。全文级元数据可视为文献内容信息揭示的最高级,为文献检索提供最便利的条件。在元素设定上一般是在篇目级元数据设计基础上加上全文字段,标注时注意关联资源和全文部分要相互对应即可,篇目级元数据所具有的元素详见表4。

4民国报纸中地方信息选取

在进行篇目一级元数据制作时,图书馆地方文献工作者对于是否进行民国报纸资源中地方信息的专门性提取存在两种态度:一种认为应该进行提取,理由是希望在选取过程中排除报纸里与地方资料无关的信息,从而建立地方文献精粹资源。但在信息选取过程中势必会受到选取人员对地方信息了解程度、知识层次深浅的影响,造成收录不全面的现象。而不认为有提取必要的人觉得全盘元数据制作可以不受人员限制,最大限度地避免资源的缺失,同时还可以保留报纸数字化品种在内容上的完整性。但是这样也确实造成大量与地方无关数据的产生,并加大了资金的投入。两种选取方式各有利弊,因此在做资源建设时需根据自身情况加以考虑。

在收录范围上有关本地区过去的、现在的、人文的、自然的有文献使用价值的资料均应在选择范围之内。其中自然地理的资料选择宜宽。如:跨区域的河流、山脉;在体裁方面包括新闻报道、时评社论、纪事调查、杂文、文学(诗词、小说)等。关于军政事件、政治运动资料的选择:一般以本地区发生的军政事件、政治运动为主要选择对象。关于国际交流资料的选择:本地区各种代表团、机构及知名人士在外地(包括国外)的活动资料应详尽选择,这类资料大多可反映本地区的经济发展水平,在全国或国际上的影响以及区域间、国际间经济交流的状况。关于文化交流资料的选择:本地区文化团体在外地(包括在国外)举办或参加的各项展览、演出、体育比赛等活动资料,均应列入地方文献,在本地区举办的各种上述活动也应予以收集。关于各种学术会议资料的选择:中央召集的各种全国性会议,凡涉及本地区或有本地区代表参加的各项活动、言论等资料;本地区举办的,有一定学术价值和史料价值的会议资料亦应选择。关于人物界限的选择:不论籍贯、居住时间长短,反对地方历史形成影响力,且不论好坏的人士均可收录。

5民国报纸数字资源在地方文献工作中的服务

5.1为地方参考咨询工作的检索提供极大便利

在以往的参考咨询工作中,当咨询人员面对浩如烟海的报纸资源进行信息查找时会望而却步。基于此种原因,首都图书馆在70年代开展了《北京报刊资料索引》的制作工作,尽管当时因条件制约只能制作索引目录,却也为咨询工作带来极大的便利。如今,随着数字成像技术的发展,通过计算机扫描的报纸影像数据已经完全可以替代纸质报纸,通过一系列检索机制能够快速查找资源,并按需获取必要的电子文献。如:首都图书馆北京地方文献中心在为用户进行《北京地区道教遗迹资料》《欧美同学会・中国留学人员联谊会历史文化资料汇编》《国子监、孔庙清末、民国年间相关资料查询》等课题咨询时,曾大量使用首都图书馆数字化加工的《益世报》《京报》等报纸资源,在对内容检索之后可以直接调取电子文件或对其进行纸质复制,这与图书馆传统剪报服务相比大大提高了咨询工作的效率,同时也避免了因多次翻阅、裁剪或静电复印而给旧报带来的伤害。

5.2是建设地方特色专题数据库的有力文献支撑

建设并利用好民国报纸数字资源,不但可以为地方文献的参考咨询工作带来益处,同时也为图书馆特色资源专题数据库建设提供有力支撑。特色资源一般指地域性较强的资源或某一专业领域的资源。报纸具有信息量大、报道及时、信息连续、出版周期快等特点,使它在信息内容的广泛性、新颖性以及时效性方面远远优于一般书刊资料。面对这样一种文献,无论是在内容上汲取专题性资源进行整合或是以地域为限定将报纸资源品种进行综合性分类展示,都将是特色数字资源建设的一笔重彩。

5.3为地方文献的复制再版提供可能

在数字资源铺天盖地的今天,图书馆员在实际工作中发现目前纸质文献的阅读需求依然远远大于电子形式的文献。民国报纸限于当时造纸材料和制作工艺等原因,时至今日很多已难以保存和修复,导致其使用价值的流失。而报纸作为记录人类文明活动和人类思想的重要文献载体,如果因其原始形态的消融而使内容信息丢失实属可惜。为此,首都图书馆做了相关工作,如对《戏剧旬刊》《剧学月刊》等民国刊物进行了再版。尽管再版的这些不是报纸,但却能让我们对行将消失的民国报纸文献的重生看到了希望。

6结语

民国时期的报纸对于研究当时的历史、人文风物具有极其重要的参考价值。曾经有位读者感慨自己在图书馆阅读一年的民国报纸胜过之前十年的图书文献研究。由此可见,报纸作为图书馆文献专藏的主体之一,其文献史料涵盖广泛,内容的丰富是其他文献资源所无法比拟的。地方信息现已被广泛利用和重视,地方文献的数字化工作不仅有助于民国文献内容的保存及利用,同时还将跨越时间和地域的限制,将地方文化远播至世界各地。

参考文献:

[1]王玲丽.民国报刊文献数字化建设探究[J].信息技术与信息化,2015(2):235-238.

[2]周崇润.谈谈图书馆纸质文献的酸化与脱酸[J].图书馆界,2004(4):55-56.

[3]钱承军.高校图书馆应重视对民国文献的保护与利用[J].山东图书馆学刊,2008(1):76.

[4]郭伟德.民国文献数字化是文化遗产的保存和延续[J].四川图书馆学报,2009(6):32-33.

[5]张丁,王兆辉.试论民国文献的数字化建设[J].数字与缩微影像,2011(1):22-23.

(编校:崔萌)

上一篇:逆境中的商业银行转型创新 下一篇:Do You Like the Delicious Hamburger