中医药古籍特色数据库构建研究

时间:2022-05-20 10:15:30

中医药古籍特色数据库构建研究

[摘要] 本文从建设中医药古籍数据库的重要意义、时代背景和前提条件出发,列表分析了天津中医药大学图书馆馆藏中医药古籍的分布状况,进而确立了中医药古籍数据库建设的预期目标,并深入探讨和研究了中医药古籍数据库建设的基本过程和方法。

[关键词] 中医药;古籍;数据库;构建

[中图分类号]G250.2[文献标识码]B [文章编号]1673-7210(2007)10(b)-117-03

自古以来,中医思想理论体系就一直指导着中医临床实践,同时也在临床实践中不断充实、发展,二者相互促进、积累、沉淀,形成了独特的理论体系和丰富的实践内容。中医药古籍蕴藏着数千年来中医药学对预防、治疗、保健等方面的知识,是我国各族人民在生产、生活以及与疾病作斗争的实践总结,有独特的理论体系和丰富的内容[1]。所以,构建中医药古籍特色数据库,是为了更好地开发和利用中医药古籍,古为今用,不断提高中医临床治疗水平,更好地为人民健康服务。

1 中医药古籍数据库建设的背景和条件

20世纪80年代初,我国就开始了古籍数据库的建设。它始于南京图书馆、浙江图书馆等省级大型图书馆。而中医药古籍特色数据库目前在我国尚不多见,其构建工作相对比较滞后,有待于我们深入研究、探讨。

古籍数据库建设是古籍数字化建设的一种方式,是利用现代信息技术对中医药的古籍文献进行加工、处理,按统一标准、格式将文献转化为计算机可识别的形式,制成古籍文献书目数据库和全文数据库[2]。 这项工作需要我们具备以下技术条件:

1.1 缩微技术和数字化技术

数字化技术就是利用现代高科技产品对各种信息进行数码化的处理,基本设备有扫描仪、数码相机等。这些设备与传统老式的缩微设备相比,具有效率高、速度快、保持原貌、成本低等特点。

1.2 数据库建设的硬件和软件需求

目前,市场上的主流配置计算机都可以满足数据库建设的基本要求。笔者建议主机的配置最好不低于以下要求:CPU选择P43.0以上;内存512M以上;硬盘180G以上。扫描仪最好选择高速扫描仪,笔者推荐用紫光F16。关于软件配备方面,笔者推荐比较专业化的“书同文数码翰林”。

2 中医药古籍数据库建设的预期目标和成果

中医古籍数字化,就是利用数字化技术将中医古籍进行扫描、文字识别与转换或录入,并经专门软件使之结构化,制作出新的电子版中医古籍。数字化的中医古籍可用计算机进行方便的检索与阅读,也可在网络上传输、共享[3]。

2.1 我馆中医药古籍馆藏分布状况(表1)

2.2 对我馆中医药古籍馆藏分布状况的分析

2.2.1 在馆藏中医药古籍中,临症综合性丛书、方剂方书和丛书全书所占比例较大,占总种类的百分比均超过10%;而金匮、五官科、针灸推拿和养生类所占的比例很小,占总种类的百分比均不足3%,而其中针灸推拿、养生类具有很重要的临床利用价值。

2.2.2 从藏书册数来看,丛书、全书一类古籍册数占总册数的26.52%,远远高于其他17类古籍的馆藏数量。医经、中医基础、金匮等类的馆藏册数所占总册数的百分比均在10%以下。

2.2.3 在总计1 685种中医药古籍中,只有2种古籍目前已被开发利用,利用率仅0.12% 。

2.2.4 在18类中医古籍中,临症综合性医书的临床价值很大,占总种类比例也很大,达到10.62%,可是179种此类古籍中,只有1种目前已被开发、利用,其利用率仅0.56%。2.3 中医药古籍数据库建设的预期目标

2.3.1 我们应注重在馆藏中所占种类比例较少的金匮、五官科、针灸推拿和养生类古籍在数据库中的构建,要特别注重补充其种类上的不足。

2.3.2 丛书、全书往往涵盖不同的中医古籍分类。需要我们建库人员对其分类,以提高其科研、临床利用价值。

2.3.3 目前只有2种古籍已被开发、利用,说明我馆中医药古籍基本上处于未被开发、利用的状态,有待于我们进一步去开发、利用。另一方面,也说明我们有丰富的馆藏资源尚未被开发,可开发空间极大,如同一个未被发掘的宝库。

2.3.4 “藏以致用”,中医药古籍的开发首先应服务于中医临床工作,所以我们应不断加大对临床综合性医书的开发、利用程度,使其有力的推动中医临床水平提高,更好地为人民健康服务。

3 中医药古籍数据库建设的基本过程和方法

3.1 建设中医药古籍数据库所需的人力、物力条件

3.1.1 获取国家立项支持是开展中医古籍数据库建设工作的最有力保障。对于我馆现在的状况来说,只有获得国家和有关部门的重视,我们的工作才可以长期稳定的坚持下去,因此,我们必须要加大宣传力度,争取到部级科研经费的支持。

3.1.2 成立领导小组,统一规划,协调合作。就我馆现在的人员梯队来说,应当有负责人调动全馆的编目人员、计算机人员、历史专业人员,团结协作,按流程统一进行。

3.1.3 中医药古籍数据库建设不仅要求建库人员具有一定的目录学、版本学、文献学以及医古文知识,而且还要熟练掌握相关的计算机技术。因此,我们要针对参加建库人员的不同情况,采取多类型、多层次、多途径的岗位培训和继续教育。另外,在实际工作中,我们还要合理利用人力资源,新老搭配、优势互补,形成一个人才梯队,共同提高,为中医药古籍数据库的建设尽各自的力量。

3.2 建设中医药古籍数据库的技术条件

3.2.1 选择、确定中医药古籍分类法目前,虽然中医古籍分类的专业化和细化程度不断提高,但是从图书分类法的角度来看,现有的中医古籍分类法存在着明显不足,即重藏轻用,检索功能薄弱[4]。所以,我们要根据医学院校图书馆的性质,以《四库法》为基础,同时参考1991年《全国中医图书联合目录》的12种大的分类,制定出适合于我们的中医古籍分类法。这是我们做好中医药古籍数据库构建工作的最基本的前提条件。

3.2.2 统一格式、统一标准、以点带面、共建共享目前,CNMARC是中国图书数据著录的权威标准,我们可以以其为基本标准,同时参考《古籍著录规则》中古籍著录项目及排列顺序、著录用标识符号等专门的术语和特殊的著录方法。统一我们建设中医药古籍数据库的标准和格式,真正实现数据库的以点带面、共建、共享。

3.3 建设中医药古籍数据库的流程

3.3.1 通过对表1的分析、研究,我们已经发现对临床综合性医书等几大类古籍的开发、利用程度较低,但是这几类中医古籍的临床利用价值很高,所以在开始建库时,我们将以上几类中医古籍作为构建中医药古籍数据库的首选内容。

3.3.2 众所周知,古籍数字化的工作是一项劳动量巨大的基础性工作。目前,最为省时省力的输入方法是扫描输入法。根据我馆实际情况,我们选择古籍文献原件直接扫描法作为我们扫描中医药古籍的方式。

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

3.3.3 对扫描所得的原始图文数据进行版面分析、去污和特征抽取。具体流程是:将扫描所得的原始图文数据划分为不同的区域块,识别不同的区域范围;逐个对图像、汉字进行去污处理,消除图像中的噪声干扰和汉字笔划上的毛刺,大幅度提高文字和图像识别的准确率;然后再对预处理后的文字和图像抽取其数据特征,为以后的进一步校对做好准备。 3.3.4 我馆选择“书同文数码翰林”作为对中医药古籍实施数字化加工的软件工具。在操作程序上,“书同文数码翰林”首先对扫描的文字图像进行自动切分,并可从可能切分错误的字和漏切的字两个方面进行检查。完成数字化工程前期对实体资源信息实施数字化加工,并通过软件来辅助和管理人工校对,用 XML 置以标识,使实体资源底层数据实现数字化,从页面影像信息转换成文字信息。

3.3.5 我们将用 XML 置以标识、校对后的中医古籍电子数据导入数据转换器进行计算和处理。数据转换器DataImporter支持多种数据库之间的数据抽取、转换、装载。它具有强大的表达式计算功能,可以在表达式解释器中,对数据源进行计算处理,同时还能可视化地生成SQL语句。

3.3.6 当今网络技术快速发展,进一步增加了电子资源的种类,不断地充实着图书馆的馆藏。各医科院校图书馆已经收集了不少电子资源,为读者提供有关的服务。如何整理这些电子资源,是我们当前编目人员必须解决的问题。对于建设中医药古籍数据库来讲,我们要定期更新中医古籍电子数据,远端存取,省略其版本叙述,仅于附注项予以说明。然后将经过校对处理后的书同文图像电子、书同文图文电子与电子编目链接后在系统服务器上。

3.3.7 在系统服务器上建立书同文检索引擎。

3.3.8 读者用书同文浏览器浏览自己所需要的中医药古籍。 4 中医药古籍数据库的网络化

当今,网络技术和数字技术飞速发展,不仅影响到中医药古籍数据库构建的各个环节,而且可以在很大程度上简化了建设中医药古籍数据库的流程。这势必引起中医药古籍数据库发展、建设的重大变革,首先是中医药古籍数据库开发、利用方式的变革;其次是中医药古籍数据库构建方式的变革。这两大变革将使得广大中医院校师生和科研人员能够更直接、更方便地获取自己所需的中医药古籍文献。

建设中医药古籍数据库是发展我国中医药事业中最具特色的部分,也是最不可或缺的部分。它不但能认识和处理好传统中医文化继承、发扬的辩证关系,稳定中医古籍研究队伍,加大对中医古籍研究、开发的力度,促进这项研究多出人才、多出成果,还能进一步指导中医临床在短时间内辩证施治,达到事半功倍的疗效,使古老的中医药文化为构建我国社会主义和谐社会和提高人民健康水平做出其应有的贡献。

[参考文献]

[1]唐丹.中医药古籍数据库建设概述[J].医学信息,2006,9(19):1559-1561. [2]张云.馆藏中医药古籍特色数据库的构建[J].中华医学图书情报杂志,2005,6(14):29-30.

[3]刘国正,李斌,孙一星.中医古籍数字化研究[J].中国中医药信息杂志,2004,6(11):563-564.

[4]裴丽,常存库.中医古籍文献资源的信息构建[J].中医药学报,2006,2(34):3-5.

(收稿日期:2007-08-14)

“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文”

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

上一篇:“八荣八耻”是卫生事业发展的基石 下一篇:消毒供应室无菌物品的应急供应