基于NoteExpress构建机构知识库初探

时间:2022-07-15 11:52:32

基于NoteExpress构建机构知识库初探

摘要:机构知识库是大学或研究机构通过网络来收集、保存、管理、检索和利用其学术资源的数据库,它具有知识保存、电子出版、知识管理、学术传播、科研评价等功能。本文尝试以NoteExpress为工具自国内外主要数据库中采集数据导入Dspace平台构建机构知识库,并对数据合并、剔重等问题提出针对性解决方案。

关键词:机构知识库 NoteExpress 知识存储

中图分类号:G250.76 文献标识码:A 文章编号:1672-3791(2012)08(a)-0016-02

机构知识库(Institutional、Repository,简称IR)是大学或研究机构通过网络来收集、保存、管理、检索和利用其学术资源的数据库。机构知识库作为新型学术交流方式和数字资源长期保存的模式,有助于提高科研成果的快速传播和共享的效率,将有力地促进科学研究的交流和发展,因而受到越来越多的机构的重视[1]。

1 机构知识库的作用与意义

机构知识库作为一个大学或研究机构内部的知识和信息存储与利用的枢纽,其主要功能有以下几点。

1.1 知识保存

机构知识库为大学或研究机构的知识、信息提供一个长期保存的安全场所,从而将散落于各部门或者研究者个人信息存储终端中的信息归集保存,回避了个人分散保存信息的弊端和风险。通过长期的积累,机构知识库必将成为一个大学或研究机构的知识宝库。

1.2 电子出版

机构知识库将各种不同类型的知识和信息内容撷取,按照统一的格式(如PDF),因而具有电子出版(ePublishing)的功能。通过机构知识库,可以将原先无法进入正式出版途径的大量知识信息得以交流。

1.3 知识管理

通过机构知识库的集中式数字对象管理和相互链接,存储其中的信息和知识可方便、快捷、高效地为用户所利用。

1.4 学术传播

机构知识库的目标并不是取代学术出版,至少目前看起来还不成熟,它的价值在于将原来不作为正式出版的各种知识、信息如实验中期数据、操作(手术)视频等灰色文献通过网络,而且具有知识信息集成的功能。

1.5 促进教育

大学或科研机构的师生可以利用机构知识库丰富的教学信息资源,提高教学效果。学生可通过机构知识库的各类课件进行自主学习、作业和考试,教师可通过机构知识库交流、完善教学课件和教学方法,科研人员可通过机构知识库进行继续教育和进修提高。

1.6 科研评价

机构知识库可作为对教师和研究人员科研活动的评价工具,可以使大学或研究机构方便地了解他们的研究成果。

1.7 共享利用

机构知识库是学术资源开放利用的重要工具。不同的大学和研究机构,通过建立共享利用机制,在权利义务平衡的前提下,相互开放学术资源,对于加强校际之间的学术交流、降低学术信息利用成本具有非常重要的作用。

1.8 提高声望

机构知识库是对外进行学术交流的重要窗口,可以展示一个大学或研究机构的学术成果,提高论著的被引用率,扩大在学术界的影响力。通过构建机构知识库,图书馆可进一步发挥在学术传播、信息存储和知识服务中的作用,提升图书馆在大学和研究机构中的学术地位。

2 机构知识库数据源的选择

2.1 目标文献形式

机构知识库保存、管理与利用的数字化内容包括:研究人员和教师已被学术期刊录用但未发表的论文预印本、已、技术报告、科研进展报告、硕博士论文、图书或其章节、科研数据库、会议录、教学资料或课件、计算机软件、其他灰色文献等等[2]。上述数字化内容可以文本、图像、音频、视频等不同格式在机构知识库系统中保存与利用。

2.2 数据源的选择

作者通过反复数次模拟实验、调查研究发现本校师生的科研成果以国内外公开发行的期刊论文、会议论文、学位论文为主,而且其所发表的期刊论文在国内CNKI、万方数据、维普资讯、CBM,或者外文商业数据库如Pubmed、SCI、ISTP、EI、INSPEC、IEEE/IETEl 、ElsevierSD其中至少一个中能检索到,故以以上中外文数据库为元数据源进行数据采集。考虑到图像、音频、视频数据的采集、收割、提交涉及更加复杂繁琐的操作,本次初步实践探索仅针对本校教师历年来在公开期刊中发表的论文进行收集、整理。

3 机构知识库平台的选择

DSpace是一个免费的开放源码的机构知识库构建软件,由MIT和惠普公司联合开发,具有很强的灵活性和可定制性。目前,DSpace联盟的许多成员使用该软件构建了本机构的机构知识库,如M1T、Cambridge、Columbia等大学。DSpace的设计原则是易于使用,它具有基于Web的用户界面,这个界面可以为特定机构或个别的院系定制[3]。

南安普顿大学开发的Eprint,其缺省配置是构建机构知识库,具有高度的可定制性;BerkeleyPress开发的Electronic Bepress,亦具有很强的灵活性,可以对用户的工作流和站点的设计进行定制。

此次实践探索的选择。目前国内外采用最多的平台是Dspace,并且国内各高校、科研院所已建机构知识库全部采用Dspace平台,它具有提交收据方便、界面简洁友好、检索效率高、可自由扩展、开放源代码、免费使用等优势,所以我校机构知识库亦选用此平台,同时利于今后各机构知识库联盟间知识的传播与共享。

4 元数据收割及工具选择

由于机构数据库的元数据非常庞大,仅仅以一所普通高等院校历年在国内外期刊所计算均在1万篇以上,如果加上会议论文、学位论文以及灰色文献等其规模是非常可观的,如果仅仅靠人工到各数据库下载采集信息的话是非常费时、费力的工作,可以预见单纯的人工采集方式已难于胜任繁重的元数据建立工作。为了保证元数据的正确性和效率,必须采取一种自动处理元数据的技术。

上一篇:浅析当前建筑施工中存在的问题及对策 下一篇:高职院校校园一卡通系统的规划与设计