中外文资源发现系统的比较分析

时间:2022-09-08 07:25:49

中外文资源发现系统的比较分析

摘 要 资源发现系统打破了图书馆各种资源的载体限制,实现了所有资源的一站式检索,成为业界主流的资源整合服务平台,国内外陆续出现了Summon、EDS、Primo、超星发现、维普智立方等系统。论文从元数据数量、元数据质量、系统架构与检索功能四个方面对中外文五种发现系统进行比较研究,为图书馆引进资源发现系统提供建议。

关键词 资源发现系统 外文资源发现 中文资源发现

分类号 G254.97

DOI 10.16810/ki.1672-514x.2016.02.020

Comparative Study on Foreign and Chinese Resource Discovery Systems

Su Jianhua

Abstract Resource discovery system in library breaks all kinds of document carriers’ restriction, achieves one-stop search for all resources, and becomes the main resource integration service platform.At home and abroadthere appear summon, EDS, Primo, Superstar, VIP and so on. This paper compared five foreign and Chinese systems in four dimentions,including metadata quantity, metadata quality, system framwork and retrieval function, in order to provide reference for system selection.

Keywords Resource discovery system. Foreign resource discovery. Chinese resource discovery.

资源发现系统打破了图书馆各种资源的载体限制,实现了所有资源的一站式检索,一问世便得到了图书馆的青睐和热捧,展现出了强大的发展劲头,涌现出了不少的产品,如国外的Summon、EDS、Primo等,国内随后出现的超星发现和维普智立方等。国内一些实力较好的图书馆大多引进国外系统实现了资源整合,但由于国外系统价格较高,大多数中小型图书馆不敢问津,而且研究发现,国外的资源发现系统对于中文资源的整合、发现并获取的效果都不尽如人意,因此,北京超星公司和维普数据先后推出了超星发现和维普智立方发现系统,旨在全面、准确地发现中文资源。资源发现系统在资源的检索原理、元数据获取方式、服务模式等方面基本相同,但在数据来源与数据量、功能与服务以及定价方式等方面存在着差异。这些都是影响图书馆引进发现系统的主要因素,如何根据本馆需求选择发现系统是图书馆必须考虑的问题。因此笔者尝试从从元数据覆盖范围、数据质量、系统架构、检索功能等方面对主流的国内外资源发现系统进行比较分析,以期对图书馆选择时有所帮助。

1 中外文资源发现系统的介绍

发现服务是基于海量的元数据中心仓储数据实现的,提供类似搜索引擎的单一检索框,通过便捷的入口对图书馆所有资源进行访问,并能在短时间内对检索结果进行不同版本、不同媒介形式的聚类显示、相关性排序、时间排序等,在命中结果较多时,能够进行二次分面检索,最重要的是检索结果能够提供详细的本馆馆藏信息。国外目前主流的外文资源发现系统有Summon、EDS和Primo三家,国内有超星发现和维普智立方发现系统。Summon、EDS、维普是内容商推出的系统,优势是内容覆盖范围大,外文期刊收录较多,Primo、超星(以中文图书见长)是系统提供商推出的系统,优点是与图书馆集成系统整合较强。国内一些图书馆为了更好地服务用户,先后部署了外文和中文资源发现系统,形成了二者共存的局面,如西安交通大学和东南大学使用的Summon和超星发现系统。从部署模式上看,Summon、EDS、维普智立方采用了目前流行的云服务模式,而Primo和超星将元数据仓部署在云端,将本馆馆藏和自建资源数据部署在本地,这两类系统的的中心索引采用基于云服务的SaaS模式,提供资源的发现和获取服务,而且都集成了全文链接获取功能,如EDS直接提供 PDF全文和全文链接两种方式,但获取全文的前提是本馆购买了该资源。此外,Primo、EDS、超星和维普都具有联邦检索的功能,而Summon采用了统一的单一索引平台,全部数据都是基于元数据仓储的发现[1]。

2 中外文资源发现系统的比较

集中的元数据仓是发现系统的基础,而强大统一的发现检索功能是其胜出其他资源检索平台的砝码,下面就围绕这两个中心因素从元数据质量、规模、获取方式、系统架构、检索功能、服务方式以及特色功能等方面对中外文资源发现系统进行比较分析。

2.1 元数据质量及资源覆盖范围比较

元数据中心索引对资源的覆盖范围是发现系统的核心,目前三个外文系统对外文元数据的收录情况都不错(详细内容见表1)。外文发现系统的元数据量整体比中文高,而且研究表明,外文发现系统的元数据大部分是学术文献,基本涵盖了国外主要资源提供商的数据库产品,特别是外文期刊数据库收录非常齐全,但中文资源收录较少。中文发现系统中文资源收录全面,超星发现的电子图书尤其全面,维普还收录了其他系统没有的标准、产品样本、科技报告等独家文献,而Summon和Primo只获得了维普中文期刊的3万多条期刊元数据的授权[1]。这些数据主要通过3种方式获得:内容商直接提供、基于OAI-PMH协议的元数据收割技术收集的网络开放资源以及未授权的第三方元数据和本地馆藏资源元数据上载[2]。这三种来源方式中第一种数据质量有保障,是经过专业人员标引的厚数据,大部分内容商开发的系统的数据主要是第一种方式获得,如Summon、EDS和维普智立方,超星的部分数据属于此类,本地数据需要与图书馆的OPAC整合才能实现。

2.2 中外资源发现系统系统架构及检索功能的比较

现阶段发现系统主要通过两种模式提供服务:云服务模式和云+本地服务模式,Summon、EDS、维普属于前者,Primo和超星是后者的典型代表。由于采取集中索引,发现系统预先对元数据进行了收集、标准化并建立了索引,省去了系统要构造检索式再分别到各个数据库进行检索的环节,大大缩短了系统响应时间,同时也实现了对多个数据库检索结果的相关性排序,如Summon和EDS提供分学科的元数据集,在相关度排序等方面能够提供精准的效果,维普和超星都具有相关度排序、分面聚类和相关内容推荐功能,下面通过表格(表2和表3)就这5个系统的架构和检索功能进行比较。

3 中外资源发现系统的综合比较分析

资源发现系统资源整合范围广,检索方式简单方便,结果丰富,除了具有一般搜索引擎的信息检索功能外,还增加了个性化服务,例如上海交通大学图书馆通过b/X相关资源推荐服务帮助用户找到相关热门文章,原文获得也更加便捷,这些都是以往资源检索平台无法企及的;而且发现系统还可实现对图书馆OPAC、全文数据库、文摘和引文数据库、乃至原文传递、参考咨询、馆际互借等服务的集成。此外发现系统允许用户预先设置检索范围、对检索结果创建标签、评分、发表评论等[3],提高了查准率和查全率,但是由于元数据来源多样,中心索引仓储索引深度不一致,导致有些资源难以被揭示发现,有些链接无权访问或无法下载全文的问题。据复旦大学殷沈琴等调研,发现三家外文资源发现系统存在着全文链接不稳定、不同来源的文献不能题名归组、检索结果排序不理想、中文元数据覆盖率低以及本地技术支持薄弱等问题[4]。

3.1 元数据质量有待提高

很多文献元数据收录不完整,比如一本期刊,收录年份不是从创刊年开始,或者中间有年份缺失;元数据的质量和厚度亟待提高,据电子科技大学秦鸿教授等研究表明:三家外文发现系统中来源于报纸的元数据超过60%,EDS厚元数据最多,Summon次之,Primo最少[3],超星发现里大量的资源都是网页资源,这些数据都需要词表规范;元数据覆盖的中文资源不多,据北京航空航天大学杨晓光馆长调研发现,Summon中的中文资源总量只有1003万,而超星为1.8亿。

3.2 算法不统一,检索结果相关性排序不够理想

由于资源发现系统整合了许多外部资源平台,尽管采取了统一索引机制,但由于各个数据库的算法和索引深度不一致,导致用户检索到许多不相关的结果,这是由于资源类型繁多、缺乏统一的受控词表以及数据库高级检索功能产生的,单独检索数据库比使用发现系统会获得更多有用结果,所以从某种程度上说,资源发现系统只适合初级用户,研究人员还是使用专业数据库更有帮助。

3.3 全文链接不稳定

资源发现服务依靠openURL获取全文,但 openURL链接全文并不是万无一失,因此,资源发现系统采取了一些替代方法链接全文。例如Summon 的“Index-Enhanced Direct Linking”,EDS的“smart links”和“custom links”[5],超星发现整合读秀、百链通过文献传递提供全文获取服务,维普智立方通过V-Link提供全文获取的多个地址,但这些并不能保证百分百获得全文,因为有些链接本来就是指向目录页、文摘页,用户逐层点击也不一定能获得所需资源,甚至有些链接是死链或者错误链接,这与资源发现的初衷严重相悖。

3.4 与馆藏OPAC的整合不够紧密

读者在图书馆OPAC系统不但能够检索资源目录,而且还能进行预约、续借撰写书评等操作,资源发现系统要实现这一功能就必须完成两个层面的整合:数据层和服务层。外文资源发现系统很好地诠释了这一功能,如Primo的“个人空间”支持书目数据FRBR显示,允许用户添加评论、进行预约续借操作[1],北大图书馆在Summon系统中实现了馆藏信息实时流通功能,而超星和智立方只实现了单纯的数据整合,用户要查询自己的借阅情况或预约续借等必须进入原OPAC系统才能操作。此外在整合馆藏自建特色资源方面中文发现系统也是欠缺的,而外文系统却较好地解决了这一问题:如北大图书馆基于Summon建立的未名搜索覆盖了北大古籍、北大民国报刊、北大名师、北京历史地理、北大学位论文、北大讲座等特色资源。

4 图书馆选择资源发现系统的策略

不同资源发现系统的核心竞争力在于索引元数据的覆盖面、去重排序的效果以及用户体验等。图书馆在考察资源发现系统时可以从元数据、架构与功能、检索与展示、商务因素等4个角度进行考察,具体来说可从资源的覆盖面,相关性排序算法,与其他服务的无缝链接和统一揭示,以及社交网络的融入和个性化服务等方面评估[6]。中外资源发现系统各有所长,外文侧重用户体验、检索结果呈现、全文获取等方面,资源覆盖量大,中文则注重知识深入分析功能,如超星发现的可视化图谱的引证分析功能,智立方的知识管理功能,因此图书馆选择资源发现系统时,必须考察多方因素,理性分析,最终确定适合本馆馆情的资源发现系统。

4.1 明确需求,准确定位

现有外文发现系统对中文数据库的元数据覆盖率低,而且知识的深入分析与挖掘方面的功能并不突出,这恰恰是高校图书馆用户特别是高级用户群体比较关注的部分,又加之外文发现系统大多采用“实施费加订购费”的定价模式,所需费用较高。这些都需要图书馆在引进系统时综合考虑,不要盲目追随一些实力较强图书馆的发展步伐,根据本馆馆情逐步引进,可将中外文资源发现系统分开,首先引进中文发现系统,条件允许的时候再考虑外文系统;此外,资源发现系统的查全查准是相对的,比较适合初中级读者使用,研究人员还是需要在专业数据库中检索所需资源,因此图书馆在引进外文发现系统时可根据本校学科发展和研究人员的具体需求配置资源,避免重复引进,减少资源经费开支。

4.2 加强与本馆OPAC的整合

尽管目前主流的资源发现系统都是开放性的,都提供API接口,但由于标准不统一,使得各个系统存在着较大的差异,如何实现对用户需求最大的中文文献的覆盖以及和自己馆藏资源的无缝整合是图书馆选择引进系统时必须考虑的重要因素。具体来说要考虑元数据的数量、厚度、元数据的规范格式,对本馆资源的覆盖率,尤其是核心期刊的覆盖率。能否在一个发现系统的后台支持多个门户的请求,能否为每个入口设定不同的资源组织和排序策略、是否具有统一认证、“我的图书馆”功能、能否实现与文献传递等现有的读者服务系统的整合,是否支持个性化的定制开发、能否集成馆藏自建资源、OA资源或其他资源,是否能实现实现电子资源和印本资源进行统一查询,是否支持图书出借状态、馆藏地等流通数据的集成,当然能够集成预约、续借、书评等功能更好。北大图书馆在部署资源发现系统(未名搜索)过程中与Summon合作实现了实时流通信息显示功能,积累了资源发现系统与OPAC整合的成功经验[7]。

4.3 深度挖掘发现系统的功能

资源发现系统中百个数据库集成在一起推送查询结果,对后台排序算法和排序机制要求很高,一旦数据索引深度不均便会导致很多文献资源难以发现,图书馆馆员虽然不能改变资源发现系统的排序算法,但是能通过调整系统的默认设置影响检索结果的显示。调研发现,用户在使用发现系统检索资源时总会出现大量不相关的资源,严重影响判断和甄别,这是由于系统中包括大量的报纸、书评以及网页等学术性较低的资源,这个可以通过更改检索设置来排除,如西安交大图书馆在Summon 设置中排除了新闻文章和书评,过滤了一些不相关资源[5]。北大图书馆在Summon系统中获取全文提供了“更多来源选择”功能[7],解决了部分全文链接不通的情况,中文发现系统除了具备一般发现系统所具有的检索、发现与获取的功能外,更加侧重对整合后的大量数据资源进行知识挖掘与情报分析处理。超星发现拥有目前唯一的图书参考引证功能,通过可视化图谱展示了知识、人和机构之间的关联关系,维普智立方实现了知识内容的情报挖掘和知识管理功能,这些都为图书馆学科服务提供了有利保障,图书馆可以凭借中文发现系统分析用户的知识需求,揭示出各信息资源之间相互关联的立体知识体系,帮助用户理清海量信息资源潜在的规律和发展趋势。

图书馆引进资源发现系统需要考虑因素还有很多,比如对移动平台的支持、宣传推广、技术人员保障、检索入口在图书馆主页的位置、资源显示的默认设置、最相关内容推荐、本馆需求的实现、厂商的技术支持以及运营成本等,只有事先考察并解决了这些问题,图书馆才能根据需求选定适合本馆的资源发现系统,进而借助资源发现系统规范管理、揭示各类馆藏资源,实现学科融合,在深入挖掘用户的信息需求的基础上实现服务模式的根本性变革,实现图书馆资源存取的真正自由。

参考文献:

[ 1 ] 秦鸿,钱国富,钟远薪.三种发现服务系统的比较研究[J].大学图书馆学报,2012(5):5-11.

[ 2 ] 包凌,蒋颖.图书馆统一资源发现系统的比较研究[J].情报资料工作,2012(5):67-71.

[ 3 ] 孙奇,任慧玲.图书馆资源发现系统的特点及其存在问题分析[J].图书馆学研究,2014(3):51-55.

[ 4 ] 殷沈琴,唐武京,邵诚敏,等.三家资源发现系统的调研、测试和评估[J].图书馆杂志,2013(12):82-86.

[ 5 ] 翟中会.资源发现系统存在的问题及其对策[J].图书馆建设,2015(3):63-66.

[ 6 ] 孙宇,张磊,刘炜.图书馆资源发现系统选型研究[J].图书馆杂志,2013(12):63-70.

[ 7 ] 周义刚,聂华,廖三三.北京大学资源发现服务推广探析:以未名学术搜索为例[J].图书情报工作,2014(20):67-72.

苏建华 西南政法大学图书馆副研究馆员。重庆,401120。(收稿日期:2015-07-03 编校:刘勇定)

上一篇:高校图书馆空间服务发展研究 下一篇:科技传播中大学机构知识库价值及服务功能探索*