基于引文分析的我国研究者信息获取能力评价研究

时间:2022-06-14 10:54:57

基于引文分析的我国研究者信息获取能力评价研究

摘 要:根据文献计量学理论和引文分析原理,参考文献的数量与分布特征与研究者信息获取和吸收能力相关。文章在引文分析原理的基础提出了五个假设和五个推论,并选取载文量、引文量、篇均引文量、中英文引文比和不同类型引文比为评价指标,以9种权威中文学术期刊为样本进行了引文统计调查,分析结果表明,引文量和结构可作为评价研究者信息获取和吸收能力的依据。

关键词:文献计量学 引文分析 研究人员 信息获取能力 信息吸收能力 科学评价

中图分类号: G250.252 文献标识码: A 文章编号: 1003-6938(2011)06-0021-05

Evaluation of Information Access Ability of Researchers Based on Citation Analysis

Wen Tingxiao Liu Xiaoying (Xiangtan University, Xiangtan, Hunan, 411105)

Abstract: According to bibliometrics theory and citation analysis principle, the quantity and distribution of references are closely related to researcher's information access ability and information absorbing ability. This paper puts forward five hypotheses and inferences based on citation analysis principle, and chooses five evaluation indexes such as paper publishing quantity, references quantity, references quantity per paper, ratio of Chinese and English references, ratio of all types of references. In order to prove the hypotheses and inferences, this paper chooses nine authoritative Chinese academic periodicals as sample to carry out citation statistics and investigation, the result makes known that reference quantity and structure can be used as the foundation to assess researcher's information access ability and information absorbing ability.

Key words: bibliometrics; citation analysis; researcher; information access ability; informatin asorbing ability; scientific evaluation

CLC number: G250.252 Document code: A Article ID: 1003-6938(2011)06-0021-05

文献计量学和引文分析法告诉我们:科学发展具有连续性和继承性。科学研究人员总是在现有研究的基础上进行创新,对研究现状掌握越充分,越能表现其创新性和创新能力。而把握研究现状最好的方式就是了解现有文献和信息,对现有文献和信息了解越充分,就越能站在学科发展的前沿上进行创新。所以牛顿说:“我之所以比别人看得远一点,是因为我站在巨人的肩膀上”。因此,对文献和信息的查寻与获取能力也自然成为衡量和评价研究人员研究能力和创新能力的重要依据和指标。创新是相对于已有的研究成果而言的,为了体现其研究成果的创新性,研究人员在从事研究过程中会尽量查寻现有文献和信息,在学术论文写作过程中会尽量列出相关文献。据此,我们可以认为:一般来说,信息获取能力越强,参考文献列举就越充分。除非研究者认为无须列举或有意省略,而这往往会带来学术风险,如违反学术规范和学术道德。

按照文献引用规范的要求,被引用文献应当是全部相关文献中质量最好和相关度最高的,而且只要引用就必须列举。这就意味着,文献引用必须建立在对相关文献实现充分获取的基础上。在信息查寻中存在一个“索普定律(M・E・Soper)”[1][2]:文献引用与相关文献和信息的可获得性密切相关。用户在利用信息时总是倾向于选择距离较近、容易获取的信息源。这一方面说明,用户在信息获取中存在求便心理和占有准则,另一方面也说明,用户信息获取量与其能力大小有关。这种求便心理是建立在用户平常注意信息源获取和积累的基础上的,这也是一种信息获取意识和能力。由此可以认为,利用引文数量特征及分布规律来初步判断研究者的信息获取能力是可行的。

1 引文分析的基本原理

1.1 引文分析的理论依据

从根本上讲,科学文献之间的相互引证由科学本身的发展规律和科学研究活动的规律所决定。文献计量学、信息计量学和科学计量学认为:[3][4]研究人员的引证行为和引证动机受一定规律的支配。科学文献的引证与被引证,是科学发展规律的表现,体现了科学知识和情报内容的积累性、连续性和继承性,也体现了科学发展的统一性原则以及学科之间广泛的交叉、渗透和综合现象。科学文献作者在创作科学论文时,不可避免地要引证他人的文献,汲取别人的经验和成果。因此,科学工作者的引证行为是科学活动普遍存在的现象,是科学交流不可缺少的部分。科学文献的作者一般不会在论文中无缘无故地引证与其论述主题完全无关的文章。文献的相互引证有多方面的原因。温斯托克(M・Weinstock)在进行系统归纳后指出,文献被引证大概有15种原因。引证行为和引证动机为我们从事引文分析提供了理论依据。

1.2 标注引文的重要意义

标注引文(参考文献)在学术研究中具有重要意义,它不仅是学术规范和学术道德的基本要求,而且也在推动科学技术进步和科研活动健康发展等方面具有至关重要的作用。具体来说,在学术论文写作和发表过程中标注引文可以起到如下作用:[5][6][7]

(1)体现科学文化的继承性和发展历史;

(2)尊重和保护他人的著作权;

(3)精练文字,缩短篇幅,避免重复;

(4)便于编辑和审稿人准确评价论著的学术价值和技术水平;

(5)提供情报信息线索,与读者共享信息资源;

(6)通过引文分析对论文、作者、期刊、机构等的学术影响力(应用总被引频次、影响因子、即年指标、他引率等指标)做出客观的评价;

(7)有助于建立科学公正的国家科学技术和社会科学评价平台;

(8)促进科技信息、信息计量学和科学计量学研究,推动学科发展。

这就要求科研工作者在论文写作和发表过程中实事求是地标注参考文献,而科研工作者在论文写作和发表过程中也会根据所获取的信息和实际需要来列举参考文献。

1.3 引文量大小的决定因素

引文分析原理告诉我们:“引证行为为何会发生”、“引证行为的测度指标、工具与方法”、“引证原理的主要应用”,但并未指出“引文量大小的决定因素”以及“引文量与信息获取能力的关系”。

一般来说,科学文献中引文量的大小取决于如下因素:

(1)与信息获取能力有关,信息获取能力强则引文量相对来说要大;

(2)与学术规范和引用规范有关,学术研究越规范和引用要求越规范的领域和地区,引文量相对来说要大;

(3)与科学论文的类型有关,综述性和述评性论文引文量相对来说要大,一般论文引文量相对来说要小;

(4)与学科领域有关,不同学科领域的论文的包含的引文量大小不同;

(5)与研究主题有关,原创性和前沿性主题研究论文引文量相对来说要小,热点和焦点研究主题论文引文量相对来说要大,普通主题研究论文引文量相对来说要更大。

据美国科学基金会统计,一个科研人员花费在查找和消化科技资料上的时间自占全部科研时间的51%,计划思考占8%,实验研究占32%,书面总结占9%。[8][9]由此可见,科研机构、企业或者科研人员花费在科技出版物上的时间为全部科研时间的60%左右。如果能够提高信息获取能力,就能缩短文献查阅时间,提高科研效率,将有限的时间和精力用于创造性的研究中。可见,一个科研工作者如果其信息获取和吸收能力不强,要想提高科研效率,开展创造性研究是不可能的。

1.4 基于引文分析理论的假设

基于引文分析原理,我们可以建立以下假设:

假设一:所有的学术论文都是在遵守学术规范的前提下完成的,研究者在完成学术论文的过程中尽可能多的列出相关参考文献,以体现其论文的创新性。

假设二:研究者在完成学术论文的过程中,一般都会尽量把其能够搜集到的相关文献列在参考文献中,以表明当前研究现状、论证其学术观点。

假设三:研究者在完成学术论文的过程中,在列举参考文献时,一般都会优先列举容易获得的文献、权威人士的文献、高质量的文献、高级别的文献来论证其观点。

假设四:学术论文中没有列举参考文献,一般可以认为,要么研究者信息获取能力有限,无法获取所需信息;要么学术论文中所包含的观点为完全创新,不需要列举参考文献;要么学术论文中所述观点为常识性知识,无须列举参考文献。

假设五:基于以上假设,可以认为,学术论文中所包含的参考文献数量的大小在一定程度上能反映研究者在完成学术论文的过程中获取相关文献信息的能力,也就是说学术论文中所包含的引文量与研究者信息获取能力相关。

1.5 基于引文分析理论的推论

如果以上假设成立的话,那么我们可以得出如下推论:

推论一:不同学科的学术论文中参考文献的平均数能反映各自学科领域研究人员信息获取能力。一般来说,不同学科对研究者在论文写作过程中需要列举的参考文献要求不同,要求越高,学术研究越规范,列举的参考文献就越多,对研究人员的信息获取能力要求就越高。

推论二:不同级别的学术期刊中的论文中所包含的参考文献数量不同(如按影响因子区分的期刊类别),一般来看,高级别的学术期刊中的论文创新程度要高于普遍期刊中的论文,为了体现其创新性,高级别的学术期刊中的论文应包含更多的参考文献。

推论三:不同学科、不同级别学术期刊的学术论文所包含的参考文献中,中文和外文参考文献的比例不同,反映了不同学科和不同学术期刊对研究者外文水平的要求和获取外文信息能力的要求。

推论四:不同学科和不同期刊的学术论文所包含的参考文献中,不同类型载体的参考文献数量不同(如图书、期刊、报纸、学位论文、会议论文、专利等),反映了研究者获取不同类型载体文献信息的能力。

推论五:不同学科和不同期刊的学术论文所包含的参考文献中,被引期刊的影响因子之和和平均影响因子,反映了该领域研究者获取高质量信息的能力。

2 基于不同学科期刊引文的数据调查

2.1 样本选择

为了证明以上假设和推论的合理性,本文选择了图书情报、经济管理、法学、数学、物理、化学、计算机科学等学科领域中11种具有代表性的中文权威学术期刊来进行数据调查,基本覆盖了社会科学和自然科学的重要学科领域。由于每种学术期刊每期的载文量及论文中所包含的引文量大体相当,变化不大,相对稳定,因此本文仅以每种中文学术期刊2011年第1期刊出的论文中所包含的参考文献为调查统计样本。实际调查表明,这种随机样本抽取方法抽出的样本尽管数量不大,但具有代表性,能够有效反映样本整体情况,具有稳定性和可检验性。进行尝试性研究是可行和有效的,能够推广。这11种权威中文学术期刊及所属学科如表1所示。

2.2 指标选择

根据引文分析原理,本文重点选取了5个关键指标来重点统计分析中文学术期刊中引文数量及分布特征,据此来考察引文量及分布与信息获取能力的关系。5个关键指标如下:

(1)载文量:即每种中文学术期刊每期发表的论文数。

(2)引文量:即参考文献总量,包括每篇论文的引文量和每种学术期刊每期的引文量。

(3)篇均引文量:即每种学术期刊中每篇论文的平均参考文献含有或占有量,等于每种学术期刊每期的引文量除以每种学术期刊每期的载文量。篇均引文量可以反映每种期刊的平均引文量和每个学科论文的平均引文量。篇均引文量反映的是论文、作者、期刊和学科的信息吸纳能力。

(4)中英文参考文献的比例:即每篇论文所含参考文献中中英文参考文献在引文量中所占的比例,可以推广至期刊和学科中英文参考文献在引文量中所占的比例。它反映的是论文、作者、期刊和学科吸纳英文信息的能力。

(5)不同类型参考文献比例:即每篇论文所含参考文献中图书、期刊论文、会议论文、专利文献、研究报告、学位论文、网络引文等文献类型的比例。它反映的是论文、作者、期刊和学科吸纳不同类型信息源的能力。

2.3 数据调查

通过调查统计,2011年第1期9种权威中文学术期刊引文量及分布情况如表2所示。

3 数据分析及基本

3.1 引文格式不统一,有待规范

在文献计量学中,引用一般分为两类:一是“引”,即直接引用(观点、数据、结论等的直接引用,一般用引号标出,按照一定的格式标注,如括注、脚注和尾注,通常也称为注释);一是“用”,即间接引用(观点引用,援引已有的知识成果,作为信息源而利用,一般不用引号标出,以尾注的方式标注,通常称为参考文献或引文)。

在我国,不同学科领域的学术期刊对参考文献的标注要求和格式不统一,即使是在同一学科内的不同学术期刊对参考文献标注的要求和格式也不统一,学科和期刊差异较大,不利于有效开展信息计量学和科学计量学中的引文分析研究,有待规范。借鉴国际标准或建立我国统一的参考文献标注格式和标准都是有效的举措,需要学术界呼吁和有关部门重视。如国际通用1979年创建温哥华格式,2006年2月采用最新版本。我国文后参考文献标注格式采用GB/T 7714-2005。但很多学术期刊并未规范使用这些标准。

从11种权威中文学术期刊引文(覆盖经济学、法学、管理科学、哲学、历史、文学、社会学、数学、化学、物理学和计算机科学等11个学科)的调查数据整体上来看,我国学术期刊引文标注存在以下问题:一是“引”(注释)、“用”(参考文献)不分或不完全区分。大多数学科领域的期刊都没有区分“引”(注释)和“用”(参考文献),或者是将两者混在一起。如《管理学学报》、《中国管理科学》、《数学学报》、《化学学报》、《物理学报》和《计算机学报》就没有区分“引”(注释)和“用”(参考文献),而《法学研究》、《中国社会科学》则将两者混在一起脚注。二是格式不统一。自然科学各学科领域的期刊在标注格式上基本一致,而在社会科学领域,基本上是一个学科、一种期刊一种标注格式。三是标注不完整。在所调查的9种权威中文学术期刊中,除《管理学学报》、《中国管理科学》和《计算机学报》有文献类型标识外,其它学科领域的学术期刊都没有。《经济研究》期刊论文中还没有标注引文序号。

3.2 篇均引文量不高,信息获取能力有待加强

论文和期刊的平均引文量,是考察论文、期刊和作者吸收他人学术思想的水平。平均引文量通常可以反映论文、期刊和作者吸收信息的能力以及科学交流程度的高低。篇均引文量反映的是论文、作者、期刊和学科等的情报信息吸收能力。篇均引文量是与情报信息吸收能力和信息获取能力密切相关的,虽然篇均引文量小可能不能说明作者信息获取能力差,但篇均引文量大则能表明作者信息获取能力强。在从事科学研究过程中,研究人员应尽量对所从事的研究领域或主题进行全面的了解,这必须建立在充分掌握本领域或主题相关信息的基础上,没有一定信息获取能力是很难做到这一点的。

从所调查的9种权威中文学术期刊篇均引文量来看,尽管每种期刊的篇均引文量都高于全国各种学术期刊的平均水平,但与国外学术期刊的篇均引文量相比仍有较大差距。据2008年版《中国科技期刊引证报告(核心版)》,国内1 765种科技期刊发表的论文的平均引文量为10.01条/篇;另据2008年版《中国期刊引证报告(扩刊版)》,国内6082种期刊发表的论文的平均引文量为7.92条/篇。而国外期刊的科技论文的平均引文量超过30条/篇。[10]这一方面说明国外研究者注重相关研究领域信息的获取,另一方面也说明国外研究者在科学研究过程中注重信息获取能力的培养。从所调查的9种权威中文学术期刊的篇均引文量来看,高于30条/篇的只有《法学研究》和《中国社会科学》两种,分别为42.89和60.6,如果去掉注释的话,则篇均引文量只有37.33和51.13。虽然仍高于国外科技论文的平均引文量,但是与国外高质量、高水平的学术期刊相比,则又存在较大的差距。[11]据统计,每篇外文论文的引文量平均比中文论文的引文量要多6篇,它反映了国内外研究者在文献利用上的差距。[12]综述性论文的引文量则尤其如此,我国综述性学术论文的引文量一般在15~100篇之间,个别论文引文量较小。而国外综述性论文一般较长,参考文献量也较大,大多在100篇以上,多则达几百篇。

3.3 英文引文比例上升,仍需提高

随着科学技术发展的国际化,世界各国的研究人员之间的相互借鉴和交流十分频繁。研究者在从事创造性科学研究活动过程中,会尽力了解国内外某研究领域的发展状况,站在学科研究和发展的前沿上,才能生产出具有创新性的研究成果。研究科学论文中引文语种的分布,正是测度作者获取和利用国外文献和信息能力及情报信息吸收能力的一项重要指标。因此,查寻和获取外文资料和信息的能力在科学研究活动过程中意义重大。

引文是由不同语种的文献构成的。中外文引文比例的大小反映的是研究获取和吸取外文信息的能力。某一种语种的引文量越大,说明该语种比较重要和常用。对我国《大气科学》、《金属热处理》等10种自然科学领域的学术期刊1979年的引文统计表明:[13][14]中文引文量占全部引文总量的27%,英文引文量占58%。这说明在当时的情况下,只要掌握英文,再加上中文,就足以查阅所需文献和信息的85%。而对《数学学报》的引文统计分析表明:[15][16]引文语种只有四种,中文、英文、俄文和德文。其中英文占73.99%,中文占23.88%,约为英文的三分之一,俄文和德文数量极少,只占2.14%。在数学领域,我国科研工作者只要掌握英文,就可获得97.86%的信息量。两种调查的结果都表明英文引文所占的比例都特别高,这一方面说明国际上以英文发表可供查阅的相关学科文献和信息数量多,另一方面说明我国研究人员多数是以英语为工具检索国外资料的。

从本次调查的结果来看,11种权威中文学术期刊论文所包含的引文中,中英文引文所占的比例分别为:《中国图书馆学报》中文引文量占71.54%,英文28.46%;《情报学报》中文引文量占46.08%,英文占53.92%;《经济研究》中文引文量占39.23%,英文占60.77%;《法学研究》中文引文量占71.51%,英文占28.49%;《管理学学报》中文引文量占32.9%,英文占67.1%;《中国管理科学》中文引文量占39.69%,英文占60.31%;《中国社会科学》中文引文量占68%,英文占32%;《数学学报》中文引文量占6.22%,英文占93.78%;《化学学报》中文引文量占21.37%,英文占78.63%;《物理学报》中文引文量占33.87%,英文占66.13%;《计算机学报》中文引文量占6.99%,英文占93.01%。其它语种的引文极少,几乎没有。调查结果表明,除《中国图书馆学报》和《中国社会科学》两种权威中文学术期刊中文引文量的比例大于英文之外,其它期刊9种学术期刊的英文引文比例都高于中文,自然科学中文学术期刊英文引文所占比例大于社会科学学术期刊。在社会科学领域,人文社会科学如哲学、历史、法学、文学等中文引文所占比例大于英文,而经济学、管理科学和情报学等英文引文所占比例要稍高于中文。《数学学报》和《计算机学报》英文引文所占比例最高,特别是《数学学报》,较之前的引文统计调查,英文引文所占比例大大提高了,从73.66%上升到93.78%,提高了近20个百分点。调查中还发现,一些学术期刊在投稿须知中还明确规定了英文引文所占的比例不得低于三分之一或一半,如经济学和管理学学术期刊。如此看来,我国部分学术期刊在引文语种的分布上具有倾向性和导向性。总体来看,英语已成为我国科研工作者获取国外资料和信息的主要语种。

3.4 引文类型来源狭窄,有待拓展

研究引文的文献类型分布,可以了解本学科论著的文献信息来源及其构成比例,从而确定各类文献载体的情报价值以及研究者获取不同类型文献信息的能力。引文统计调查表明:[17][18]在所有被引文献中,期刊论文所占比例最大,其次是图书,特种文献中的专利说明书、科技报告、会议文献、技术标准、产品样本、学位论文等的被引率有上升的趋势。

从这次调查的结果来看,9种中文学术期刊论文所包含的引文中,除《中国社会科学》图书所占比例最高外,其它学术期刊引文中期刊论文所占比例都远远高于其它文献类型。可见,人文社会科学领域的研究者更多地倾向于引用图书,尤其是经典著作,如哲学、历史、文学。本次调查还有一些新的发现:一是期刊论文所占的比例在逐渐上升;二是计算机科学领域的研究者们更多的引用会议论文;三是网络引文开始作为一种重要的信息来源逐渐增加,图书情报和计算机科学领域的研究者关注最多,而经济、管理和哲学、历史、文学等领域则极少使用网络引文,法学领域使用网络引文主要是做案例分析;四是报纸和各类报告受到经济、管理和法学领域研究者们的青睐;五是大量具有重要情报价值的信息源被我国科研工作忽略,如学会论文、专利等。这一方面可以说明我国研究者获取信息的渠道狭窄,需要拓展,另一方面也证明我国科研工作者在获取和利用不同类型信息方面的能力有待提高。

参考文献:

[1]文庭孝等.信息咨询与决策[M].北京:科学出版社,2008:169.

[2][5][13][15]罗式胜.文献计量学概论[M].广州:中山大学出版社,1994:183-184,116-117,134-139.

[3][6][12][14][16][17]邱均平.信息计量学[M].武汉:武汉大学出版社,2007:317-318,370-371,424.

[4][7][18]王佃启.人文社会科学学术论文写作规范及几个相关问题[EB/OL].[2011-04-28]..2010-04-09.

[10]翟凤岐,张芝兰.我国图书馆学情报学期刊引文调查与分析[J].中国图书馆学报,1992,(1):35-46,95,98.

作者简介:文庭孝,男,博士,湘潭大学公共管理学院教授;刘晓英,女,湘潭大学图书馆副研究馆员。

上一篇:我国公共图书馆总分馆体系建设模式分析 下一篇:我国高校图书馆面向社会开放现状调查