引用认同研究进展分析

时间:2022-06-09 11:26:42

引用认同研究进展分析

[摘要]首先介绍国内外作者引用认同和期刊引用认同的研究现状,然后将其与被引分析进行比较,指出两者的区别和联系,接着总结这种方法在研究评价过程中存在的问题,最后从研究主体、引用认同概念集和索引库三方面进行发展趋势展望。笔者认为随着研究的深入、技术的进步以及研究主体的扩展,引用认同对于完善引文分析理论、主体评价认识等有重要意义。

[关键词]引用认同 被引分析 期刊评价 作者评价 发展趋势

[分类号]G353.1

1 引用认同研究现状

2001年,美国情报学领域的专家、美国德鲁克赛尔大学教授Howard D.White提出了一种评价个体作者的新方法――引用认同。所谓某作者的引用认同(Citation Identity)是指该作者所引用的所有作者的集合。该方法的提出丰富了引文理论,让我们更能得到某作者引证情况的全景。

1.1引用认同概念的提出

White在2000年提出了以个人为中心(ego-cen-tered)的引文分析方法,即围绕某特定作者,有一批不同类型的作者或作者群:特定作者的合作者(coau-thors),特定作者引用的作者(citation identity),引用特定作者的作者(citation image makers),与特定作者共被引的作者(citation image)。随后,他以尤金-加菲尔德为例进行了实证研究。其定作者的合作者就是合著者分析,用来了解科学交流和合作;引用特定作者的作者,就是本文所讲的作者被引分析;而与特定作者共被引的作者是指作者共被引分析,研究与特定作者共同被引用的作者集合,若其与某作者的共被引强度高,则表明这两个作者之间的联系越紧密。这三种方法皆有不少学者已进行过相关研究,本文所要讨论的是首次提出的概念――引用认同。2001年White发表了一篇文章《Authors as over times》,可谓引用认同的开山之作。文中指出,若将引用认同按被引作者的被引频次由高到低排序,这个结果序列则显现出明显的集中分散分布趋势:一是被作者多次引用的作者集合;二是只引用了一次的作者集合。White以情报学领域的8位学者为例进行实证研究,探讨了作者在长期的研究生涯中引用风格是怎样的,如何检索某作者的引用认同及如何分析、解释检索出的数据。White认为,引用认同虽然刚刚被关注,但其发展前景是广阔的。

1.2引用认同的发展

自White提出引用认同后,图情领域的学者纷纷展开相关研究,对其功能进行进一步的验证分析。由此产生了两种类型的引用认同:以作者为主体的引用认同和以期刊为主体的引用认同。期刊引用认同是依据作者引用认同发展起来的。

1.2.1 作者引用认同 印第安纳大学的Cronin和Shaw 2001年在第八届国际科学计量和信息大会上,指出利用引用认同和被引分析来揭示作者的写作和参考模式,可以成为该作者学术产出的水印标识,犹如指纹一样独特,并依照White的方法分析了本校三位情报学家的引用认同与被引情况,目的在于研究学者的智力发展史是怎样通过引用认同和被引分析反映出来的。结果显示,引用认同很好地反映了三人的主要兴趣领域及随时间的变化。2006年,Bar-Ilan以White提出的以个人为中心的引文分析来对数学与计算机科学家Michael O.Rabin进行了实证研究,第一次将该方法应用到图情领域外的科学家,其中引用认同作为一个重要的角度。2008年,Bar-Ilan将White教授提出的以个人为中心的引文研究列为引文分析方法的重要组成部分。

在国内,除武夷山和屈宝强教授分别在两篇情报学热点和文献计量学发展的综述性文章中提到引用认同外,唯一一篇比较详细讨论这一概念的文章是武夷山教授和马凤发表的。在文中,作者对引用认同的概念、意义、组成和特征做了详细阐述和分析,并以已逝情报学专家王崇德教授为例,讨论了王教授的引用认同。

1.2.2期刊引用认同将引用认同概念引入到期刊分析中,始于2005年。丹麦哥本哈根皇家图书情报学院的学者尝试利用作者分析的方法寻找期刊评价指标,即期刊引用认同。在文中,作者这样定义:它是一个比值,等于该期刊一段时期内的总引文数与所引用的期刊种类的比值。该比值越大,表明其所引用的期刊越集中,期刊的专业性越强;反之,则表明其引用的期刊种类繁多,科学交流的范围比较大,在该刊中发表文章的作者视野也比较开阔。这为全面了解一种刊物提供了另一个定量分析角度。2006年Nebelong正式将期刊引用认同作为评价期刊的一个角度,从期刊引用认同、期刊共被引分析以及国际化三个方面探讨期刊评价的方法。

2 引用认同与被引分析比较

从之前各位学者的研究内容来看,不难发现引用认同和被引分析两者之间存在着紧密联系,两者同属引文分析的范畴,只是从两个不同的角度来人手而已。两者的区别如表1所示:

2.1倾向性

引用认同更多地反映了作者的思维,在研究中他有选择性地参考了前人文献,但是自己的文章会不会被他人所引用,那是无法预测和控制的。

2.2研究角度

White提出的以个人为中心的引文分析及引用认同的概念,如图1所示:

从图1可见,被引分析是研究作者s被哪些人引用,引用认同是研究作者s所引用的所有作者集合,一前一后,合起来正好反映作者s引证情况的全景。

2.3主要目的

引用认同是提供一种认识的角度,通过一定量的数据定性地了解个体,作为其他评价方法的补充。而被引分析主要作为影响力的评价指标。

2.4衍生作用

鉴于引用动机多种多样,被引次数高并不一定代表其学术水平高,但是如果结合引用认同,能够进入到知名作者的引用认同中,或者多次被知名作者引用,可以作为个体科研人员的评价指标之一。此外,若科研人员对某位学者非常感兴趣,想知道其想法源自哪里,如何形成,利用引用认同可以帮助读者找到一种阅读方法,这对于了解该作者和该领域都有重要意义。

3 引用认同存在的问题

3.1方法缺乏规范性

以作者为对象的研究中,武夷山教授和马凤关于计算方法与White教授是有所区别的。White的统计方法是这样的:在研究作者A的引用认同时,A在一篇文章中引用了作者B,那么不管引用了几篇作者B的文章,都记B在A的引用认同中增加一次。这是由Dialog系统自动统计的。这样一来,作者B在A的引用认同受限于作者A发表的文章数量及B在每篇文章中是否被引,而并不能通过在一篇文章中多次被引来增加,B在A的引用认同中的最高次数也只能是作者A发表的文章数量。而武夷山教授和马凤是将王崇德教授毕生的作品为研究对象,统计所有文章的参考文献,经过去重之后,再对参考文献的作

者被引频次由高到低排序,得到王教授的引用认同。如果王教授多次引用同一作者的不同文章,那么该作者在王教授的引用认同就有可能大于王教授发表的论文总数。

对于期刊引用认同,学者将其演绎为一个比值,虽然基本思想没变,但是我们也发现这就变成了如期刊影响因子JIF一样的一个数字,而引用认同不能只认为是个数字指标,它是一个集合,对引用认同的认识应该是对该集合的认识。

笔者认为,正是由于概念本身的特性带来了计算方法的不规范性,现在只能说是在一个原则性的定义下,针对不同研究对象各个研究者发展出了不同的具体定义和计算方法。

3.2数据获取缺乏全面性

严格意义上讲,研究一位作者的引用认同,需要搜集到该作者的所有文献,但任何一个数据库都不能涵盖所有,有些文章根本没有公开出版,需要向作者本人索取。不过换个角度看,引用认同是用定量化方法反映一种定性的关系或描述,达到对主体的认知,因此,除非个别情况,否则少量文献的缺失不会改变大趋势。

3.3数据解读较难

要想很好地解读引用认同所体现出来的信息,必须对研究对象的背景有很深的了解。印第安纳大学的Cronin教授选择本校的三位情报学家就是因为了解他们,可以方便地获取三位教授的文献,而且利用私人关系充分了解其社会网络和研究领域,对于揭示个人智力发展非常有益。

3.4普遍性欠缺

以作者引用认同为例,已有的研究都是以领域知名学者为对象,由于多年的研究积累,他们可以体现出一定的引用模式、引用风格;但是一旦扩展到普通科研人员,由于其研究不深人,对领域知识了解不全面,可能引用认同非常分散,没有规律性,那么对这些“新人”来讲,引用认同也就失去了研究的意义和价值。因此,引用认同对于分析典型性、代表性的主体是很好的方法,尤其在做专题专项研究时。

3.5对其本身的研究较少

目前多是将其作为一种方法应用与评价。

4 对引用认同发展趋势的预测

4.1研究主体的扩展

引用认同经历了概念提出――概念剖析――概念应用(个体作者分析)――应用扩展(期刊分析)4个阶段。笔者认为研究的主体不仅仅局限于作者、期刊,还可以扩展到机构、科研项目组、实验室团体、企业等,在其性质认识、发展阶段、团体评价方面可以发挥重要作用。但是基于当前数据库的标引、扩展分析功能,作者、期刊是最容易地分析入口,若研究其他主体,会有相应的数据获取及分析上的难度。

4.2引用认同概念集

为了便于以后的研究,笔者引入“认同度”这一概念,若作者A引用了作者B10次,那么A对B的认同度为10。认同度越高,表明作者之间的联系越紧密。

引用认同是以某主体对其它主体的引用集合为研究对象,因此,需要将其作为一个概念集来处理,从多个角度解析。对于不同的研究对象,也需要界定不同的时间区间,比如一个实验室可以从其实验室创立开始研究,对于项目组可以从该项目完成到结束进行研究,这样才有实际意义。结合之前White等人的分析,笔者总结出以下5个分析角度,如图2所示:

4.2.1 历时分析 在研究作者、期刊、机构或其他主体时,从动态的角度分析每年或者每几年的引用认同,可以发现该主体的研究兴趣的变化、研究重点的转移、知识的流动等。

4.2.2被引个体区域分布分析 SCI论文被引频次区域分布分析是现在情报研究人员常用的一种方法,用来考察一个国家、地区、机构的SCI论文质量情况。引用认同也能够反映明显的集中离散趋势,可仿照区域分布分析的做法,将某主体的引用认同按被引者频次由高到底排列,并依次分为不同区域(不按累积量计算),第一区为主体本身①,第二区为排名前1%的作者(排除作者本身),第三区为排名1%~5%的作者,剩下的为最后一区,统计各主体在不同区域内总的被引频次及所占比重。集中区域越靠前,则表明该主体有相对固定的研究方向,研究较专一,尤其处于前两区内的是其常关注的,他们之间有较强的学术交流;越是集中于后面区域,则表明研究范围比较广,欠专一深入。这对于无形学院的发现和研究有重要意义。

4.2.3 自我认同度分析 自我认同度即引用认同中引用自身的次数,等价于自引。若自我认同度占总引用次数的比重比较高,那么极有可能表明该主体是该领域的核心,有很多独创性的见解,研究比较深入,因此参考别人较少,造成自我认同度高②。当然,也不排除故意自引的可能。

4.2.4地区分布分析 以往我们考虑国内外的科学交流程度是从合作项目、合著者角度,它会受限于客观条件,即并不是随便就可以促成国内外(或地区间)的合作;但是阅读国内外(地区)的学术成果,为己所参考,是非常容易的。从这个角度看,若主体的引用有很强的地区分布特征,那么可以看出其紧密的联系和对外交流的广度。

4.2.5 跨学科分析 通过统计被引者的学科分布情况,了解该主体的学科交叉性程度。

4.3引用认同索引库

武夷山教授认为,将引用认同和被引分析结合起来,建立引用认同索引、引用认同数据库等应当是切实可行的,笔者相信,随着技术的不断发展,这一目标会将实现。届时,相关研究会取得飞速发展,引文分析理论会更加完整。

5 结语

引用认同是个值得注意的新概念,它与传统被引分析最大的区别就是从一个全新的、整体的角度去考虑某个主体的引用情况,主要目的在于研究该主体的智力发展及变化、思维的源泉,而这种变化又是潜在的,常为人们所忽略的。引用认同在我们对某主体的定性认识方面具有重要意义。笔者相信,随着研究的深入、技术的进步以及研究主体的拓展,尤其是在科研团体、企业研究中引用认同会发挥更大的作用。

上一篇:社会标签进展研究概述 下一篇:基于Web2.0的网络用户群“社会性”行为的系统...