从文献计量学解析Leo Egghe的科学成就与影响

时间:2022-10-23 02:11:13

从文献计量学解析Leo Egghe的科学成就与影响

〔摘 要〕主要利用文献计量学的方法,对科学计量学最高奖――普赖斯奖获得者埃格赫(Leo Egghe)从学术生涯开始至今发表的论文进行定量分析。对埃格赫发文的时间、领域、引文等方面做了详细解读,全面展示其在科学计量学的杰出成就和重要影响。

〔关键词〕文献计量学;埃格赫;普赖斯奖

埃格赫(Leo Egghe)和鲁索(R Rousseau),出于他们在科学计量学领域的杰出成就一同获得2001年科学计量学界最高奖――普赖斯奖。埃格赫是比利时安特卫普(Universitaier Instelling)的数学博士,现任比利时安特卫普教授,比利时皇家图书馆馆长,委员会成员,世界科学计量学和信息计量学委员会成员。埃格赫的研究主要涉及信息理论、引文分析、信息检索、协作和合作理论、信息科学的数学模型等领域。他和弟子也是其亲密的科研合作伙伴鲁索合著的《情报计量学引论》(Introduction to Informetrics)早在1990年代就由中国科学技术文献出版社翻译出版,成为我国学术界了解国外科学计量学与信息计量学领域的重要文献。

1984年埃格赫在林堡大学图书馆工作,出席并参加了世界40多个关于数学和信息科学计量学的重要学术会议。自从1987年他开始参加国际科学计量学和信息计量学会议,并担任组委会成员。在比利时召开的第一次国际科学计量学和信息计量学会议上,他还是信息计量学方面的负责人。所谓文献计量学,“乃是把数学和统计方法应用于研究图书及其它的交流中介”,所谓科学计量学,“乃是研究分析作为情报信息过程的科学的定量方法”[1]。埃格赫把以科学为计量单元的科学计量学拓展为研究领域更加宽广的以信息为计量单元的信息计量学,堪称信息计量学奠基人。埃格赫博士已在数学,信息计量,科学计量学领域的国际期刊上发表过许多的学术论文,他同鲁索一起编辑了前两部信息计量和科学计量学国际会议论文集。他还应邀在计算机科学与技术百科全书和图书馆信息科学的百科全书上写文章。其创办的《Journal of Informertics》在短短几年时间里,其影响因子已位居JCL中LIS学科的前3名。

埃格赫博士的研究工作主要集中在科学团体的排名问题上。一般情况下是用算术平均数来解释这个问题,但是埃格赫对于实体问题的研究,强烈建议采用几何平均数。他研究了科学出版物的延迟和科学文献的年龄分布上的问题,提出出版物与运营商之间的分布函数可以使用卷积函数。

埃格赫博士论著颇丰,无论是在专业科学研究领域,还是在向国家科技发展谏言献策方面都给我们留下了一笔宝贵的财富。本文通过对埃格赫博士在学术生涯中发表在学术期刊上的学术论文进行定量分析,梳理他在信息计量学和科学计量学方面做出的重要贡献。

1 数据来源及方法

1.1 数据来源

为了全面反应体现埃格赫的记录,在本文的研究中,我们采用的数据库是能够反映国际学术论文记录的美国Web of Science数据库,其收录了全世界出版的230个领域的9000多种核心期刊。Web of Science是美国Thomson Scientific(汤姆森科技信息集团)基于WEB开发的产品,是大型综合性、多学科、核心期刊引文索引数据库,包括三大引文数据库科学引文索引(Science Citation Index,简称SCI)、社会科学引文索引(Social Sciences Citation Index,简称SSCI)和艺术与人文科学引文索引(Arts & Humanities Citation Index,简称A&HCI)和两个化学信息事实型数据库,以及科学引文检索扩展版、科技会议文献引文索引和社会科学以及人文科学会议文献引文索引3个引文数据库,以ISI Web of Knowledge作为检索平台,覆盖了全世界最重要、最有影响力的研究成果。

通过研究被SCI收录的个人论文的时间分布,合作情况、引文数量,H指数等,能够反映出科学家目前的研究现状,研究能力和学术水平,是评价科学家学术能力和影响力的重要指标。在WOS的检索中,我们采用的“AU=Egghe L”检索式,共得到186篇论文。在SCI中的论文搜索时间截止到2011年7月14日。

1.2 方 法

科学文献通过引文形成了相互引证关系,构成了具有内在联系的“文献网”。所谓“引文分析”,就是以引用文献为素材,通过分析“文献网”的内在结构,揭示文献间的相互关系,研究科学文献的动态规律,评价科技生产率[2]。引文分析属于文献计量学的范畴,是根据文献间相互引证的关系及特点,运用数理统计、图论、模糊数学等,对文献的引用与被引用现象进行分析,以揭示科学发展态势的一种研究方法[3]。引文分析方法已被作为研究文献利用规律、科学评价、科学预测和研究科学与社会的关系的重要手段[4]。引文分析的测度指标很多,有引文量、引用率、影响因子,共引强度和耦合强度等[5]。

2 数据分析

2.1 科学产出

通过考察埃格赫科学产出的时间分布,可以大致了解他在不同时期研究的活跃情况。我们以论文的发表时间为横轴,以每年发表的论文数量为纵轴,得出埃格赫的论文产出时间分布图,图1给出了1980-2010年间埃格赫先生一共186篇文章的时间分布情况,可以看出埃格赫先生数从开始学术生涯到现在一直处于上升阶段,数出现了两个高峰期,一个是1998-2002年间,另一个是2006-2010年间。

根据我们检索出的186篇文章中,共有161篇article,7篇proceeding paper,4篇editorial material,5篇letter,3篇note,3篇CORRECTION和3篇book review。埃格赫是一个高产科学家。根据埃格赫每年的论文产出,我们可以了解他在不同时期的科学研究活动情况。研究发现,埃格赫的研究在不同时期有不同的重点,并出现了两个成果高峰期。在1990年代期间,埃格赫的研究主要集中在信息检索和演化拓扑上,具有代表性的论文有 《Generalized Success-Breeds-Success Principle Leading to Time-Dependent Informetric Distributions》、《A Theoretical Study of Recall and Precision Using a Topological Approach to Information Retrieval》;在2000年左右期间,他的研究主要是对科学文献、出版物延迟等问题的关注上,《The influence of publication delays on the observed aging distribution of scientific literature》、《Methods for accrediting publications to authors or countries:Consequences for evaluation studies》;之后他的兴趣逐渐转移到H指数上,对于H指数的研究成为了他的主要研究方向,2006年发表在SCIENTOMETRICS上的《Theory and practise of the g-index》被引次数达到了206次。

他的研究领域主要集中在信息科学和图书馆学、计算机科学和信息系统这3个学科,几乎囊括了他的大部分论文。他的许多论文都是涉及到多个学科,他最主要的贡献是在对H指数的研究上,他在2006年发表在科学计量学上的《Theory and practise of the g-index》的这篇文章,总被引频次达到了206次,年平均引用次数达到了31.33。在这篇文章中,埃格赫在分析h 指数评价效果时,提出了一种新的论文影响测度指标,即基于学者以往累积贡献的g指数,可以评价科研人员整体学术水平:一个科学家的分值为g,当且仅当在他/她发表的N篇论文中有g篇论文总共获得了不少于g2次的引文总数,而(g+1)篇论文总共获得了少于(g+1)2次的引文总数。计算方法如下:将论文按照引文数从高到低的顺序排列,g指数是引文累积数量大于等于排序位次平方的最大排序位次。埃格赫进而研究了h指数与g指数相互转换的影响。g指数打破了文献总数的限制,对文献产出少但被引频次高的学者和机构更为公正。g指数的提出,为h指数研究注入了活力。而他的其它关于H指数的文章的年平均引用次数也都很高。

2.2 科学合作

社会科学研究规模与研究难度的不断增大,促使人们在社会科学研究组织中采用类似自然科学的工业化原则,形成了分工协作的研究模式。大科学时代科研合作的日趋频繁,反映在科学论文中则表现为合著现象的越来越多,合著规模亦越来越大[6]。

表1是埃格赫的科研合作关系表,从中我们可以很清楚的看到埃格赫和鲁索的合作关系最密切,这也许与两人曾经的师生关系和性格互补有关。从两位比利时科学家1986年合作发表第一篇论文起,至今已发表了24篇合作论著。曾与鲁索合作过的人很多,然而,除埃格赫,鲁索与其他科学家合作的最高频次仅为3。相比之下,埃格赫除鲁索外,与其他科学家合作的最高频次仅为5。与埃格赫合作的论著占鲁索全部论著的31.7%,与鲁索合作的论著占埃格赫全部论著的12.9%[7]。

从表中我们还可以发现,埃格赫同多人有过学术合作,但合作的论文数都不是很多,他与另外两个学生I.K.Ravichandra Rao和Christine Michel的合作论文数分别是5和2。值得的一提的是,埃格赫同我国学者梁立明教授有两篇合著论文,分别是《Fundamental properties of rhythm sequences》和《A relation between h-index and impact factor in the power-law model》,这也是他关注中国同行的研究领域并与之学术交流的重要体现。

2001年7月,埃格赫和鲁索双双走上普赖斯奖领奖台。获奖之后,二人分别发表了诚挚的致谢词。发言中,他们都追溯了双方合作的历史,都称对方是自己最好的合作伙伴。埃格赫是急性子,有时为某一新思路或新模型一天之内给鲁索打好几次电话。鲁索也极富创造性,但比较沉稳,往往为完善埃格赫尚不成熟的设想而夜以继日地工作[7]。科学合作使得两人在学术研究上的互补,在各自的研究中发挥了重要的作用。

2.3 引文分析

引文分析作为文献计量学的重要研究方法,其有力工具就是引文索引。所谓引文索引(Citation Index)是一种以文献之间的引用关系为基础的文献索引,即它以被引用文献即引文为标目,其下列出引用过该文献的全部文献(来源文献)的检索工具[2]。引文分析方法已被作为研究文献利用规律科学评价、科学预测和研究科学与社会的关系的重要手段。通过引文分析可以调查到论文作者是否与人合作,合作规模、程度如何对科研管理、图书情报服务工作有很大启发[8]。

根据检索出的186篇文章,对其进行被引,可以看到,埃格赫论文的被引总频次是1 632,每篇平均引用次数达8.77。通过按被引频次排列,被引频次在30以上的论文有10篇,被引频次在20以上的论文有18篇,其中《Theory and practise of the g-index》《The R- and AR-indices:Complementing the h-index》两篇论文的被引频次分别达到了188和104,年平均引用次数达31.33和20.80,都是和H指数有关的论文。

通过查看去除自引的引文报告,检索到771篇文章,再通过分析检索报告,可以得到771篇引文的时间分布图(图2)和引文的作者分布图(图3)。

从图2中我们可以看出,埃格赫引文的数量在逐年增加,从上升的趋势看,还有继续增加的可能;尤其从2007年以后开始突然增加,分析埃格赫的论文不难发现,在2006-2007年,埃格赫先后发表了《Theory and practise of the g-index》、《The R-and AR-indices:Complementing the h-index》、《An informetric model for the Hirsch-index》3篇论文,这3篇论文的被引频次都非常高。从埃格赫引文的作者分布图可以看出,ROUSSEAU、BURRELL、SCHREIBER等人排在前3位,尤其ROUSSEAU引用埃格赫的论文次数达到了28篇,这也从一个侧面反映了他二人的科学合作关系。从图4中可以看出,引用埃格赫论文的主要国家分布在美国、中国、英国、比利时等国家,这些国家最近几年在科学计量学的研究方面也相当活跃,对于埃格赫论文的引用也相当频繁。因此,埃格赫是一个具有广泛国际影响力的科学家。

3 小 结

以上分析表明,埃格赫既是一个高产的科学家,也是一个具有广泛国际影响力的科学家。埃格赫具有高尚的科学道德和为科学献身的精神,通过持之以恒和扎实的工作,赢得了国际学术界的公认,他同鲁索的科学合作关系被世人公认为一个典范。他在科学计量学方面做出了杰出贡献,同时也为科学计量学的传播做出了不凡功绩。

参考文献

[1]T・布劳温.科学计量学与文献计量学[J].赵红州,蒋国华,译.科学学与科学技术管理,1987,(9):45-46.

[2]张静.引文、引文分析与学术论文评价[J].社会科学管理与评论,2008,(1):33-38.

[3]周云平,孙媛.我国引文分析研究现状与21世纪发展趋势[J].图书情报工作,2001,(2):80-82,89.

[4]俞培果.论引文分析方法的发展[J].图书情报工作,1995,(4):9-13.

[5]庞龙.科学引文分析的科学评价功能和意义[D].太原:山西大学,2006.

[6]钟旭,黄晖,薛健.中国社会科学期刊论文合著率指标现状及发展趋势研究[J].情报学报,2000,(3):280-288.

[7]梁立明,侯长红.科学合作与小国普赖斯奖获得者共生现象[J].自然辩证法研究,2002,(6):61-64,82.

[8]思萌.引文分析法的作用、局限性及其改进[J].图书馆建设,1992,(6):17-20.

上一篇:地方感与生态身份认同 下一篇:Ronald Rousseau的学术思想及其与中国的学术交...