社会网络分析在引文评价中的应用研究

时间:2022-04-17 01:01:45

社会网络分析在引文评价中的应用研究

[摘要]提出将社会网络分析引入到引文评价中,以改进评价方法,补充评价指标。从引文网络的构成及性质、社会网络分析的内涵及元认识论两个方面,论证社会网络分析在引文分析中的适用性;阐明基于社会网络分析的引文评价能够自动生成被引权重,消除自引对评价的影响,有利于开展分层评价,增加基于知识流通的评价指标,促进分类评价。

[关键词]社会网络分析 引文分析 引文评价 评价指标

[分类号]G350

1 正确看待引文评价

引文评价始于20世纪20年代,它是引文分析法在学术评价中的应用。1927年,Gross夫妇统计了化学专业期刊论文的参考文献并进行分析,得出了化学教育方面的核心期刊表。由此看来,引文分析被用于评价似乎顺理成章。但是,要追究引文评价的合法性,就要明确引文分析的基本功能及其在不同应用领域的适用性。

科学计量学家冲德(Zunde)在1971年指出,引文分析主要应用于三个领域:①对科学家、科学出版物和科学机构的工作状况、学术作用、地位进行定性和定量的评价;②追溯科学技术的发展历史;③用于文献情报的查找和检索。国内学者马费成、邱均平等也得出了类似结论。国内外学者都认为引文分析可用于评价,其他应用领域还包括科技史、检索、科学结构研究、用户研究等。

然而,确定应用领域的前提应该是明确其基本功能。本文认为,引文分析的基本功能是揭示科学和学科结构,这是由引文的实质决定的。科学文献的相互引用标识了科学发展的轨迹,体现了科学知识的累积性、连续性和继承性。任何新的学科或新的技术都是在原有学科或技术的基础上分化、衍生出来的,都是对原有学科或技术的发展。同时,由于科学的统一性原则,现有的各个学科之间又都是彼此联系、相互交叉、渗透的。这样,在科学文献体系中,文献之间必然存在普遍的相互联系,而这种联系突出表现在文献间的引证方面。引文分析就是研究这种引证关系的一种文献计量方法。鉴于引文分析的基本功能,可将其应用于以下领域:①描述科学、学科发展,判断科学、学科的运动和革命,识别新的发展趋势,为科研管理、学科建设服务;②追溯科技发展史,跟踪学科发展轨迹,为考察研究传统、学术传承、揭示科学发展规律服务;③为信息检索和文献情报服务提供检索点、检索途径和可视化界面;④为学科分类、期刊分类、文献分类和学术共同体的划分提供工具与方法;⑤为科研评价、学科评价、期刊评价、人才评价等提供参考。

在这5个领域中,前4个是直接由引文分析的基本功能得到的,引文分析在其中起到的重要作用无可争议。而第5个领域是在引文分析基本功能上的延伸,因此,应该明确引文分析在这个领域应用的局限性及分析结果的参考性。尤其是将引文分析用于评价,由于涉及到特定个体的切身利益,应该尤为慎重。具体来说,引文评价涉及两个方面的问题:①在评价中如何运用引文分析的结果,避免误用、滥用和过渡使用引文数据的问题;②如何使引文分析更加科学可靠,改进分析方法,增强其在评价中的适用性的问题。目前,这两个方面的问题都缺乏深入的研究和可行的举措,以至有些学者误将引文评价看成了,学术腐败的根源和“罪魁祸首”。下文仅对第二个问题,即引文评价方法的改进进行探讨。

2 社会网络分析在引文分析中的适用性

社会网络分析是一种全新的社会结构研究方法和社会科学研究范式。“社会网络”指的是社会行动者(social actor)及其间关系的集合。社会网络分析(so-cial network analysis)就是要建立关系模型,力图描述群体关系结构,研究这种结构对群体功能或者群体内部个体的影响。从20世纪30年代到60年代,在心理学、社会学、人类学以及数学、统计学、概率论等研究领域,越来越多的学者开始认真研究社会生活的网络结构,随即出现了各种网络概念,如中心性、密度、结构对等性等。

所谓科学引文网络,即通过引文将科学文献在时间维度(科学发展)和空间维度(学科联系)上编织成的不断生长的网络。换言之,科学文献之间的引证关系自然形成了引文网络,它表现出科学文献之间纵向继承和横向关联的交流态势。在文献的引用关系中,除了单一引用外,还存在两篇或两篇以上文献同时引用同一篇文献的“文献耦合”关系,或两篇文献同时被别的文献共同引用的“文献同引”关系。因此,引文网络可以演绎成以下三种类型:时序网络、耦合网络以及同引网络。举例来说,期刊引文网络、文献引文网络和作者引文网络分别以研究样本中的期刊、文献和作者为网络节点,节点之间的关系用箭头或连线表示,可以是引用关系,耦合关系或同引关系;引用强度、耦合强度和同被引强度用连线的长短粗细来表达。比如,文献时序网络是有向非循环网络,而作者同引网络是无向赋值网络等。

既然如此,引文分析的对象不应该仅仅是引文条目,更应该是引文网络,即将研究视角从单个引文节点转向引文之间的关系。基于网络结构关系的引文分析比基于条目的引文分析更加符合客观实际,在此基础上的引文评价也更加科学合理。

从引文网络的性质来看,社会网络分析在引文分析中具有良好的适用性。纽曼(M.E.J.Newman)将现实世界的网络分为4种类型:社会网络、信息网络、技术网络和生物网络。其中信息网络也被称为知识网络,最典型的例子就是学术论文间的引文网络。引文网络的结构能反映出在这些论文中知识(信息)的存贮情况,以及知识(信息)在这些论文中的流动、传播情况。当然,由于引文存在不同的动机,这在一定程度上反映了一种社会关系,引文网络也具有了一定的社会网络特征。这从社会网络分析的几个“元认识论”中可以得见:①行动者及其行动是互相依赖的单位,而非独立自主的实体;②行动者之间的关系是资源(物质的或者非物质的)传递或者流动的“渠道”;③网络模型把结构概念化为各个行动者之间的关系模型。

我们可以将社会网络中的“行动者”转换为引文网络中的文献、作者、期刊或单位等,其“行动”即“引用”行为,“关系”即“引用”与“被引”或“同引”等关系,传递的“资源”即科学知识信息。可以发现,在社会网络分析中对社会网络本质的认识一样也适用于引文网络。

因此,我们可以说引文网络属于复杂网络中的信息网络(或称知识网络),并且具有一定社会网络特征。社会网络分析中尤其是整体网络分析中的一些模型和方法,可以移植或经过改进后引入到引文分析中来。当然,这两种网络在性质上并不是完全对应的,比如,对于社会网络中个体间博弈关系的利用与测度方法就没有必要引入到引文分析中来。另外,利用社会网络分析法分析引文网络相对于分析社会网络的一个优势在于“引文关系的确定性克服了社会网络构建的主观性缺陷”。

3 社会网络分析对引文评价方法与指标的补充和改进

目前,多数引文评价研究大多关注文献的被引次

数,忽略了文献相互引用所产生的知识流动与传播效应。运用社会网络分析能够对引文网络的结构进行研究,利用节点之间的引用关系确定权重方案,从而区分不同引用的重要程度,还能够根据节点在引文网络中起到的作用,对其进行多元评价,有助于人们在复杂的引文网络中对节点做出客观的价值判断,在很大程度上弥补一般引文评价的局限。具体来说,社会网络分析可在以下几个方面对引文评价方法与指标进行补充或改进。

3.1 自动生成被引权重

引文评价受到学者质疑的一个重要原因就是认为其指标不能正确反映评价对象的质量。仅以被引次数衡量文献的质量不够充分,还应该考虑是否被重要文献所引用。传统的引文计量指标由于不加区分地给所有引文赋予同样的权值,而低估了一些具有潜在重要性的研究成果。社会网络分析法则提供了根据引用节点的重要程度自动生成被引权重的算法。例如,特征向量中心性算法原理即为一个节点的地位是与之相关的其他节点地位的一个线性函数。这样就通过迭代算法区分了不同引用的重要程度,在计算引文网络中每个节点的重要性时考虑了所有引用该节点的节点重要性,而不是仅考虑引用该节点的节点个数。

3.2 消除自引对评价的影响

很多情况下,在被引次数中剔除自引,能使评价结果在更大程度上接近客观事实。网络分析关注的是通过节点之间的关系所体现出来的节点特性,对于节点自引可以通过分析软件的简单设置消除其影响。当然也可以对包含自引和不包含自引的分析结果进行比较,从而考察自引对引文网络及其中节点的影响。

3.3 有利于开展分层评价

严建新和王续琨曾提到同一学科领域或研究方向的核心期刊往往不止一种,其学术水平也同样存在着差异。事实上,在学术共同体内,不同的机构或个人按学术水平高低对核心期刊所进行的排序,其结果通常是大同小异的。这表明,同一研究领域的核心期刊还存在着亚层结构,即通常所说的“权威”核心期刊和“一般”核心期刊。由于没有相应的分层标志,亚层的边界是模糊的。同样,非核心期刊也存在亚层结构,其边界更为模糊。

期刊的质量和学术水平有优良中差,其分层是客观存在的。对期刊进行分层也是科研管理的需要。但是目前的期刊评价体系并不能完全满足期刊分层的需要。其缺点有:①分层过于简单,一般除了核心期刊(来源期刊),就是非核心期刊(非来源期刊),不符合期刊分层所呈现的复杂情况;②确定层次边界较随意,一般遵循“二八法则”(文献集中分散定律),但也有的核心期刊表在确定核心期刊时人为因素过大,核心期刊数量与其基数比例失调。相比之下,社会网络分析法能够勘测期刊群的层次结构,并根据相应的算法自动确定层次边界或者根据对象的分层特点划分边界。例如,核心一边缘结构模型能够测度期刊引文网络的层次结构,根据其结构特点将期刊分为从核心到边缘的不同区域。笔者就曾利用该方法将34种经济学期刊分为了“超级核心区”、“亚核心区”、“半边缘区”、“边缘区”和“孤立区”5个区域,实现了基于引文关系的分层评价。在具体分析中,究竟分为多少个层次或区域以及每个层次或区域的命名都根据具体的网络结构确定。再如,角色分析能将在各学科子群中充当权威“知识源”、“中转站”和“储备库”等不同“角色”的期刊抽离出来,这种方法考察的是关系模式的相似性而不是数量的相似性,因此可对包含多学科、多主题的期刊引文网络进行分层评价,找出在各个学科、主题领域中起到不同作用的期刊。

此外,对于任何一个学科来说,无论是核心期刊数量、种类,还是期刊所处的层级都是不断变化的,即期刊存在着层际流动现象。核心期刊的周期性遴选可以在一定程度上反映这种情况。而如果利用核心一边缘结构模型进行分析,除此之外还可以体现孤立区的出现、半边缘区的扩大等整体网络结构的变化情况,借此根据节点相对地位的变动更好地评价期刊。

3.4 基于知识流通的评价指标

在引文网络中处于不同位置的节点,对知识传播的作用是不同的。传统的引文指标主要是用来区分节点影响力的。但是除了在引文网络中具有重大影响力的节点外,还有一些节点对知识的快速流动起到重要作用。而且,对于在不同研究领域的知识流通中起到枢纽作用的节点也应该在评价体系中有所体现,因为新的知识生长点往往存在于研究领域或学科领域交汇之处。从对知识流动产生的作用角度评价节点,能够弥补引文评价功能单一的缺陷。

拟增加的基于知识流通的评价指标有:中介中心度、结构洞约束系数和媒介角色系数,可总称它们为中介性指标。其中,中介中心度用于评价那些对知识的快速流动起到重要作用的节点,而结构洞约束系数和媒介角色系数用于评价节点的创新性。

首先是中介中心度指标。目前引文评价采用的是点度中心度指标。一个节点的人度点度中心度即是该节点的被引量。然而,节点的中介中心度计算的是某节点占据其他两个节点之间最短路径上的能力,即节点作为信息枢纽的能力。从理论上说,中介中心度高的节点在引文网络小世界特性的形成过程中起到了重要作用;从实践上说,中介中心度高的节点在学术交流与发展中起到的积极作用是不可忽视的,因此应该对节点的中介中心性给予相应的评价。并且,节点的影响力与该节点的中介作用应该分别评价,因为一个具有相对较小的点度中心度的节点可能在网络中起到重要的汇集、传递知识信息的作用。例如,经测度,在图书馆学情报学常用的16种期刊中,《图书情报工作》虽然在点度中心度中排名第三,但是其中介中心度远高于其他期刊,其中介作用非常明显。此外,在点度中心度排名中位次最高的《中国图书馆学报》,在中介中心度中仅列第十一位。

其次,来自结构洞理论的结构洞约束系数是衡量节点控制信息资源能力的指标。结构洞是围绕“局部依赖性”(local dependency)这个概念建立起来的。当两个点以距离2而不是距离1相连的时候,就说这两点之间存在一个结构洞。结构洞的存在使得连接两点的第三者扮演中间人的角色。拥有越低的结构洞约束系数的节点,越具有获取多样化知识的能力,是潜在的创新节点。

最后是媒介角色系数,它独具特色的地方是可以识别在子群内部或子群之间起到不同媒介作用的节点,其中包括对边界跨越者所作贡献的测度。那些从自己所在的子群连接到别的子群的节点往往在整个网络中发挥重要作用,这类节点被称为边界跨越者。他们通常是具有创造性的节点。因为他们能够从不同的群体中获得多方面的信息,因此能够综合不同的知识或思路形成新的创意。媒介角色系数与结构洞约束系数一样都是对节点创新潜力的评价,不同的是媒介角色系数适用于对已经分群的节点进行评价。

总之,这些从知识流通角度对节点进行评价的结构性指标为引文评价工作另辟一条蹊径。

3.5 促进分类评价

合理的评价基于合理的分类。社会网络分析法可从“关系”的视角对期刊、作者、研究领域等进行分群。现实世界网络的研究发现,无论是社会网络还是其他类型的网络都表现出群落结构。群落结构(communilystmcture)是指节点组中有密集的关联边,而组与组之间关联边的密集程度则要低得多。这种结构有重要的现实意义。例如,可以将引文网络分割为若干子群,分别代表特定的研究领域,此类研究对分析学术共同体等格外重要。许多学者提出了识别群落结构的算法,主要是层次聚类。然而基于图论的算法更具优势。从各种凝聚子群的算法原理可知,网络分析法是在网络的“关节处”切割网络,所得子群比聚类分析的结果更符合网络原貌。因此,基于网络理论的引文分析法更有助于合理分类,并可追究不同类别之间的相互关系及形成原因。

需要说明的是,评价不仅仅指排序,排序只是展示评价结果的方式之一。有些评价适合在定量分析的基础上采取定性描述的方式来表达。比如,对于归属明确的期刊采用分类排名的方法公布评价结果,而对于小学科期刊、跨学科期刊等可采取描述其在引文网络中的位置,在知识流通中起到的作用以及在相关学科中扮演的“角色”等来代替排名。

4 结语

在“中国科协第150次青年科学家论坛会议”上,陈定权博士从理论研究、应用系统和分析工具以及算法与数据来源方面将国内外同被引应用研究的情况进行了对比,总结出我国同被引系统研究的不足。他认为,应该引入社会网络分析理论,积极应用我国的引文数据,并与国外对比进行改进。岳洪江在一篇研究知识扩散网络的论文中也提到“引文分析只是为分析学科发展提供了一种基础数据,而社会网络分析可以利用这种引文数据揭示引文网络的结构特征,两者的结合可以成为一种有力的分析工具”。实际上,作为复杂网络理论中的独特领域,社会网络分析法具有普适性,不仅在同被引研究中,而且在引文分析和引文评价中都有其独特优势,应该得到重视和发展。国内的相关研究有必要针对目前引文分析在科研评价中的局限性,利用网络理论在认识论和方法论上的优越性,建立基于社会网络分析的引文评价理论与方法体系。

上一篇:基于解释结构模型的IT能力层级结构研究 下一篇:中文引文索引主题图的构建及其实现