我国社会科学学者引用博客文章情况实证分析

时间:2022-08-10 10:40:07

我国社会科学学者引用博客文章情况实证分析

[摘要]利用中国社会科学引文数据库对我国社会科学期刊论文引用博客文章的语种、时段、学科、主题、作者、可追溯性进行统计,考察我国社会科学学者引用博客文章的主题分布、学科分布、作者分布情况和博客参考文献的稳定性,旨在探索我国社科学者对博客学术资源的利用及交流规律,为了解现代学术交流环境中学者的信息行为及开发博客资源为学术研究服务提供参考。

[关键词]引文分析 引文行为 博文被引 学术交流

[分类号]G252

1 前言

博客作为一种新的信息出版、传播、交流媒介,为学者们提供了自由、平等、开放、快捷的学术交流平台。借助于博客学者们可以不受时间、地理位置和社交结构的限制,跨越年龄、资历、师承、专业等障碍,随意而又极具专业性地在网络上发表和交流各种学术信息。学术交流的这种变化,从形态上看是极具革命性的;其内容也是非常丰富的,包括科研感悟、经验、心得、发现、研究资料、数据、成果、进展等通过其他渠道不易获取的隐性和显性学术信息。近年来,国内关于博客研究的成果非常多,目前它是传播学、教育学、图书情报学的研究热点,研究内容主要集中在博客的概念及功能、博客作为新闻媒介的传播意义、博客的商业运营、博客在教育中的应用、博客在图书馆中的应用等方面。国外学者更侧重于对于博客用户及其行为进行研究,Hsu cL等对激发人们参与博客活动的动因进行了分析,即易用、社会影响和知识分享;Rachael K.F.Ip调查并研究了博客用户行为;sujin Kim等分析了癌症博客用户的特点及使用动机。关于网络学术资源的影响及用户行为的研究也有报道,Kousha K.研究了开放获取的社会科学研究成果的网络影响因子;Rowlands R.综述了近10年来电子期刊用户行为。但关于博客资源之学术影响的研究还未见报道。

本文将利用CSSCI数据库对我国社会科学期刊论文引用博客文章(简称“博文”)的情况进行实证分析,调查研究被引博文的数量、语种、时段等,考察我国社科学者引用博客文章的主题分布、学科分布、作者分布和跨学科信息交流情况,探讨我国社科学者对博客学术资源的利用与交流规律。

2 数据来源与处理

本文以中国社会科学引文索引(CSSCI)数据库为数据源,抽取我国社会科学期刊论文引用博客文章的数据,对我国社会科学学者引用博文情况进行分析。根据中外博文IP地址的特征,在被引文献中检索含有“blog”或“bokee”,即引文为博文的条目。数据对象覆盖时段为2002―2006年,数据采集和在线检测可获性的时间为2007年9―12月。

数据的获取方法:首先在中国社会科学引文索引数据库选择页上点选2002―2006年库,并选择“被引文献”选项,在被引文献检索界面中,在“被引文献期刊”检索框中输入“blog”或者“bokee”,检出被引文献为博文的条目771条,被引次数为780次;有些博客地址中不含“blog”或者“bokee”,但常含有“archive”,输入“archive”,选择文献类型为“电子文献”,检出380条,排除非博客文献,得到被引博文条目22篇/23次。共检出被引文献为博文的条目793条,被引次数为803次。将检索结果导入Excell数据表中进行处理,并对检出的全部被引博文逐一在线访问,记录其学科、题名、关键词、语种和是否可获,并使用Excell数据表对结果进行处理和统计分析。

3 我国社科学者引用博文数量、时段及语种

3.1 不同时段我国社科学者引用博文数量

从不同时间段我国社科学者引用博文的数量,可以看出学者在不同时段对博客的关注度和利用率。表1列出了2002―2006年我国社科论文引用博文的篇数和次数,数据表明,2002年我国社科论文引用博文数为0,自2003年起才开始引用,2003―2006年中均出现了博文参考文献,而且引用数量逐年增加,每年引用量增加一倍有余。即我国社科学者自2002年博客引入中国后才开始利用博客资源,并且关注度和利用率呈逐年上升趋势。

表2列出了CSSCI数据库中2003―2006年论文引用各类文献篇/次数,博文被引总篇次为793篇,803次,而期刊论文被引712453篇,908258次,相比于其他形式的文献,尽管博文引用量在逐年增加,但引用量仍然非常少,其绝对值还是很低的。可以说我国社科学者对博文资源的关注度和利用率是很低的。

3.2 被引博文语种

在被引的788篇博文中语种为中文的有684篇,英文的为91篇,其他语种为O篇,由于链接无效而无法确定语种的有13篇(对于无法访问,但通过网址能确定是中文网站的归入中文)。可以看出我国社科学者引用的博文语种绝大多数为中文(其中少部分为繁体中文),所占比例高达87.86%;英文是第二大被引用语种,占10.44%;我国社会科学学者引用其他语种博客文章为0,说明我国社科学者对其他语种的博客资源利用率极低,为0。

4 引用博文学科分布及学科交叉引用

为了确定哪些学科、主题的博客资源更多的受到我国社会学者的关注和利用,又是哪些学科的论文引用了这些博文,笔者对被引博文学科分布和引用论文学科分布进行了统计分析。首先,根据被引博文内容特点以及中图法社科学科分类法,将被引博文学科划分为以下学科大类:哲学、社会学、政治、法律、经济、文化、教育、语言文学、艺术、信息技术、传播、管理、图书情报、科学和工程,并依据被引博文和引用论文题名与内容将其归入相应学科,被引博文及引用论文的学科分布的情况如表3所示:

4.1 被引博文学科分布

博客文章被引表明其具有学术影响力,而引用其他学科博文表明对其他学科知识的引入以及学科间信息交流。从被引博文所属学科及引用论文学科统计结果可以看出,图情学博文被引用次数最多,为158篇次,但这些引用主要来自本学科,其他学科引用图情学博文的比例非常低,仅为2.2%。这说明图情学学者由于其职业敏感和优势,对信息与新的交流传播方式比其他学科学者能更快速地了解、接受和应用,建有许多学术博客,发表很多博文,并有许多本学科学者利用了这些有学术价值的博文;然而,图情学博客的学术影响力较低,很少被其他学科关注和引用。博文被引量排在第二、三位的是信息传播学(145篇次)和信息技术(102篇次),这两个学科由于本身是研究新传媒及其支撑技术的,有很多专业性较强的信息技术类博文,因而得到广泛的关注和引用。教育学由于大量教学博客的存在以及利用博客进行教学和电化教育研究较多,所以其博文被引数量排在第四位,这些引用主要也是来自本学科。排在第二梯队的是政治、经济、法律三个学科,这三个学科的博文涉及许多社会关注的热点话题,而容易被引用。艺术和社会学方面的博文被

引最少,原因大概是这两个学科的学术博客很少受到关注。

4.2 引用论文学科分布

从引用博文论文所属学科的角度来分析,图情学论文引用博客文章的量最大(264篇次),且广泛地引用了其他学科的博文,特别是IT和传播学方面的博文,对于IT博文的引用量远远超过其学科内部引用。这种情况,一方面说明图情学对其他学科知识的广泛吸纳;另一方面也反映了图书情报学学科体系的不紧密,主要表现在无筛选的引入或借用其他学科的新概念、方法和技术。布朗定义学科相对紧密性的根据之一就是学科杂志引证所涉及其他学科杂志的数量,引伸到电子资源来,可以理解为对其他学科电子资源的引用数量,图情学引用其他学科的博文数量最多,其学科严密性较弱。

其他引用博文论文较多的学科依次为传播学(85)、教育学(73)、法律(54)、政治(38),说明这些学科的学者阅读和利用博客资源较多,对博客资源有较高的关注度和利用率。

4.3 跨学科交叉引用情况

与传统的期刊论文引用相比,博客学术资源的跨学科交叉引用比例是相当高的,接近50%。表3中左上到右下的对角线上是学科内部引用的次数,学科内部引用总次数为392次(除去学科不详的),跨学科引用次数为353次,跨学科交叉引用率为47.38%。从学科交叉引用次数可以看出其学科相关度,表3中以对角线上内部引用次数为中心,其斜对角的对称位置上是学科交叉引用的次数,可以看出,只有经济与法律、管理的相互引用率即相关度较高,其余的都是一个学科被另一学科单方引用较多。

5 被引博文作者分析

由于参考文献著录不规范以及博客匿名等原因,只有497条引文给出了被引博文的作者信息,47.33%的引文没有标出博文作者。被引博文的作者分布是既分散又相对集中(见表4),497条被引博文共涉及348位博客文章作者,人均被引次数为1.43,其中被引1次的共有296位作者,即85%作者的博文仅被引1次,说明博客文章被引分布总体比较分散;而被引超过3次的有16位作者,总被引122篇次,即占作者总数5%的高被引作者被引次数占总被引次数的近1/4(24.55%),小部分作者博文被引篇次比例较高,相对集中。另外,被引次数最高的作者是图书馆学学者老槐(21),其次是博客研究创始人之一方兴东(17),这两位都是学科学术研究的权威人物,因此,可以说与期刊论文引用一样,学术博客博主的学术声望也是影响被引篇次的因素之一,当然其博客文章的质量、可靠性较高是引发被引用的主要因素。

6 被引博文篇名关键词分析

篇名最能够表达文献论及的事物,篇名关键词是文章核心内容的浓缩和精炼,因此,对被引博文的篇名关键词的词频分析,可以客观地揭示目前社会科学家关心、关注的博文主题分布。本文从被引博文篇名中提取与主题相关的关键词,给每篇博文1到2个关键词,如给予博文“我国弱势群体的形成与特征”的关键词为“弱势群体”。在645篇给出篇名数据的条目中,共计获取788个关键词,并对其进行统计分析(见表5)。可以看出,关于博客、信息技术、图书馆、教育、传媒等主题的博文最受关注,其中关于博客(93)、图书馆(49)、RSS(24)、知识产权(18)和开放存取(15)的博文被引篇次最多,仅次于他们的是传媒(12)、互联网(9)、学术出版(7)、web2.0(6)。同时,从篇名关键词可以看出,尽管引用次数不多,仍有大量关于新概念和热门话题的博文被引用,如篇名中含有trackback、企业wiki、社会交换理论、主题地图、自然文学、宗教快乐、风险投资业、高校学术作假、生态文学、文化退化等关键词的热点话题博文均被引1次。可见,主题和内容新颖、具有前沿性与启发性的博文容易被社会科学家所引用,这也正是博文相比于其他类型文献的优势所在。

7 被引博文的可追溯性

考察博文参考文献的可追溯性,即根据引证文献的标著获得参考文献的内容,可以获知博客资源的稳定性、可靠性。本文对被引的793条博文进行在线链接,测试是否能够获取博文全文。经逐一在线访问后确定共有361条被引博文可获,431条被引博文不可获,可获率仅为45.52%,可追溯比率非常低。不可获的原因很多,主要包括作者标引不规范、拼写错误、博客搬家、文章被删除、服务器关闭等,如IP地址应为半角状态的被写成全角,“/”被误写为“,”以及明显的单词拼写错误等。博文如此低的可追溯性将会影响引文链的连续性,也必将影响学者对博文的引用,学者们会选择性地引用持续稳定且声誉较高的学术博客的博文,以保证引文的可获性。

另外,国内论文博文参考文献标引不规范现象非常普遍,很多博文参考文献仅提供IP地址。相对来讲,国外对博客参考文献标引要求的比较严格,美国医学图书馆的在线图书Citing medicine给出的引用博客的标准格式值得参考:Bernstein M.Bioethies Discussion Blog[Internet].Los Angel-es:Maurice Bemstein.2004 Jul一[cited 2007 May 16].A―vailable from:http://bioethicsdlscussion.省略/.(即作者.题名[媒体类型].出版地:出版者.出版日期一[引用日期].获得地址.)

8 结语

科学家的世界有着特殊的交流结构,随着传播媒介和传播方式的改变科学家也会相应地改变原有的交流模式。博客作为一种分享知识和思想的新媒介,对许多学科领域产生了重要而深远的影响,且逐渐的被学者们所接受和利用。总体来讲,我国社科学者对博文这种新型资源的关注度和利用率还较低,不过不同学科之间的知识借鉴(相互引用)还是较多的,特别是一些关于新概念、新技术的博文被广泛地引用。图书馆员作为训练有素的科学家,学者信息行为是其重要研究内容,台湾学者赖鼎铭在其“中国大陆使用者研究现状”调研中发现,国内图书馆学者关于信息行为的研究相对缺乏。我国图书馆学界应加强对服务对象及其行为的向外型研究,减少“自己人研究自己人”的向内研究,以更好的为教学科研服务。

上一篇:卓越描绘:一种对卓越科学机构进行评价的方法 下一篇:团队 技术 创新