近年来我国关联数据的研究进展与分析

时间:2022-07-31 09:11:53

近年来我国关联数据的研究进展与分析

摘 要:文章以CNKI的中国学术期刊网络出版总库为文献来源,对近年来我国关联数据的年载文量、文献来源、著者、研究机构、关键词和被引频次等进行计量与分析,对我国近年来关联数据的研究特点进行了总结。

关键词:关联数据 文献计量 CNKI

中图分类号: G250.252 文献标识码: A 文章编号: 1003-6938(2013)06-0127-03

1 引言

关联数据(Linked Data)概念由万维网发明者蒂姆·伯纳斯—李(Tim Berners-Lee)于2006年首先提出。关联数据概念自提出以来受到了计算机科学、信息科学和图书情报学等领域专家学者的普遍关注。

2 我国关联数据的研究进展与分析

2.1 数据来源

2008年12月在上海召开的“数字环境下图书馆前沿问题研讨班”会议上关联数据概念首次被引入国内图书情报学界。随着时间的推移,国内对“关联数据”的关注度也逐渐高涨,这一趋势从文献的发表数量的逐年增长情况中可窥一斑。本文以中国知网(CNKI)的中国学术期刊网络出版总库为文献来源数据库,选取2008—2012五年间有关“关联数据”的论文进行计量统计,旨在反映国内学术界对“关联数据”的研究现状以及趋势。

具体检索策略为:“关键词”=关联数据,时间为从2008年到2012年,同时选择“中英文扩展”进行检索,共检索到文献117篇,检索时间2013年1月6日。通过对检索结果进行精炼除去一些会议通知等错检项后,得到论文111篇。

2.1 论文年度分布及来源分析

对一段时间内某主题领域的文献的发文量进行分析可以了解该主题领域的发展情况。通过统计,2008年关键词为关联数据的论文数量只有4篇,而发展到2012年已经增长为61篇,图1为论文发文量的年度分布柱形图。

论文数量的快速增长,从一定程度上反映出国内学术界对于“关联数据”的关注程度在逐年提高。2010年至2012年这段时间,每年的论文数量几乎呈直线增长。

通过对刊载关联数据相关文献的来源期刊的统计分析,可以发现刊载关联数据研究信息的期刊相对集中,111篇文献分布于48种期刊中。

图2为利用CNKI文献分析功能统计的关联数据文献主要来源分布情况。其中《现代图书情报技术》、《图书情报工作》、《图书馆学研究》、《中国图书馆学报》、《图书与情报》、《情报理论与实践》这6本杂志刊载关联数据论文较多,其刊载论文的数量占了总数的53.15%,而且这6种期刊均为南京大学中国社会科学研究评价中心公布的中文社会科学引文索引(CSSCI)2012—2013来源期刊。统计结果显示,目前国内学术界关于关联数据的研究主要集中在图书情报学领域,且高质量的研究成果较多。

2.2 著者及研究机构分析

2.2.1 著者分析

在检索得到的111篇关联数据文献中,通过EXCEL软件统计功能进行统计,一共有作者229名(包括第二、第三等合著作者)。所有文献的合著情况见表1。

通过计算,可以得出关联数据研究文献的合作度为2.063,合作率为0.558。其中一人独著论文数量最多,达到49篇,占总论文数量的44.14%。

通过人工筛选和EXCEL软件统计,111篇关联数据文献中,发文量最高的著者发文4篇,表2为发文量较高的著者。根据普赖斯理论[1],核心著者的计算公式为:m=0.749× (公式中 nmax为发文最多的著者论文数,m为核心著者最低发文量)。通过计算得到m的值为1.498,因此在目前国内关联数据研究领域,核心著者群体应该是发文量在2篇以上的著者。关联数据作为新兴的概念,引入国内时间较晚,该领域的研究正处于蓬勃发展的时期,相关研究文献数量不断增长,其核心著者群也将不断壮大发展。从本文统计的数据中,可以看出目前关联数据研究核心著者群集中于图书情报学界,在发文量大于2篇的著者中,多数为图书情报学界知名的学者、教授。

2.2.2 研究机构分析

对第一作者的研究机构进行统计分析,可以发现关联数据领域研究中一些高产的科研机构。分析的原则同一科研机构不同的部门归为一类,统一命名为同一机构名称[2]。本文利用CNKI文献分析功能对所检索文献的第一作者单位进行了分析统计,发现中科院国家科学图书馆(14篇,占12.4%)、中科院研究生院(10篇,占8.8%)和上海大学、武汉大学及中信所(都为6篇,占5.3%)为关联数据的主要机构。

可以看出目前国内关联数据研究主要集中在大型图书馆和高校。大型图书馆以中科院国家科学图书馆和上海图书馆为代表,两个馆合计发文量为20篇,占总文献量的17.7%。发文量较多的高校主要有:中科院研究生院10篇,武汉大学6篇,浙江大学5篇,四川大学4篇,南京大学4篇,占总文献量的26.1%。高校具有较好的研究氛围,同时发文量较高的这5所高校均设有图书情报专业的硕士或者博士点,图书情报专业优势明显,许多专家、学者、教授在承担相关的课题研究,从而极大地推动了关联数据研究的发展。

2.3 关键词分析

关键词是一篇文章的精髓,通过凝练的词语来表达文献主题内容。通过对文献关键词的统计分析,可以反映出某一研究领域的研究热点问题。除去“关联数据”这一关键词外,表3为关联数据论文中的高频关键词。

通过对高频关键词的归纳分析可以看出目前国内关联数据研究有以下两个特点:

(1)图书馆是关联数据研究和应用的主要阵地。在检索结果中,有21.6%的文献以“图书馆”作为关键词。图书馆作为信息收集、组织、处理和再创造的专门机构,具有应用与研究关联数据得天独厚的有利条件,图书馆的MARC数据、词表数据、规范数据等均可开放为关联数据。

(2)对关联数据研究主要集中在国外研究现状介绍、发展趋势讨论和应用前景展望等理论层面,实际应用层面研究相应较少。语义网(语义web)、数据网络、开放数据、本体、RDF、URI等都是关联数据、实现的基本条件。在检索结果中,一部分高被引,高下载的综述性文章也体现了国内关联数据研究领域的这一特点。如黄永文的在《现代图书情报技术》2010年第5期上发表的《关联数据在图书馆中应用研究综述》[3],被下载817次,被引用31次,主要侧重于关联数据在图书馆角度的应用;沈志宏、张晓林在《现代图书情报技术》2010年第11期上发表的《关联数据及其应用现状综述》[4],被下载712次,被引用25次,主要介绍了关联数据技术实现的核心技术,侧重于技术发展和实现的可行性。

2.4 被引频次分析

单篇文献的被引频次往往反映了该文献的质量以及其学术影响力。通常情况下,文献的被引频次越高,则代表其论述的观点在学术界内被认可的程度越高,其研究受到同行的关注度越高。同时,高被引文献也反映了某一学术领域的研究热点。统计发现,关联数据的基本概念、实现技术、研究现状和应用展望目前国内关联技术研究领域的热点,文章被引频次也较高,如黄永文的《关联数据驱动的Web应用研究》(31次)、沈志宏,张晓林的关联数据及其应用现状综述(26次)、刘炜的《关联数据:概念、技术及应用展望》(25次)、潘有能,张悦的《关联数据研究与应用进展》(13次)等。

3 结语

本文通过对年载文量、文献来源、著者信息、研究机构、关键词和被引频次等方面的文献计量分析,来揭示近五年国内关联数据领域的期刊文献的研究现状和研究热点。结合本文的数据分析,关联数据研究主要有以下特点:

(1)研究处于发展初期。主要表现在年载文量的增长情况上,从论文年度分布图可以看出2008年关联数据相关论文只有4篇,而到2011年则有34篇,2012年61篇,文献数量近似指数增长,体现了文献信息的逻辑增长规律,反映了学科研究初级阶段文献数量激增的特点。

(2)研究群体集中。从著者的单位以及文献主要来源等数据分析结果显示,国内对关联数据进行研究的群体主要集中在图书情报领域,集中在图书情报专业期刊上。目前,国外关联数据的研究与应用领域非常广泛,在大型传媒、商业企业、政府部门、图书馆、学术出版、网络搜索引擎等都有涉及。因此,如何实现学科之间的交叉渗透,来拓展关联数据研究的广度与深度,是值得国内学者深入关注的问题之一。

(3)理论层面研究较多,实践应用层面研究相对较少。从高频关键词以及高被引文献的统计结果显示,目前国内关联数据研究的主要热点集中于关联数据国外研究现状介绍、发展趋势讨论以及应用前景展望等理论层面的研究,实践性、操作层面的研究文献相对较少。将结构化的数据到网上实现关联与共享、构建数据关联的语义数字图书馆、利用关联数据的特点拓展图书馆的服务等命题随着关联数据研究的深入可以成为实践层面深度挖掘的方向。

参考文献:

[1]邱均平.信息计量学[M].武汉;武汉大学出版社, 2007:191-195.

[2]郝屹.近五年竞争情报研究的文献计量分析[J].情报学报,2012,(12):1907-1910.

[3]黄永文.关联数据在图书馆中应用研究综述[J].现代图书情报技术,2010,(5):1-7.

[4]沈志宏,张晓林.关联数据及其应用现状综述[J].现代图书情报技术,2010,(11):1-9.

作者简介:牛筱桔,女,中国美术学院图书馆研究馆员。

上一篇:体现“从生活走向物理”的教学设计 下一篇:社会风险分配失衡的社会资本矫正