基于文献管理软件NoteExpress的文献计量学研究的探讨

时间:2022-09-02 04:06:24

基于文献管理软件NoteExpress的文献计量学研究的探讨

〔摘要〕探讨以文献管理软件NoteExpress来做文献计量学研究。应用文献管理软件NoteExpress对大量源于不同数据库的文献信息进行有效归总,并利用其信息统计和分析功能对特殊主题文献进行计量学统计和分析,是一种关于文献计量学研究的简便工具。

〔关键词〕文献管理软件NoteExpress;文献计量学;研究工具

〔中图分类号〕G250.252〔文献标识码〕A〔文章编号〕1008-0821(2013)02-0101-04

文献计量学研究源自1969年,是美国目录学家Alan Pritchard提出的将数学和统计学的方法运用于图书及其他交流介质的研究的一门学科[1]。它是以文献体系和文献计量特征为研究对象,采用数学、统计学等的计量方法,研究文献情报的分布结构、数量关系、变化规律和定量管理的一门新兴的边缘学科[2]。通过文献计量学分析可定量地、深入地揭示学科动态发展变化规律,是科研人员和信息服务人员深入研究学科或专题的好方法。

进行文献计量学研究过程中,为保证统计文献全面系统[3],需要对源于不同数据库文献进行检索、汇总,因而会产生大量的文献数据,以往国内由于缺乏文献数据归总和统计的简便工具,导致文献计量学研究工作中存在着文献汇总困难、统计的文献数据不全面、统计方法繁琐等问题。基于上述困难,目前我国公开发表的文献计量学研究文章所研究数据来源仅是单种期刊[4-6]或少量期刊或单个数据库[7-16],少量源于多个数据库。文献收集齐全的文献计量学分析研究所用的数据归总后还要借助其它软件[17-20]才能进行文献计量学分析,操作过程比较繁琐。

本文介绍了在文献计量学研究中,如何巧妙利用文献管理软件NoteExpress[21](简称NE,下同)对源于多个数据库的大量文献进行归总、统计和分析,解决了以往文献计量学中存在的文献汇总困难、统计的文献数据不全、统计方法繁琐等问题,为文献计量学研究探索了一种简便、有效的新工具。

1文献管理软件NE及其文献计量学分析功能的介绍NE是北京爱琴海软件公司开发的文献检索与管理系统,其核心功能涵盖“知识采集、管理、应用、挖掘分析”等知识管理的环节。利用NE平台可把源于不同数据库的信息集中起来进行管理,保证了统计信息的全面性、系统性。在对文献信息进行全面汇总的基础上,再利用NE提供的信息统计功能对所采集的大量文献信息进行分析统计。

2如何利用NE进行文献计量学分析

2.1建立专题数据库

本文以“基于NE的文献计量学研究”为例阐述专题数据库的建立过程。在新建NE数据库前,先在电脑磁盘中建立一个文件夹,用于保存所有关于文献计量研究文献信息资料。然后利用NE的“新建数据库”功能建立了一个名为“基于NE的文献计量学分析”专题数据库,将其保存至磁盘中的“基于NE的文献计量学研究”文件夹中。为了防止操作过程中的数据丢失,研究者既可利用NE的“数据库备份”功能备份自己建立的专题数据库到目标文件夹中,也可选择“打开数据库时备份”或者“关闭数据库时备份”进行备份。

NE题录信息的采集有3种方式:一是过滤器导入方式;二是联机检索方式;三是手工建立方式。“过滤器导入方式”是指将数据库中检索出来的题录信息通过NE“导入题录”功能进行批量采集,该方式信息采集速度快、内容全面,适合大批量的文献题录信息采集。“联机检索方式” 指利用NE内置的常用数据库检索连接文件直接在线检索数据库,批量生成题录信息,该方式简单、省事,但受网络环境影响较大,适合在网速较快的情况下进行大批量题录信息采集。“手工建立方式”是指用手工输入的方式建立题录信息,该方式效率低、繁琐,不推荐使用。

由于从各大数据库导出的文献信息格式不尽相同,使用“过滤器导入方式”采集题录信息时,不仅要选择适当的题录保存格式,还要选择与题录保存格式相匹配的过滤器。笔者实践经验表明:维普中文科技期刊全文库(简称维普,下同)可选择全纪录格式保存;CNKI在总库中信息保存时选择“自定义”字段全选格式,在信息导入时选择“CNKI-Export(custom)"过滤器;万方学术期刊库(简称万方,下同)以NE格式保存较好,导入题录时用NE-万方过滤器;SciFinder(CA)在信息保存时选择“Tagged Format.txt”格式,导入时选择“SciFinder”过滤器;三大农业数据库(Agris,Agricola,CABI)、EI、SCI在保存时选择RIS格式,在信息导入时选择RIS过滤器。研究者若熟悉过滤器的编写规范,最好在数据库中选择最全的数据保存格式,并根据需要利用NE中的过滤器管理功能编辑出与全纪录格式相匹配的过滤器,这样导入NE后的信息内容比较全,不用在题录信息导入后还考虑缺失字段补全等问题,简化数据处理过程。

2.3文献的除重

文献的惟一性是正确进行计量学分析的基础。由于不同数据库收录的文献范围既有交叉又有不同,因而源于不同数据库的NE中的信息也会有重复的内容。在NE中可直接利用“查找重复题录”功能对所有的信息进行除重,保证单一信息的惟一性。在的过程中,待的字段可根据用户需要而个性设定,NE默认的字段有题录类型、作者、年份、标题4个字段。选择好目标文件夹、字段及选项内容后,直接点击“查找”即可对目标文件夹内容进行查找,见图1,而后直接一次性删除重复内容即可。

11图1NE中文献的除重11

2.4文献题录信息的适当修正、补全

主题统计和分析是文献计量学研究的重要指标之一。导入NE中的所有文献题录均无主题字段,进行文献计量学分析时,可通过关键词词频统计,或者通过阅览全文自行对研究内容做人工判定,对主题字段进行补全后才能进行主题分析。建议研究者先用NE对关键词进行词频统计,观察统计结果中同义词情况,再用NE的批量替换功能把所有同义词均替换成其中的一个同义词,而后利用NE统计功能进行统计,在整个统计过程中,尽量减少人工逐条修正工作,多利用计算机及NE各种功能对信息进行处理,既减少了操作的繁琐度,提高了工作效率,也减少了信息信息处理的失误率。为了便利研究者对全文进行阅览以便准确把握文献主题,也为了以后更方便管理和查找文献,NE中的每条文献最好都有链接有PDF或CAJ等格式的全文。全文可通过数据库下载后保存在“课题文件夹”中,最后利用NE“批量链接附件“功能来批量链接,但这个工作量比较大,耗时较长,过程繁琐。在实际应用过程中,本文作者通过实践摸索出了一个省事、省时的全文链接办法,下面以CNKI为例来阐明全文直接下载、链接过程:全选NE中的所有需要下载全文的文献检索(工具栏)下载全文选择全文数据库CNKI点击下载之后,NE会自动从数据库中批量下载、链接全文,而后研究者只要保证网络畅通即可,不用再理会下载过程,等下载完全后关闭下载平台即可,见图2。研究者可酌情决定具体从哪些数据库下载全文。

2.5对文献进行文献计量学分析

NE提供了一个“文件夹信息统计”功能,利用此功能可对文献进行计量学统计、分析。NE中设置的可统计字段包括文献类型、作者、年份、期刊、作者机构、主题、基金类型等共有55项,研究者在实际统计过程中可以根据分析需要选择合适的需要的字段,也可以根据需要自行增添统计字段。在NE操作界面,选中需要进行统计分析的专题数据库,在工具栏打开文件夹,选择文件夹信息统计,系统会弹出一个文件夹统计信息界面,研究者在界面“字段”栏内可根据需要,选择题录类型、作者、年份、期刊等字段,点击统计,NE会自动对所选的专题数据库中的所有内容按需要分析,见图3,利用word或EXCEL对统计结果进行表、图表示。

文献计量学分析通常会以图或者表的形式把信息内容表达出来,以方便研究者或读者进行直观的理解和分析。在NE中,统计后的数据可以以“另存为”(见图3)的方式保存在课题文件夹中,而后再直接导入EXCEL或word中根据研究者的需要以图或者表的形式表示出来,示例见图4。图4是本研究者通过NE对源于三大中文期刊数据库:维普、CNKI及万方中研究文献计量学的4 296篇期刊论文的年份统计。由图4可以看出:我国自1981-2011年30年期间,有关文献计量学分析的文献发文量基本上呈逐年增长的趋势,发文量在2010年达到历史最高,共有488篇,说明我国研究者越来越认识到利用文献计量学深入研究学科或专题的重要性。同理,研究者还可以通过NE对作者、期刊来源、基金类型、作者机构、主题等内容作系统而方便的统计分析,为科研工作者深入地认识和研究课题提供更高质量、更有深度的文献信息服务。

图4我国有关文献计量学研究的年度发文趋势

3展望

利用文献管理软件NE对海量信息进行有效归总和统计分析是一种进行文献计量学研究的方便的、行之有效的新工具。它的使用让文献计量学的研究不再是繁琐的、属于少数人的专利,任何研究者都可以利用它来对自己感兴趣的学科、课题或专题进行高质量的文献计量学研究。高校信息服务人员更应该充分利用NE这一功能来有效提高科技查新、专题服务、读者培训等信息服务,拓展信息服务深度,并借助NE便利的文献归总和数据统计功能撰写出更多的有关专题或学科的文献计量学研究的文章,在提高信息服务质量的同时为我国文献计量学研究的发展贡献自己一份力量。

参考文献

[1]A P.STATISTICAL BIBLIOGRAPHY OR BIBLIOMETRICS[J].Journal of Documentation.1969,25(4):348-349.

[2]邱均平.文献计量学[M].北京:科学技术文献出版社,1988.

[3]董琳.学科评价之文献计量数据准备[J].情报理论与实践,2010,(6):49-52.

[4]唐纪元,尹衍玲,李娜.《中华实验和临床感染病杂志(电子版)》2007至2009年文献计量学分析[J].中华实验和临床感染病杂志(电子版),2011,(1):108-111.

[5]赵莹,张家琦,郭向飞.2008~2009年《中国健康心理学杂志》文献计量学分析[J].农业图书情报学刊,2011,(2):81-83.

[6]高丹.2009年《图书馆理论与实践》的文献计量学分析[J].科技情报开发与经济,2011,(2):70-73.

[7]朱巧玲,李潇捷,指导,等.1999-2009年国内神经性皮炎文献计量学研究[J].河南中医,2011,(3):302-303.

[8]赵庆龄,路文如.中美土壤重金属污染超富集植物文献计量分析——以印度芥菜为例[J].中国农学通报,2011,(4):370-375.

[9]张稚鲲,李文林.古籍数字化建设的文献计量学研究[J].图书馆理论与实践,2011,(2):45-51.

[10]张燕,王婷,孙成权,等.国际青藏高原及其周边地区研究文献计量分析报告(2003-2008年)[J].地理科学进展,2011,(3):369-378.

[11]管永昌.基于CNKI的我国图书馆信息服务平台研究文献的文献计量分析[J].科技情报开发与经济,2011,(8):25-28.

[12]孙涵雪,刘旭峰,许昌泰.PubMed数据库中(1979~2008)飞行员与心理疗法文献计量学分析[J].医学综述,2011,(2):297-300.

[13]李红阁,吕建新,倪崖.1989-2009年国内白癜风研究文献计量学分析[J].温州医学院学报,2011,(1):90-92.

[14]查先进,曹晨.近20年我国信息资源配置研究文献计量分析[J].图书情报工作,2010,(20):6-10.

[15]周宇梅,王丽琳.2001-2005年我国保险学文献计量分析[J].图书情报工作,2007,(3):137-139.

[16]唐勇.我国图书馆虚拟咨询相关研究的文献计量分析[J].现代情报,2011,(1):97-99.

[17]马秀文,和艳会.采用文献计量法分析我国蝴蝶兰研究现状与发展趋势[J].安徽农业科学,2011,(6):3761-3762.

[18]张晓鹏,朱晓宇,刘则渊.国际公共危机管理研究的文献计量学分析[J].科学学与科学技术管理,2011,(3):117-121.

[19]郑巧玲,黄汉林,黄永顺,等.从文献计量学角度评析国内三氯乙烯职业病危害防治研究状况[J].中国职业医学,2011,(1):17-20.

[20]张燕蕾,沈霞,陈大方.抗精神病药与2型糖尿病相关关系的文献计量学研究[J].中国药物依赖性杂志,2011,(1):65-68.

[21]NoteExpress 在线教程[EB/OL].http:∥/,2012-6-15.

上一篇:2001—行政管理研究热点、主题及方法演化 下一篇:善用新媒体,开拓公共文化服务的新空间