作者关键词耦合的信息素养论文

时间:2022-10-04 05:06:35

作者关键词耦合的信息素养论文

1数据来源及研究方法

1.1数据来源为了从图书情报学人视角揭示我国信息素养研究领域的结构及演化,在数据收集时我们选定的期刊源是《中文核心期刊要目总览》(2012版)收录的图书情报与数字图书馆类核心期刊。根据选定的期刊源,本研究使用CNKI中文学术期刊网络出版总库进行数据收集,检索时间段为数据库收录起始时间到2013年12月31日。通过对各种检索方法、检索词、检索式及不同检索结果选择分析,最后确定在CNKI中文学术期刊网络出版总库高级检索中输入检索条件为:“主题=信息素养OR主题=信息素质OR主题=信息能力”;期刊来源类别中选择“核心期刊”;学科领域选择“图书情报与数字图书馆”,得到论文1190篇,其中有作者的论文共1176篇,这1176篇论文就作为本研究的样本数据。

1.2研究方法与工具

1.2.1耦合分析作者关键词耦合分析因为开始研究的时间不长,所以在数据处理时没有固定的做法。笔者认为在进行作者关键词耦合分析时,耦合关系强度的计算、领域内代表性作者与关键词的选择对结果影响最大。现针对本实例进行方法上的探讨。(1)耦合关系强度的计算耦合关系强度的计算是作者关键词耦合网络结构测算的核心问题。基于关键词的作者耦合强度算法有很多种,主要表现在矩阵中元素的取值方法。主要有绝对耦合强度法[4,7,11],包括去重关键词集合交集法,该法是将两作者关键词集去重后再计算交集的次数并视其为两作者的耦合强度值;最小耦合值加权算法则考虑关键词重复,将关键词重复计数,取作者对在同一关键词上较小频次值,然后进行累加。相对耦合强度法[9,12],主要包括对作者耦合次数进行标准化运算后转化为相似性系数在[0,1]之间的相对关键词耦合强度算法以及Jaccard相似度算法与TF/IDF相似度算法。邱均平研究团队在论文中论证了最小耦合值加权算法更能反映作者间的实际相似程度,因此本文在绘制作者关键词耦合网络时采用了最小值法[8]。在进一步进行因子分析时利用了相对关键词耦合强度算法。本研究在构建作者关键词耦合网络时统计了非第一作者,这就造成合著文献作者间必然存在一定数量相同关键词,即存在关键词耦合。现有的做法是排除合著文献,但是笔者认为这样做必然减少了排除文献的作者与其他作者之间的耦合关系。我们的做法是在包含非第一作者情况下做出耦合矩阵,再减去合作作者的关键词耦合值。如作者A与B合著2篇文献,一篇文献包含3个关键词,一篇文献包含2个关键词,那么在最小耦合值加权算法下得到的耦合矩阵中在相应的作者A与B的耦合次数中减去(1*3+1*2),之后这个值就是作者关键词耦合矩阵中作者A与B的最终耦合值。(2)关键词的选择目前,利用作者关键词耦合分析学科结构的数据基本都来自某类期刊的全部论文。笔者在以具体领域为研究对象开展作者关键词耦合分析时发现某些检索时输入的主题词在输出文献的关键词数据中存在频率很高的现象,这些高频关键词加上非标识文献内容、标识过于模糊的关键词使得最终矩阵在探测领域内代表作者及领域结构时出现重心偏移。输入主题词如信息素质、信息素养以及非标识文献内容关键词对于揭示信息素养领域内知识结构没有实质性作用,并使因子分析时主要因子被解释为信息素质、信息素养、高校图书馆、图书馆等,从而影响了分析结果的揭示功能。所以笔者在分析时去除了这些关键词。(3)代表作者选择作者关键词耦合分析中选择多少代表作者没有标准化的做法[13],张志强等认为在以作者为分析单元的研究中,一般选择的作者数量为100~120人。笔者认为这样选取也符合作者关键词耦合及因子分析可视化的需求。所以笔者在数据样本中提取作者发文数大于1的218人以及词频大于3的159个关键词,在218位作者关键词耦合矩阵中计算每个作者与其他作者的耦合频次总和,保留排名前100的作者,使其成为100位代表作者的耦合矩阵。

1.2.2因子分析利用SPSS软件进行因子分析,因子抽取选择主成分分析(PrincipalComponentAnaly-sis,PCA),通过观察累积方差确定因子数量,并通过观察因子内作者载荷对因子命名[14]。因子旋转的主要方法有正交旋转、斜交旋转,因为某一具体研究领域内的各个研究主题之间必然存在联系,所以在因子旋转上笔者采用斜交旋转对初始因子进行旋转,并选择特征值大于1的因子。最后将因子作者载荷矩阵导入Ucinet进行可视化分析。

1.2.3社会网络分析方法及可视化社会网络分析法其本质是用数学的思维分析和技术分析推导产生的成体系的数学分析方法。Newman认为社会网络分析方法避免了网络规模受限、数据处理理想化、数据获取主观性等弊端,是研究作者间关系的理想方法[15]。因子结构的可视化主要有表格形式、多维尺度图谱[13]以及通过Pajek软件运行Kamada-Kawai分布算法[16]得到的图谱。本研究采用Ucinet中集成的NetDraw软件来实现作者关键词耦合网络及因子分析的可视化显示,与Pajek软件生成图谱类似利用Net-Draw软件得到的图谱也有信息呈现密度大、呈现效果直观性强的特点。

2结果和讨论

2.1选定代表作者群利用自编VBA程序统计1176篇论文的样本数据得到作者1501人,第一作者1004人。其中独著的有762篇,2人合作的有267篇,3人合作的有93篇,4人合作的有34篇,5人合作的有13篇,6人合作的有5篇,7人合作的有2篇。在数据样本中的1501位作者中提取发文数大于1的218人,从1955个关键词中提取词频大于3的159个关键词。去除检索时使用的关键词“信息素质”、“信息素养”、以及非标识文献内容、标识过于模糊的关键词,如“主题”、“影响”、“对策”等,利用自编VBA程序得到218位作者的作者关键词耦合矩阵(未去除合著论文的关键词耦合),同时利用本文第二部分提到的方法去除合著论文的关键词耦合对最终耦合矩阵的影响,得出218位作者的作者关键词耦合矩阵。在作者关键词耦合分析中,作者与其他作者建立的耦合频次总和是作者研究活力的表征,耦合频次总和越大表明作者在研究领域中的连通性越高。通过自编的VBA程序,笔者得到了各个作者的耦合频次总和,并选取了排名前100位作者的作者关键词耦合矩阵,表1是根据排名前100位作者的作者关键词耦合矩阵计算的耦合频次总和在前30位的作者。各作者的耦合频次总和较低是因为我们在分析时去除了非标识文献内容、标识过于模糊的关键词,同时也是因为该研究领域高发文作者较少,发文量大于3的只有18位作者,其中12位作者在耦合频次总和排名前30位。总体来说发文量及耦合频次总和都突出者可以看作该领域的高活力核心作者。

2.2作者关键词耦合网络结构分析提取的耦合频次总和排名前100位的作者关键词耦合矩阵(部分)见表2。将该矩阵导入Ucinet软件并利用NetDraw可视化软件绘制作者关键词耦合网络,见图1。图1所示的作者关键词耦合网络把相同研究领域的作者联系在一起。这是一个全联通的网络,网络密度为0.2261,整体网络联通性好。图中圆点代表作者,圆点的大小代表作者与其他作者的耦合频次总和,圆点越大,耦合频次总和越大。圆点间连线粗细可表征作者间耦合频次的多少。通过对作者关键词耦合网络中心性测度,可以发现初景利、彭奇志、张逸新、柯平、孙平、张士靖的中介中心性、程度中心性与亲近中心性都是比较高的,他们在信息素养研究领域中具有较突出的地位。这与高活力核心作者分析基本是一致的,其实程度中心性与耦合频次总和在计算上方法类似,从而导致了二种分析的密切相关,但是作者之间具体的共同研究主题以及该领域整体的结构就需要进一步通过作者关键词耦合关系因子分析。

2.3我国信息素养领域的结构及演化对作者关键词耦合矩阵进行余弦相似矩阵的转化,在SPSS中进行因子分析。在参考碎石图(如图2所示)的基础之上,提取出11个因子,11个因子可以解释95.659%的总方差。公因子变动的数值最小为0.791,最大为0.998,小于0.9的公因子只有11个。从分析数据结果上看,作者关键词耦合分析模型的拟合优度十分理想,这表明利用作者关键词耦合分析方法来研究信息素养领域知识结构的结果更易于解释。因子载荷要达到一定数值对于因子的解释才有意义,一般取值区间为0.3~0.5[5]。本文中笔者选择载荷阀值为0.3,即把作者在因子上的载荷值小于0.3的值变为0。表3为因子及其载荷统计。因子中的最高载荷表征各因子(研究主题)在整体学科内部的显著度,因子的标注是比较复杂的一项工作,因此我们利用了耦合的原理(作者使用共同的关键词)。作者与关键词的矩阵是作者关键词耦合分析的基础,所以在对因子标签进行解释时我们采用了统计因子中高载荷作者的关键词的方法,同时关注高载荷作者与其耦合强度较高作者的共同研究主题(关键词)。通过统计我们大致得到了信息素养领域的9个研究主题。因子1标注为信息素养教学改革及评价标准研究;因子2标注为在数字图书馆背景下信息素养的研究;因子3标注为信息素养内涵的研究;因子4标注为信息共享空间的研究;因子5标注为图书馆教育职能研究;因子6标注为文献检索课程的教学模式;因子7标注为信息素养的比较研究;因子8标注为学科服务研究;因子9标注为网络(Web2.0)环境下的信息素养教育;因子10与11没有查明。将因子分析后生成的模式结构矩阵(载荷阀值大于0.3)导入Netdraw软件进行可视化显示,如图3所示。图中圆形节点代表作者,方形节点代表因子,节点标签代表研究主题,节点大小代表该因子中所包含载荷大于0.3的作者的数量,而作者与因子间的连线的粗细代表作者在该因子上的载荷的大小(图中因子载荷大于0.3)。由图3可直观的揭示作者之间的共同研究主题,分析各作者分属的研究主题,可发现彭奇志、张逸新、黄如花同属“信息素养教学改革与评价标准研究”,柯平属“数字图书馆背景下的信息素养研究”,张士靖属“信息素养内涵研究”,这些主题领域研究者数量都较多,属于较为热门的研究领域。其中孙平同属“文献检索课程的教学模式”与“信息素养教学改革与评价标准研究”,初景利同属“学科服务研究”和“数字图书馆背景下的信息素养研究”,其二元属性不但说明两位作者分别在同领域内研究主题不同,而且说明不同研究主题存在关联性,其连接点就是作者本身。如孙平既发表了“高校图书馆的信息素质评价”这样关于评价标准研究的论文,又发表了“信息素养教学有效模式研究与实施”这样关于教学模式研究的论文,同时也发表了“高校信息素质教育发展的基本架构”这样同时提及评价标准研究与教学模式研究的论文。又如初景利既发表了“试论新一代学科馆员的角色定位”这样关于学科服务的论文,又发表了“在变化的环境中寻求图书馆变革—2007年国际图联大会解读”这样同时包含学科服务与数字图书馆背景下的信息素养研究的论文。利用自编VBA程序得到9个研究主题的高耦合关键词逐年频次矩阵,将各主题内关键词统计合并后导入NetDraw软件进行可视化显示,如图4所示。图4中圆形节点代表信息素养的研究主题,方形节点代表时间。圆形节点的垂线对应的方形节点代表主题内关键词的首现年份,连线的粗细代表领域内关键词出现的频次大小。结合图3与图4可知,信息素养领域整体的研究在2009年左右达到顶峰,信息素养内涵主要包涵信息意识、信息能力、信息道德这三方面,对信息素养内涵主题研究开始的比较早且后期关注的时间较长且比较平稳,这是因为对研究领域的对象性研究是所有研究的基础和核心问题。图书馆教育职能中最重要的就是信息素养教育,这是由于图书馆作为信息资源中心的定位决定的。其研究主要围绕图书馆从传统信息教育转型提升到信息素养教育职能层面,图书馆教育职能的研究为传统文献检索课的改革和突破以及信息素养教育实践模式提供了宏观指导。数字图书馆背景下信息素养的研究从2000年左右开始,研究的繁荣期在2001~2005年。网络环境下的用户教育研究的繁荣期在2000~2005年,与数字图书馆背景下信息素养研究同属于这个时间段的研究热点。这主要是因为在数字图书馆大变革下图书馆的所有服务都面临着结构性的升级,信息素养教育作为图书馆的重要工作之一也理所当然的从教育内容到教育模式上发生着改变。文献检索课程的教学改革与教学评价从整体来看在2004年后一直保持平稳的研究态势。其中教育模式的研究从2009年后进入繁荣期,教学改革主要包括教学目标改革、教学内容改革、教学模式改革、教学环境改革。教育模式研究主要从传统模式改变为嵌入式信息素养教育,主要分为部分或局部嵌入课堂、嵌入到网络教学平台、嵌入到学习管理系统三种形式。其实现模式主要包括目标嵌入、学科专业内容嵌入、科研学习过程嵌入、教学过程嵌入、网络环境嵌入。信息素养领域比较研究开始在2003年左右,2007年后研究明显增多。信息素养领域比较的对象主要是中国和美国,比较研究的内容十分的广泛,有指标体系、课程设置、教学模式、教育平台、信息行为、信息伦理、信息质量建模、感知差异性等。对信息共享空间的研究从2005年开始,2008年后进入研究的繁荣期。信息共享空间作为那个时间段的新兴服务平台与服务模式,具有优势平台资源和个性化、知识化、学科化及多元化的环境体系和服务体系,为信息素养教育从内涵到模式上提供了更为高效的途径和方式。学科服务主题的研究在领域与时间共现图谱中是唯一逐步上升的,也属于近年来研究的热点,说明信息素养教育正在渗透、嵌入日益普及的图书馆学科服务工作中去。同时,学科服务的深化促使高校图书馆的信息素养教育向学科专业的层面渐近,强调学科专业趋势的分析、隐性知识的关联挖掘、科研思路的构建与设计、大数据时代学科文献数据融合与分析、高效传播与共享。

3结论

本文以国内信息素养领域为研究对象,综合利用作者关键词耦合分析、社会网络分析、因子分析、词频分析来探究我国信息素养领域的高活力核心作者及研究主题的结构与演化,由此得出以下结论。

3.1高活力核心作者通过对作者与其他作者建立的耦合频次总和以及作者的发文数量我们可以看到我国信息素养领域的高活力核心作者主要有彭奇志、柯平、初景利、张逸新、周凤飞、徐仕敏等。但总体活力不高,高产作者较少,发文量大于3的只有18位作者。

3.2作者关键词耦合网络通过对作者关键词耦合网络的分析,我们可以看到该网络整体网络联通性好,但作者整体耦合强度比较低,这与研究领域高发文作者较少有密切的关系。在中介中心性、程度中心性与亲近中心性分析中初景利、彭奇志、张逸新、柯平、孙平等比较突出,与高活力核心作者基本相同,在一定程度上说明了高产、高活力、高网络中心性的一致性。

3.3研究领域的知识结构及演进通过因子分析笔者得到了信息素养领域的9个研究主题,分别是:信息素养教学改革及评价标准研究;在数字图书馆背景下信息素养的研究;信息素养内涵的研究;信息共享空间的研究;图书馆教育职能研究;文献检索课程的教学模式;信息素养的比较研究;学科服务研究;网络(Web2.0)环境下的信息素养教育。将与主题相关的关键词逐年频次统计后得到了信息素养领域演进的大致脉络为:①图书馆教育职能研究及信息素养领域内各概念的提出(包括信息能力、信息意识、信息道德等维度的研究);②数字图书馆背景及网络环境下的用户教育研究与文献检索课程体系建设;③信息素养的比较研究与文献检索课程体系的教学改革及信息素养教育模式的创新;④信息素养教育利用信息共享空间的资源和服务平台,并渗透、嵌入日益普及的图书馆学科服务工作,使得信息素养教育模式日益多元化,同时这些领域又不是孤立的,存在研究时间上的交叉。由于对信息素养的不同概念解读,对非标识文献内容、标识过于模糊关键词选择的主观性,因子载荷选择及对因子解释没有严格统一的标准,本文对信息素养领域的演进分析仍是有局限性的,期望在未来的研究中可以完善。

作者:王磊单位:合肥工业大学图书馆

上一篇:监控系统设计的通信电源论文 下一篇:资料室馆员信息素养论文