信息检索论文范文

时间:2023-03-18 15:42:21

信息检索论文

信息检索论文范文第1篇

桶排序法,先把被排数据所分布的区间[Dmin,Dmax](在这里Dmax,Dmin分别为被排数据的最大,最小值)划分成N个大小相等的子区间,称子为“桶”,然后将N个数据根据其大小分配入相应的“桶”内(桶[1],桶[2],…,桶[N])。借签桶排序中将数据根据其大小分配入相应“桶”的思想,我们在检索时将已排好序的数据也根据其大小将其分配入相应的“桶”内,然后再在“桶”内进行二分检索。假设按升序排列的N个数据已存放在data数组的元素data[0]~data[N-1]中,构造一个HASH函数为:

(式中Dmax=data[N-1],Dmin=data[0],N为数据个数)

二、基于HASH函数的二分检索算法HS

算法HS使用二个数组,data数组的元素data[0]~data[N-1]中存放按升序排列的N个数据,address数组的元素address[1]~address[N]中用来存贮经HASH函数转换后得到相同地址的数据个数。

算法HS

HS1[清address数组]将ddress[1]~address[N]都置0

HS2[Dmax中置最大值、Dmin中置最小值]Dmaxdata[N-1],Dmindata[0]

HS3[i置初始值]i0

HS4[求数据data[i]的HASH变换后的地址ad]ad

HS5[地址“碰撞”记数器address[ad]加1]address[ad]address[ad]+1

HS6[修改i]ii+1

HS7[比较i与N-1]若i<=N-1,则转HS4,否则转HS8。

HS8[address[0]置初值1]address[0]1

HS9[j置初始值]j1

HS10[求地址发生“碰撞”的数据在DATA数组中的首地址]address[j]=address[j]+address[j-1]

HS11[修改j]jj+1

HS12[比较j与N]若j<=N则转HS10,否则转HS13。

HS13[输入一个被检索的数据X]

HS14[对被检索数据X用HASH函数得地址ad]

HS15[确定“块”的下界low,上界high的值]lowaddress[ad-1],highaddress[ad]-1

HS16[在“块”内进行二分检索]在给定的下界与上界之间进行二分检索,若找到,则返“检索成功”信息,否则返加回“检索失败”信息。

HS17[本算法结束]

三、平均检索长度的分析

在本检索算法中,首先将被检索数据X经HASH函数转换出一个地址,根据这个地址将被检索的数据直接定位到相应的“块”中,然后在“块”中进行二分检索。因此通过对所有“块”内二分检索法的平均检索长度的计算就可求出本算法的平均检索长度。二分检索法的平均检索长度为:

下面我们来求本算法的平均检索长度。假设在N个数据均匀分布的情况下,经过本检索算法中HASH函数转换,每一个地址出现的概率相同,都等于1/N,因此,有m个数据转换得到相同地址的概率为:

(m=1,2,…,N)

参考文献[1]的附录中已证明:(1)

所以本检索算法的平均检索长度为(2)

由上式(1)和式(2)两个公式即可求得本算法的平均检索长度,其平均检索长度小于1.352(当N>100时)。

四、算法分析与实验结果

1.本算法的创新之处在于通过HASH函数可将被检索的数据X直接位置定位到相应的“块”(通过HASH函数转换后的地址相同的数据区间)中,再在“块”中进行二分检索。从而不再需要建立索引顺索表检索算法中的索引表,也就省去了索引顺索表检索算法中查找索引表确定所在“块”的平均检索长度。

2.此方法突破了HASH表的平均检索长度是装填因子(=(表中填人的记录数)/(哈希表的长度)的函数,而不是N的函数的弱点。

3.在理想情况下,即数据完全是均匀分布的情况下,本算法的平均检索长度可达理论极限值ASL=1。即使是在最坏的情况下,当N个数据经HASH函数转换后的地址均相同,所有数据均落在同一个“块”中,其平均检索长度ASL也只会下降到二分检索法时的平均检索长度。

4.本算法对于均匀分布的数据是极为有效的,通过计算得出其平均检索长度小于1.352(N>100时),因此检索效率很高。

5.本算法中的步骤HS1~HS12仅仅是为检索作的准备工作,相当于初始化的工作,只需在检索开始时做一次即可。

6.实验结果。为了对本检索算法的检索效率进行验证,我们用VB6.0编写了本算法以及二分检索法的程序,将二种检索算法的平均检索长度进行实际测定,实验中所用的数据由VB6.0的随时函数产生,数据的范围为(0~10000),实验结果如下表所示:

VB6.0程序二种检索算法平均检索长度对比表

我们在实验中测定平均检索长度时,通过程序对所有数据逐个检索,统计出检索完所有数据需进行比较的总次数再除以数据总数后得出。上表中当N=100时,本算法实际测定的值(1.38)与理论计算(1.352)略有误差,原因是我们用VB6.0中的随机函数产生的随机数在数据量较小时分布不一定很均匀。从表1中可以看到:当数据量稍大一些(N>100),本算法的平均检索长度的实测结果完全与理论分析一对致,并且远小于二分检索法的平均检索长度。本算法的平均检索长度随着数据量N的增加几乎不变。

[摘要]构造一个新的HASH函数,结合索引顺序表和二分检索法的思想,提出了一种高效率的信息检索算法,通过理论计算和实验证明此算法的平均检索长度小于1.352(N>100)。

信息检索论文范文第2篇

作者:李爱军 孙智英 单位:山东农业大学图书馆 潍坊科技学院

在查找英文文献时更是如此,如要查找与土壤铜形态转化有关的文献时,可以直接查“copperspeciation”也可以查“cop-perfractionation”还可以将前面的“copper”换成“heavymetal”,这样就可以保证对所有相关的资料都检出。当然在检出条目过多时也可缩小检索的范围,或者在检出的文献中再选择关键词进行检索,以保证检出那些与目标内容密切相关的文献。运用检索的规则,调整检索范围对于文献较多的检索,不可能每篇文章都看,需要从中筛选出密切相关的进行阅读,因此需要调整策略进一步缩小检索的范围,减少文献检出的数量。而对于文献较少的内容则希望扩大检索的范围,这就需要熟悉检索规则,合理界定检索的范围。常用的方法有:(1)逻辑与(逻辑乘)的运用。用“and”或“*”连接几个检索词,可以缩小检索范围,减少检出文献的数量。例如,AandB(A*B)表示检出记录中必须同时含有检索项A和B,两个概念的交叉,即用逻辑与连接的检索词越多,检索范围越小[2-3]。(2)逻辑或(逻辑和)的运用。用“or”或“+”连接检索词,如检索AorB(A+B)可以检出单独含有检索项A或检索项B以及同时含有A、B两者的文献,可大大扩大信息检索范围,提高查全率,避免都信息查找的遗漏。(3)逻辑非(逻辑差)的运用。用“not”或“-”连接检索词,如AnotB(A–B)表示检索内容中有A但没有B,即凡含有检索项A而不含检索项B的记录为命中记录。逻辑非检索可以有效排除不相关的文献,提高了检索内容的准确度。运用通配符进行模糊搜索一般用“?”和“*”等通配符可以代替检索词中的一个或多个字母,这样仅利用检索词的部分不完整词形即可进行检索。通配符可以放在词根的前面、后面、中间,也可以放在两端。例如,检索“?Comput-er”则凡是后方为computer的词均可被检出,如可检出Microcomputer、Minicomputer等。检索“Comput-er?”时,前方为computer的词均可被检出,检出词可为Computers、Computerization等。检索“?Com-puter?”,检出词可为:Microcomputer、Minicomputer、Computers、Computerization等,凡是中间部分包含Computer的词均可被检出。对于意思相同但写法不同的的词,为了将所以包含这些词的文献检出,可将通配符置于检索词的中间,而词的前后方一致进行检索。通常用于英、美拼写不同的词的检索。如,检索“Colo?r”,检出词可包括为Colour和Color。限定检索词的出现位置有时为了提高查准率,需要固定检索词出现的位置关系,那么就需要用到一些限制位置的特殊用法。

位置限定运算符号一般有以下四种:①使用N(near的缩写)表示检索词的距离远近,如A(N)B表示两词相邻且词序可变,A(nN)B表示两词间可插入n个词(n为0,1,2…整数)[3,4]。②使用S(sentence的缩写)表示两次在句子中的关系,如A(S)B表示两词必须同时出现在同一句短语中,两词的前后顺序不限,中间插入词数量不限。③使用F(是field的缩写)表示两词在字段中的位置关系,如A(F)B表示A、B两检索词必须同时出现在同一文献记录的同一字段中,词序、中间插入词的数量不限,但必须指定所要找的字段。④用C(是citation的缩写)表示两检索词在文献纪录中的位置关系,如A(C)B表示两词必须同时在同一个文献记录中,两词的词序、出现的字段不限。限定检索的范围电子文献信息资源内部还包含许多个信息资源数据库,为了提高检索的速度和提高查准率,可以对要检索的数据库进行选定。如目前的《中国期刊全文数据库》可分为:理工A、理工B、理工C、农业、医药卫生、文史哲、政治军事与法律、教育与社会科学综合、电子技术与信息科学、经济与管理等10大专业数据库。如果要查找与农业相关的专题(如作物栽培)可以只选农业专业数据库即可。

而对有些检索主题可能会涉及多个专业数据库,那么就可以多选几个。在具体检索时还可对检索范围进行限定,如可选择检索词出现的位置,如主题、篇名、刊名、关键词、摘要、作者、单位及参考文献等,还可限定刊物出版的时间段等。利用二级检索功能或高级检索功能二级检索是指利用前一次检索的结果作为后一次检索的数据库,逐步缩小检索范围,即在上一次的检索查询结果中,再输入另外的检索词进行查询,这样检索的结果相当于用“and”或“*”连接几个检索词,或者直接输入几个关键词的检索效果,可以缩小检索范围、提高查准率。几乎所有的数据库都提供高级搜索服务,使用这一功能就可方便地对自己要检索的内容进行限定,在这里可以增加附加的检索条件,以缩小查询的范围,不同的搜索引擎提供不同的选项,常规的选项一般包括日期、作者、关键词、文献类型、范围、网域、语言等。

信息检索论文范文第3篇

一、前言

计算机的日益普及和计算机技术日益成熟,使得计算机在工业控制监测中的应用渐渐深入。但工业应用不同于其它方面,它要求有较强的实时性。现在有很多的DOS软件在运行过程中通过挂接外部中断方式实现DOS应用软件与外设的实时通信,这种方法实现起来十分简单。而在Windows中应用程序能否也能够利用外部硬中断实现外设与Windows应用程序的实时通信呢?答案是肯定的。这里的关键是要解决好中断代码与Windows应用程序相互之间交换信息的问题。

从外设发送异步的硬中断,通过中断处理程序传递一条信息给Windows应用程序。这时可以初始化相关端口,准备好数据,然后进行数据传送,从而做到实时通信。

实现Windows应用程序响应外部中断的方法有很多,如Microsoft公司自己开发的SDK、DDK软件包,使用嵌入式汇编等等。本文将介绍一种在BC++3.1的基础上利用Windows3.1拥有的一些功能实现Windows实时通信的实例。

二、中断代码的位置

在Windows中,几乎所有的异步事件都是由中断处理程序来管理的。中断处理程序包含在设备驱动程序中,由Windows在环境初始化中安装。例如,KEYBOARD.DRV、MOUSE.DRV和COMM.DRV均含有中断处理程序,以处理相应的键盘、鼠标和串行口的异步中断。可以仿照标准设备驱动程序,编写中断处理代码,以响应外设的通信请求,从而完成一次实时通信。

中断代码既可以包含在应用程序的可执行代码中,也可以包含在动态连接库(DLL)中。包含在应用程序中的代码只能在一个程序中使用,而在动态连接库中的代码则可以在Windows系统中所有的应用程序所共享。这样不仅在整个Windows系统中只有一个中断代码的副本,提高了内存的使用效率,更重要的是可以防止由于同时存在多个中断代码的副本而发生冲突。本文将在DLL中编制中断处理程序。

当动态连接库被装入时,要调用DLL库的入口点LibMain(),利用这一点可以执行一些初始化工作,可以分配一些内存块,可以初始化一些全局变量或者静态变量,可以安装中断服务程序的代码等等。例如:

voidinterrupt(oldIsr)(--CPPARGS)

/*旧的中断服务程序地址*/

LibMain(HANDLEhInstance,WORDwDataSeg,WORDcbHeapSize,L

PSTR

lpszCmdLine)

{

oldIsr=getvect(IRQNum);

/*IRQNum指中断号*/

setvect(IRQNum,newIsr);

/*newIsr指新中断服务程序代码*/

return(1);

}

函数setvect()既可在实模式下,也可在保护模式下设置中断处理向量。

上述代码也可以放在一个由用户设置的引出(export)函数中,在应用程序中用户可以调用此引出函数来安装中断服务程序代码。

由于中断可以在任何时刻发生,中断代码必须驻留在内存中,并且在应用程序运行的过程中一直处于某一固定内存中。这一点无论是在实模式还是在保护模式下都是一致的。

在DLL的模块定义文件中应注意:

1.CODE语句为固定代码段,即FIXED;

2.EXPORTS语句要引出被应用程序和其它DLL用作入口点的函数。

三、通信机制

编写实时通信例程关键在于必须认识到,异步事件对应用程序的触发是异步发生的,不在Windows的消息处理机制和多任务范围内。为了使通信例程能够正确地工作,通信例程必须通知Windows有异步事件发生,且不能打断应用程序的任务管理或消息流。要作到这一点,通信例程必须通过调用PostMessage或PostAppMessage函数向应用程序的消息队列中加入一条消息。

需要注意的是,在DLL中调用PostMessage(HWNDhwnd,…)时,必须先确定hwnd的实际值,可以通过使用引出函数的办法来实现,如下所示:

staticHWNDhWndApp;

voidFARPASCALSetIsrWin(HWNDhwnd)

{

hWndApp=hwnd;

}

然后在应用程序的窗口函数中,对WM-CREATE消息进行处理时调用此函数来初始化DLL中的静态变量hWndApp:

CASEWM-CREATE:

SetIsrWin(hwnd);/*hwnd指应用程序窗口句柄*/

定义一个在应用程序中使用的消息:

#defineISRM-RUPTWM-USER+255最后在DLL中的中断服务程序代码中,调用PostMessage即可完成Windows应用程序和中断服务程序代码相互的信息交流:

voidinterruptnewIsr(--CPPARGS)

{

PostMessage(hWndApp,WM-RUPT,wParam,lParam);

}

四、程序实例

本示例先安装在DLL中的外中断服务代码,通过386/AT总线上的中断申请线(IRQ12)外触发,由中断服务代码发送一条消息WM-RUPT通知Windows应用程序外设有实时通信请求,应用程序收到这条消息后,在窗口用户区显示一条信息,表明已和外设联络上,并同时鸣叫一声喇叭。

信息检索论文范文第4篇

伴随着计算机进入多媒体时代,信息科技也步入了多媒体发展时期。手工检索靠手翻、眼看、大脑判断的检索方式已难以全面适应当今信息的发展,计算机信息检索必然的提到了应用与发展阶段,以Internet为代表的全球化、网络的实际应用更进一步推动了这一发展,这既是对手工检索的扩展,也是时代的需要。在当今资本资源和数字资源并存的信息时代,作为信息资源管理者,既需要了解和掌握传统手工检索的方法,也需要熟悉和掌握计算机检索,尤其是网络信息检索的理论和技术,这是信息时代对图书馆工作者信息素质的必然要求。

一、信息检索的起源和发展过程

信息检索源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶开始发展,至20世纪40年代,索引和检索已成为图书馆独立工具和用户服务项目。随着1946年世界上第一台计算机的问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来,脱机批量情报检索系统、联机实时情报检索系统相继研制成功并商业化,20世纪60年代到80年代,在信息处理技术、通讯技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各个领域高速发展,得到了广泛利用。Dialog国际联机情报检索系统是这一时期的情报检索领域的代表,至今仍是世界上最著名的系统之一。

(一)手工检索阶段(1876—1954)

信息检索源于参考咨询和文摘索引工作。较正式的参考咨询工作是由美国公共图书馆和大专院校图书馆于19世纪下半叶发展起来的。到20世纪40年代,咨询工作的内容又进一步,包括事实性咨询、编目书目、文摘、进行专题文献检索,提供文献代译。“检索”从此成为一项独立的用户服务工作,并逐渐从单纯的经验工作向科学化方向发展。

(二)脱机批量处理检索阶段

1954年,美国海军机械试验中心使用IBM701型机,初步建成了计算机情报检索系统,这也预示着以计算机检索系统为代表的信息检索自动化时代的到来。

单纯的手工检索和机械检索都或多或少显露出各自的缺点,因此极有必要发展一种新型的信息检索方式。

(三)联机检索阶段(1965年—1991)

1965年美国系统发展公司研制成功ORBIT联机情报检索软件,开始了联机情报检索系统阶段。与此同时,美国洛克公司研制成功了著名的Dialog检索系统。20世纪70年代卫星通信技术、微型计算机以及数据库产生的同步发展,使用户得以冲破时间和空间的障碍,实现了国际联机检索。计算机检索技术从脱机阶段进机信息检索时期。远程实时检索多种数据库是联机检索的主要优点。联机检索是计算机、信息处理技术和现代通信技术三者的有机结合。

(四)网络化联机检索阶段(1991年至今)

20世纪90年代是联机检索发展进步的一个重要转折时期。随着互联网的迅速发展及超文本技术的出现,基于客户/服务器的检索软件的开发,实现了将原来的主机系统转移到服务器上,使客户/服务器联机检索模式开始取代以往的终端/主机结构,联机检索进入了一个崭新的时期。

二、信息检索系统类型

(一)参考数据库检索系统

参考数据库检索系统以二次文献数据库为主,提供文献的题录、文摘数据或事实数据

(二)全文数据库检索系统

全文数据库检索系统是近年来随着数字化技术不断成熟而发展起来的,系统能提供文献的全文数据,包括图表、图像等多种形式的媒体。

(三)Internet网络检索工具

Internet搜索引擎主要提供网上资源的链接,某些搜索引擎也提供简单的网页介绍或检索词的上下文。

三、信息检索方式

(一)命令检索方式

命令检索方式指的是检索过程中,每一项检索提问,必须通过具体的命令来完成,这些检索命令通常需要用户熟记。这种方式虽然对于初级用户来说比较麻烦,需要记很多的命令,但是对熟悉系统的用户来说,命令方式有其步骤简单的优点,尤其是完成一些复杂的检索算法时,操作步骤简单。许多国际联机检索系统,在推出新的检索方法的同时,仍保留着原有的命令检索方式,为喜欢命令检索的用户提供服务,Dialog系统就提供了比较多的检索命令。

(二)单检索方式

这种检索方式实际上是将各种检索指令转化成菜单选项,系统的功能和检索指令通过菜单和子菜单的选项来实现,用户通过菜单一目了然,只需根据需要在菜单上选择某一项,或进行检索,或显示命令中的纪录等。菜单驱动的检索方式对初级用户是比较友好的,用户不需要培训就可以自行检索,很容易入门,但对于较复杂的检索算法,常常需要进入层层(下转第182页)(上接第180页)菜单才能完成。

(三)命令与菜单相结合的方式

这种检索方式既保留了指令检索的方式,又提供了菜单的某些直观的功能。对于复杂的检索方法,主要以命令的方式来组织,而一些常用的命令或参数可以通过菜单选项来选择,这样,简化了完全依赖于指令方式的检索步骤,可以让用户减少指令和参数的记忆量。目前有些联机检索系统在WEB上推出了这样的检索方式。

四、信息检索技术

(一)布尔逻辑检索技术

布尔逻辑检索技术就是指利用布尔逻辑运算符进行检索词语和代码之间的逻辑组配运算,从而获得检索结果的一种检索方法。这是计算机信息检索中最基本的也是最常用的技术。

1.逻辑“与”(AND)。逻辑“与”组配是具有概念交叉关系和限定关系的一种组配。通常用“AND”或“*”作为算符表示。

2.逻辑“或”(OR)。逻辑“或”是并列概念关系的一种组配,通常用运算符“OR”或“+”表示。

3.逻辑“非”(NOT)。逻辑“非”组配是指不包含某种概念关系的一种组配,它可以从原检索范围中排除一部分文献纪录,逻辑“非”的运算通常用“NOT”或“—”作为运算符。

(二)截词检索技术

截词检索(Truncation)是一种常用的检索技术,特别是在西文检索中,更是广泛使用。截词检索就是对词的片断进行比较,检索者将检索词在合适的地方截断,然后将截出的片断进行检索。

(三)字段限制检索

在检索系统中,为了提高检索的准确率,缩小检索的范围,通常用一些限制的手段和方法。使用这些方法进行检索通常称为限制检索(LimitSearch)。常用的限制方法就是字段限定。

(四)全文本检索技术

全文本检索技术(FulltextSearching)是对数据库纪录的全文文本检索,即纪录中的每个词都可以作为检索入口,且可以限定词与词之间的语义关系。全文本检索也有人把它称为自由文本检索。

五、结语

随着信息技术的进一步发展,信息检索技术必将更加完善,它将在人类与信息之间建起一座方便的桥梁。

参考文献

[1]李满潮.VisualC#?NET高级编程[M].北京:清华大学出版社,2002,(231–235).

信息检索论文范文第5篇

〔关键词〕信息检索课;文献计量分析;知识图谱

〔中图分类号〕G252 〔文献标识码〕A 〔文章编号〕1008-0821(2012)10-0138-04

自教育部1998年颁布《普通高等学校本科专业目录和专业介绍》时提出249种专业中的218种在其“业务培养要求”中明确规定“掌握文献检索、资料查询的基本方法”或“掌握资料查询、文献检索及运用现代信息技术获取相关信息的基本方法”[1]以来,文献检索课(即信息检索课)陆续地在各大高校被开设。经过15年的发展,信息检索课的教学取得了长足的进步,很多信息检索课教学者为了改善信息检索课教学效果纷纷献计献策,但纵观我国信息检索课这十几年情况,发现关于我国高校信息检索课教学方面的论文主要以定性研究为主,为了解该领域这15年来的研究状况及热点,笔者拟用文献计量学与知识图谱方法对国内信息检索课教学领域相关文献进行以定量为主、定性为辅的多角度分析与挖掘,希望得出一些有益的结论,为信息检索课教学建设提供一定的借鉴。

1 数据来源和研究方法

1.1 数据来源

本文的统计数据来源于《中国学术期刊全文数据库》,检索条件是:题名中包括信息检索且教学,时间范围是1997-2011年,共检索到相关文献423篇。为使数据全面可靠随后用同样的检索条件在维普数据库中进行了检索,检索到相关文献434篇。最后对两次检索结果合并去重后得到的442篇文献作为本次研究的基础数据。

1.2 研究方法

首先,从每篇检索文献中选择“篇名”,“作者”,“关键词”,“单位”,“基金”,“刊名”及“年”的自定义输出;其次通过自编软件将输出的txt文件中转换成excel文件,并进行适当数据整理;第三,用excel软件完成年度发文量统计、机构发文量统计及高频关键词统计等后,用SQL Server2005进行高频关键词于442篇论文分布状况进行统计,并用Ucinet完成高频关键词共现矩阵的计算及高频关键词共现网络可视图及聚类分析;最后,结合共词网络与聚类结果分析信息检索课教学研究重点与变化趋势。

2 信息检索课教学论文分布情况

2.1 时间分布

发表文献的数量在一定程度上代表了某个领域的研究水平和发展趋势。图1所示的是1997-2011年15年间信息检索课教学研究发文情况见。从图中可以看出,在2000年之前,信息检索课教学研究发文都是以位数计;2001-2011年间,信息检索课教学研究论文总体呈现上升趋势,其中在2009年达到高峰值,论文数量为61篇。

图1 国内信息检索课教学文献增长趋势

信息检索课教学领域发文数量的增多验证了知识经济时代下信息检索课在高校人才培养中的重要地位。从20世纪90年代开始,我国高校逐步在教学计划中增加相关内容和课程,以进行大学生信息素养的培养,就目前情况来讲,主要是通过开设信息检索课的教学来进行我国的大学生信息素养的培养,因此有关信息检索课的教学研究也备受教学研究人员关注。

2.2 发文和引文期刊分布

1997-2011年间442篇论文共涉及193种期刊,发文数量在4篇以上的期刊共有24种,其发文篇数如表1。

表1中列举出的24种期刊发文总数为225,占所有论文的50.9%。其中CSSCI类期刊发文数排名为《图书情报工作》、《情报杂志》、《图书馆杂志》、《图书馆论坛》、《现代图书情报技术》,属于医学类期刊的有《医学信息学杂志》、《西北医学教育》、《医学情报工作》及《医学信息》4种。将检索出的442篇文献按被引频次降序排序,可计算得其H指数为13。这13篇高被引文献来源期刊及篇数情况为:高校图书馆工作(1篇)、图书馆论坛(1篇)、图书馆杂志(1篇)、图书情报工作(1篇)、图书与情报(1篇)、中国图书馆学报(1篇)、大学图书馆学报(2篇)、图书情报知识(2篇)、现代情报(3篇)。其中来源单位及论文篇数为:广东工业大学(3篇)、南京大学(2篇)、浙江大学(2篇)、江南大学(2篇)、武汉大学(1篇)、大庆石油学院(1篇)、西南交通大学(1篇)、湛江师范学院(1篇)。

从发文与高被引文期刊比较中,可以看出《高校图书馆工作》、《图书馆论坛》、《图书馆杂志》、《图书情报工作》、《现代情报》这几种期刊在信息检索教学领域论文发文篇数多且被引频次较高。

2.3 研究机构分布

统计表明,这442篇论文来自268个不同的研究机构,在5篇以上的高产机构如表2所示:

从论文数量上看,东华理工大学以25篇的数量排在第一位,排在第二的是广东工业大学。其中医学类院校有6个,这表明信息检索课在医学类院校受到重度重视。如果在计数时将论文成果归结为第一作者,那么仅统计论文第一作者单位得到前15的机构情况如图2:

图2 第一作者单位分布〖〗

图2中列举出前15的研究机构中,广东工业大学、江南大学、武汉大学、南京大学、浙江大学也是H指数在13及以上的来源单位,可见,前15的研究机构不仅发文数目可观,而且论文质量也教高。

3 信息检索课教学研究热点分析

442篇论文共关键词1 650个,去重后得到584个关键词。针对这584个关键词,舍弃如“发展,建议”等太宽泛的关键词,集中一些出现频次较少但实际上反映的是某一研究主题的如“教学博客,wiki”,并合并一些异名同义的如“微博,博客,blog”等处理后关键词为493个。在这493个关键词中存在着一些出现频次较高的关键词,出现频次大于等于7次为高频关键词(见表3)共37个。这些高频关键词词频的总数为927,占总体的56%。

利用SQL Server2005统计出37个高频关键词于442篇论文分布情况,形成一个37×439矩阵,并用Ucinet转置得后用矩阵乘积函数Prod可计算得到这37个高频关键词的共词矩阵。共词矩阵借用Ucinet转换后的一个网络图如图3。

图3 Ucinet转换后的共词矩阵网络图

根据图3结果,可以看出近十五年来信息检索课教学研究集中在高等学校与高职院校,这与教育部在1984年的在全国有条件的高校广泛开展文献检索与利用课教育规定相一致。从图中可以看出,我国15年来信息检索课教学主要围绕“文献检索”、“信息检索”、“创新”这3个“中心”和以下4个基本方面而进行:

(1)课程改革方面(见图左端区域)

随着计算机技术、信息技术和网络技术的发展,文献信息资源的产生、存储以及传递方式、检索手段的变化,使得原有手工检索内容被大大压缩和精简,有关网络、信息技术、电子资源、数据库其检索与利用等内容大幅度增加[2]。因此文献信息检索逐渐经历了“信息检索课”、“信息检索与利用”、“网络信息检索”,“医学信息检索(课)”、“计算机信息检索”、“科技信息检索”等一系列的课程名称改革,同时,其教学内容也随着科学技术的进步而被不断更新、扩展深化。

(2)教学改革方面(见图右端区域)

信息检索课教学改革研究又进一步分为“教学研究”与“教学方法”两个分支。属“教学研究”分支的高频关键词有“网络教学”、“信息检索教学”、“教学内容”、“教学设计”、“教学模式”;属“教学方法”分支的高频关键词有“实践教学”、“案例教学”、“PBL(基于问题的学习,Problem-Based Learning)”[3]、“双语教学”。随着社会发展,知识存在数量多、更新快、形式多样、传播迅速的新特点,这使得网络信息的传播途径多样、复杂,要使大学生不断获得最新知识,信息检索课在根据这些特点不断充实、调整、更新教学内容的同时应该创新教学方法。为激发学生兴趣与提高学生自主性,马建春[4]、余恩琳[5]在信息检索教学中成功应用案例教学法,沈固朝[6]、华薇娜[7]引入“引路者”练习与“团队合作式”实践在教学中发挥显著效果。

(3)信息技术支持方面(见图下端区域)

高频关键词包括:多媒体技术、网络、Web2.0。

信息检索课在进行课程改革与教学改革都需要技术来支持,因此,随着科学技术的不断发展,多媒体技术、网络技术被越来越多地被引入信息检索课教学中用于课件制作、作业与回收、教学交流与讨论等,尤其Web2.0时代的到来,更是为信息检索课的教学注入了新血液。Blog、RSS、Tag、P2P、维基等的出现,不仅让课程分享与交流变得更容易,还能激发学生协作、共造地“织网”,释放学生的创造潜能。因此在信息检索课教学研究中,文献[8-10]成功将Web2.0技术应用于教学中并发现了其独特的优越性与巨大的应用潜力。

(4)课程目标方面(见图上端区域)

信息检索课的课程目标与信息素质密切相关,属于这一类的高频关键词有“信息素养”、“信息能力”、“信息意识”、“素质教育”等。当今社会是信息化社会,要求培养具有信息素质的新型人才,素质教育是当今我国教育界讨论的热点,更是信息检索教学研究中一大关注的领域。

4 小 结

经过对收集数据的粗糙处理后,笔者利用自编软件、Excel、SQL Server2005、Ucinet的分析结果得出上述结论,希望能够帮助我国研究者快速了信息检索

课教学的概括及研究热点。本文也存在一些不足之处,主要体现在得出结论的样本个数不多,加之在进行关键词处理时,笔者发现一些信息检索课教学论文关键词标引不甚恰当,这对于本研究的结论可能产生一些影响。不当关键词标引修正等是以后研究需要提高的地方。

参考文献

[1]杨福来,郑颖佳,许邦莲,等.信息素养教育与信息检索课教学改革[J].东华理工大学学报:社会科学版,2011,30(2):177-180.

[2]袁丽琰.网络环境下高校信息检索课教学改革探讨[J].科技情报开发与经济,2010,20(3):185-186,188.

[3]张晓峰.信息检索课PBL教学模式中“问题”的选择[J].大学图书情报学刊,2010,28(1):81-83.

[4]马建春.案例教学法在信息检索课教学中的应用探讨[J].江西图书馆学刊,2011,(1):120-122.

[5]余恩琳.案例教学法在研究生医学信息检索教学中的应用[J].西北医学教育,2004,12(5):389-401.

[6]沈固朝.我们是怎样开设文献检索系列课程的[J].大学图书馆学报,1997,15(6):65-67.

[7]华薇娜.在文献检索课程中贯穿“引路者”练习的实验及其意义分析[J].大学图书馆学报,1997,15(2):59-62.

[8]陈红勤,陈路平,黎平国.Web2.0时代基于建构主义的信息检索教学平台的构建[J].现代情报,2008,(12):175-178.

[9]黄慧薇.Blog(博客)技术在信息检索课网上教学中的应用[J].现代情报,2006,(10):208-211.

信息检索论文范文第6篇

关键词:信息检索 信息分析 信息提炼 立体印刷

中图分类号:TM63 文献标识码:A 文章编号:1674-098X(2016)09(c)-0100-02

在新的生活环境下,每个人都需要从各种各样的信息源中收集、提炼有用信息,为正确决策提供参考。一方面,人们可以利用网络方便、自由、快捷的、查询信息;但另一个方面,由于网络环境的开放性,信息更新的快速性,使得信息资源出现分散、异构、无序的特性,极不利于人们有效开发和利用这些资源。面对信息急剧增长、技术不断更新的新局面,需要我们对信息检索技术进行深入的研究,从而提高网络信息资源的利用率,尤其是科研工作者必须增强获取、选择和利用信息的能力。

1 信息检索概述

信息检索是将信息按一定的方式组织起来,并根据信息用户提交的查询条件检索出相关文档的过程和技术。信息检索涉及数据库技术、图书和情罂蒲А⑷斯ぶ悄堋⒆匀挥镅源理、机器学习等众多知识和学科领域[1]。信息检索作为一门学科,主要研究信息的获取、表示、存储、组织和访问。

1.1 信息检索的意义

信息检索是对信息进行集中表示、存储、组织加工、统一管理,使用户更容易得到所需要的信息,进而对信息进行加工,根据分析得出新的思路和方法,实现信息激活和增值。有效的信息检索可以节省科技人员的时间,提高工作效率;帮助人们进行知识更新;继承和借鉴前人劳动成果,促进科技的快速发展;协助管理者做出正确的决策。

1.2 信息检索的四要素

信息检索包含四个要素:信息意识、信息源、信息获取能力、信息利用[2]。信息意识是信息检索的前提,指人们借助信息系统获取所需信息所做出的能动反映,使人们对信息的敏感程度、选择和运用信息能力;信息源是信息检索的基础,如专著、期刊、报告、学位论文、会议记录、专利、标准、统计数据、政府出版物、档案文献信息等;信息获取能力是信息检索的核心,是指人们对信息的了解、查找、整理加工;信息利用是信息检索的关键,即对信息进行有效的加工和利用。

1.3 检索语言及方法

检索语言是为沟通文献标引与文献检索而编制的人工语言,是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道。检索语言主要包含分类、主题、代码和自然四类语言[3]。分类语言是指用各种分类号来进行检索的标识,按学科性质进行系统排列,包括主题、科学、图书和专利分类语言;主题语言是直接以表达文献主题的词语作为检索标识,包括关键词、标题词、单元次和叙词语言等;代码语言是指将事物的某一方面特征用代码系统来标引和排列的检索语言,例如,分子式索引系统;自然语言是指未经规范化处理的检索语言。

信息检索包括手工和计算机检索,常用的检索方法有拉网法、引文法、顺查、逆差和抽查法、排除、限定和合取法。检索途径归为两大类:一类是用信息的外部特征,如责任者、题名、某种序号、机构名等作为检索标识;另一类是用描述信息内容的分类号、关键词、主题词等作为检索标识。通常直接输入检索字段直接点击搜索,但需要精确查找目标文献时,要利用高级检索方式设置一些查询条件,如查询范围、时间、方式(模糊和精确)、字段逻辑关系的编辑等。

2 信息检索流程

信息检索过程可分为以下步骤:课题的确定――选择合适的数据库――初步拟定检索式检索――调整检索策略(考虑准确性)――命中结果分析――批量下载――信息分析。下面以立体印刷技术的相关资料的搜集为例介绍信息检索过程。

2.1 检索工具选择

对于日常信息的搜索,通常采用百度、谷歌等网站,但对于专业文献的检索则需要专门的数据库,每个数据库都有自己的特点。

(1)馆藏书目查询:书目是将图书、期刊按一定规则收录,并有序编排的检索工具。通常包含题名、责任者、主题词、分类号、索取号、ISBN/ISSN号、出版社等字段,输入检索词即可检索,大多数高校图书馆都有自己的馆藏书目数据库,检索、下载。

(2)中国学术期刊全文数据库:目前世界上最大且连续动态更新的数据库,内容覆盖工程技术、自然科学、农业、哲在新的生活环境下,每个人都需要从各种各样的信息源中收集、提炼有用信息,为正确决策提供参考。一方面,人们可以利用网络方便、自由、快捷的、查询信息;但另一个方面,由于网络环境的开放性,信息更新的快速性,使得信息资源出现分散、异构、无序的特性,极不利于人们有效开发和利用这些资源。面对信息急剧增长、技术不断更新的新局面,需要我们对信息检索技术进行深入的研究,从而提高网络信息资源的利用率,尤其是科研工作者必须增强获取、选择和利用信息的能力。

1 信息检索概述

信息检索是将信息按一定的方式组织起来,并根据信息用户提交的查询条件检索出相关文档的过程和技术。信息检索涉及数据库技术、图书和情报科学、人工智能、自然语言处理、机器学习等众多知识和学科领域[1]。信息检索作为一门学科,主要研究信息的获取、表示、存储、组织和访问。

1.1 信息检索的意义

信息检索是对信息进行集中表示、存储、组织加工、统一管理,使用户更容易得到所需要的信息,进而对信息进行加工,根据分析得出新的思路和方法,实现信息激活和增值。有效的信息检索可以节省科技人员的时间,提高工作效率;帮助人们进行知识更新;继承和借鉴前人劳动成果,促进科技的快速发展;协助管理者做出正确的决策。

1.2 信息检索的四要素

信息检索包含四个要素:信息意识、信息源、信息获取能力、信息利用[2]。信息意识是信息检索的前提,指人们借助信息系统获取所需信息所做出的能动反映,使人们对信息的敏感程度、选择和运用信息能力;信息源是信息检索的基础,如专著、期刊、报告、学位论文、会议记录、专利、标准、统计数据、政府出版物、档案文献信息等;信息获取能力是信息检索的核心,是指人们对信息的了解、查找、整理加工;信息利用是信息检索的关键,即对信息进行有效的加工和利用。

1.3 检索语言及方法

检索语言是为沟通文献标引与文献检索而编制的人工语言,是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道。检索语言主要包含分类、主题、代码和自然四类语言[3]。分类语言是指用各种分类号来进行检索的标识,按学科性质进行系统排列,包括主题、科学、图书和专利分类语言;主题语言是直接以表达文献主题的词语作为检索标识,包括关键词、标题词、单元次和叙词语言等;代码语言是指将事物的某一方面特征用代码系统来标引和排列的检索语言,例如,分子式索引系统;自然语言是指未经规范化处理的检索语言。

信息检索包括手工和计算机检索,常用的检索方法有拉网法、引文法、顺查、逆差和抽查法、排除、限定和合取法。检索途径归为两大类:一类是用信息的外部特征,如责任者、题名、某种序号、机构名等作为检索标识;另一类是用描述信息内容的分类号、关键词、主题词等作为检索标识。通常直接输入检索字段直接点击搜索,但需要精确查找目标文献时,要利用高级检索方式设置一些查询条件,如查询范围、时间、方式(模糊和精确)、字段逻辑关系的编辑等。

2 信息检索流程

信息检索过程可分为以下步骤:课题的确定――选择合适的数据库――初步拟定检索式检索――调整检索策略(考虑准确性)――命中结果分析――批量下载――信息分析。下面以立体印刷技术的相关资料的搜集为例介绍信息检索过程。

2.1 检索工具选择

对于日常信息的搜索,通常采用百度、谷歌等网站,但对于专业文献的检索则需要专门的数据库,每个数据库都有自己的特点。

(1)馆藏书目查询:书目是将图书、期刊按一定规则收录,并有序编排的检索工具。通常包含题名、责任者、主题词、分类号、索取号、ISBN/ISSN号、出版社等字段,输入检索词即可检索,大多数高校图书馆都有自己的馆藏书目数据库,检索、下载。

(2)中国学术期刊全文数据库:目前世界上最大且连续动态更新的数据库,内容覆盖工程技术、自然科学、农业、哲学、医学、人文社会科学等各个领域。可进行高级、专业、跨库检索以及期刊Ш健

(3)中国优秀博硕士论文数据库:目前国内相关资源最完备、连续动态更新的高质量学位论文数据库,包含理工、农业、医药、文史哲、法律、教育与社会科学、电子与信息科学、经济以及专题文献等。

(4)外文文摘数据库:既包含单学科数据库,如CA(化学)、PA(石油)、Georef、Medline等,又包含多学科综合数据库,如Dialog、EI、CSA、SCI、IEEE/IET、Spinger等。对于国际化的今天,外文检索已成为每个考研人员必备的技能。

(5)其他数据库:Google学术中文和外文搜索、万方、维普、知网、专利检索系统以及标准文献检索数据库等。数据库文件普遍采用CAJ和PDF格式,须下载专门的浏览器来阅读。

2.2 检索词确定

确定中文检索词:设置与论文名字相关的检索词进行检索,如,立体印刷、3D印刷、立体图像、立体印刷品;确定英文检索词:stereoscopic printing、3D printing、stereoscopic image printing、auto-stereoscopic image

2.3 检索过程及结果分析

利用以上介绍的检索方式以及各个数据库的特点,选用中国知网、Google学术、硕博士论文数据库、EI和专利网,结合设定的检索词进行文献检索,该文例子主要围绕图书、期刊、硕博士论文和专利来搜索。为了便于对文献的管理、引文编排,论文写作采用EndNote插件建立分类文献库。在搜索文献时注意尽可能将时间设定在近5年内,学位论文搜索优先,这样对研究对象的背景、现状首先有大概的了解;其次进行大量其它文献的检索,可以参考论文后的参考文献、某个领域的专家或数据库连接到的相似文献等来扩展检索。无论对于中文还是外文的搜索,不能盲目下载,必须注意文章摘要与目标对象是否有关,否则会加大有用文章筛选的工作量。

检索到的文章由于存在相似性,一定要做好分类,方便快速查找。总的来看立体印刷技术相关文献主要涉及人眼视觉理论、光栅成像、立体图像制作、光栅材料及使用、立体印刷产品质量评价和市场分析、立体印刷工艺研究以及相关设备制造等。通过以上文章的搜索我们可以对立体印刷有大致的了解,对于写综述性的论文可以按照以上点来设置章节标题,如果要进行某一点的深入研究,需要认真研读,将文章的各个点吃透,或进一步查阅相关资料。总之,文献检索不能盲目,初步检索分析后,再次具有针对性性的进行检索。

3 结语

该文围绕信息检索技术展开讨论,首先,简单的介绍了信息检索的含义、目的、意义、检索要素和方法等,让大家对此有直观的认识。其次,结合立体印刷技术综述报告的例子,详细的阐述了文献的查找渠道、提炼、分析和总结过程,对以后工作和学习中有效的进行信息检索具有一定的参考价值。

参考文献

[1] 刘双魁.信息检索与利用[M].上海:东南大学出版社,2010:8.

[2] 祁延莉.信息检索概论[M].北京:北京大学出版社,2013:7.

信息检索论文范文第7篇

【关键词】信息环境;文献检索课;改革

0 引言

信息检索课是高校实施信息素养教学的主要形式之一,它的主要目的是培养学生的情报意识、帮助学生掌握利用图书馆文献资料、提高学生的信息素质与信息检索能力。传统的信息检索课程教学内容一般按信息检索概述、图书馆服务与馆藏书刊的利用、事实与参考资源的检索与利用、文献型数据库检索与利用、网络信息的检索与利用、专业信息资源的检索与利用、特种信息资源的检索与利用、信息综合分析与利用等大章进行教学,每一大章又细分为若干小节;教学方法上一般先讲概念,再讲检索原理与方法,最后让学生上机操作。但是目前《信息检索》课程的授课教师大多是缺乏信息管理背景、缺乏系统的计算机科学的知识,这势必影响到课堂效果、课程实践以及课程目标的实现。因此,需调整文检课授课内容及教师的知识结构,必须改革《信息检索与利用》,只有将该课程的教学重点由“如何用”向“如何存”转移是数字化环境下信息管理工作的必然趋势,是顺应信息管理向知识管理过渡的必然。

1 《信息检索与利用》课程存在的主要问题

笔者通过上《信息检索与利用》课发现有些文检课教材滞后,内容未能紧跟时代需求,与专业课脱节,不能激发学生的自学兴趣,已不适用泛在信息环境下的教学;文检课目前普遍存在地位不高,学校与图书馆领导层面重视不足;学生信息检索能力差,授课教师队伍参差不齐等问题,直接导致文检课已跟不上信息时代,迫切需要改革。只有认清目前存在的问题,才能合理的提出解决的策略与建议。

1.1 《信息检索与利用》课程教育存在的误区

教育理念更新慢,教学模式简单化。在课程建设上,教育理念出现重功利轻素质,重专业轻基础,重实用轻人文的现象;理论教学“填鸭式”;有些信息检索课是流于形式,教学与专业学习脱节,理论学习与实践脱节,不能激发学生自主学习的兴趣;信息检索重信息知识、检索方法的传授和信息检索能力的培训,轻信息素养的教育。个别高校信息检索实验课时少,甚至没有,多媒体课件、网络检索教学更是无从谈起。

1.2 学校与图书馆领导对《信息检索与利用》课重视程度不够

毫无疑问,学校与图书馆领导的重视与否对文检课教改能否顺利进行必将起到决定性的作用。首先,领导的支持与肯定能为文检课教改的顺利开展创造一个宽松的环境。我们都知道,文检课不同于一般的理论课,它是一门方法技能培养课。在讲授基本理论的基础上,课程偏重于学生实际动手能力的培养,因此,要达到满意的教学效果,学校(图书馆)必须致力于文检课教学条件的改善。其次,领导的重视必将极大地调动文检课教师的工作积极性,使他们能充分地发挥主观能动性,更好地投身教学与改革的实践。再者,受到学校与图书馆领导的重视,并在文检课的改革过程中经常得到领导的建设性意见与指导,对于文检课教改沿着健康、积极的轨道顺利地向前发展必将起到重要的作用。

1.3 学生对《信息与文献检索》课态度冷淡

笔者通过讲授文检课过程中发现学生对查找文献很陌生,检索信息很少有人使用图书馆数据库,至于科技期刊论文他们从没有看过,检索信息只会求助百度等搜索引擎,对文检课的不了解导致学生对信息素质培养、创新能力培养的完全无视,更谈不上重视,这也必定会导致学生信息意识淡薄,自主提出问题特别是专业问题的能力较差;信息道德缺失,无视前人的学术成果,论文抄袭严重;信息检索能力较差,分析课题的能力亟待提高;信息利用能力较差,在筛选、评价和利用信息能力很弱。

1.4 文检课授课教师业务素质和教学能力参差不齐

高校里,文献检索课程教学都是由图书馆负责,开设文献检索课程教学大多由图书馆信息服务部的学科馆员完成。目前国内的图书馆员没有严格的从业标准和准入制度,具有学科背景和文献检索能力的比较少。同高校专业学科的专业教师相比,高校图书馆文献检索课教学教师存在学历层次不高、学科专业水平有限、科研研究经验不足等缺陷。

2 泛在信息环境下高校图书馆《信息检索与利用》课程设计与改革的标向

泛在信息环境下,高校图书馆必须改革《信息检索与利用》课,改变以往的教育理念和教学模式,大胆革新教学内容,以激发学生对《信息检索与利用》的兴趣,提高教学质量,促进学生的素质教育的提升。

2.1 改革传统教育理念和教学模式

坚持以人为本、以学生为主体的教育理念,倡导以学生自主“探究”为主,教师指导为辅的教学过程; 倡导以计算机检索为主,手工检索为辅的实验教学手段;倡导以学生为中心的“发散式”教学为主,以教师为中心的“填鸭式”教学为辅的教学定位。改变过去重实验操作培训轻实践能力培养、重知识传授轻人文素质教育做法,激发学生信息需求的热情,积极鼓励学生投稿,发表学术论文。

2.2 革新《信息检索与利用》课程内容

《信息检索与利用》课程建设情况目前,许多高校图书馆非常重视大学生的信息素养教育,既注重教学实践又注重系统的科学研究。主要有以下培养途径:

2.2.1 开展专题讲座、开设独立的文献检索课教学课程、在线信息素质教育、新生入馆教育等

就课程名称和内容来看,针对不同学科的“文献检索与利用”、针对提高数据库信息检索技巧的“数据库与信息检索”,针对毕业生的“信息利用与论文写作”,针对提高低年级大学生信息素养的“图书馆概论、服务及利用”等课程名称。

2.2.2 开设“文献检索与利用”、“信息存取原理与技术”等课程

对于高级者(大学四年级、研究生),文献检索课程教学的任务主要是培养学生有较强的信息敏感度、信息获取能力和信息分析能力,并能更好的把握本研究领域的研究现状、重点、难点和趋势,缩短科研进程,提高自主学习能力。在课程内容设计可根据学生需求制定“图书馆前沿科技信息分析与研究”、“论文与技术报告写作”、“求职书设计”等系列课程以前潜入式的专题讲座;对于专业型学习者(研究生),文献检索课程的任务主要是培养学生有效利用信息的能力,更好的判断信息、挖掘信息、整合信息、评价信息,使信息增值并创造新的知识,期间的课程内容应该围绕“如何写好开题报告”、“如何写好课题立项申请书”、“国内外核心期刊的投稿技巧”等应对专业学习研究制定课程。

2.3 做好《信息检索与利用》课的宣传工作高校图书馆必须做好文献检索课程教学、专场讲座、在线培训、新生入馆教育等服务宣传工作。“一小时讲座”、“信息素养”、“专题讲座”等讲座信息通过图书馆主页较醒目的位置提供定期和不定期的公告信息。

2.4 充分发挥学科馆员与专业教师合作的作用

在学科馆员不足的情况下,将专业教师加盟于“信息素养教育”的教学过程中来。从专业的角度,让专业教师(或学科馆员)指导学生撰写毕业论文和课程设计论文的写作。在电子阅览室,专业教师与信息检索课教师(或馆员)一道参与指导学生获取、加工、整理信息过程,完成毕业论文设计。

因此,在文献检索课程教学过程中涉及信息创新、深层次学科专业内容、课题申请等教学环节讲座还需和高校学科专业院系的教师或聘请兼职专业教师完成整个教学任务。而当前高校图书馆文献检索课程教学过程中与院系教师或聘请图情教师合作完成教学任务的教学模比较少,可以以此为契机,加大图书馆与学院教师的合作,共同开设文检课的教学。

2.5 充分发挥学生的专业智慧

让学生自主设计论文课题,馆员参与课题分析、帮助查找信息,形成教学互动。从教师(或馆员)的“演示”中,学生学到信息获取的全过程,学生从模仿、思考分析、亲身体验中得到信息能力提升的满足。教师以身示教,激发学生激情。同时,学生从教师身上学到了治学严谨的作风。

2.6 加强交流、展开讨论、提倡争鸣

在基于网络的研讨式教学中,师生之间、学生之间可在课堂、课间、实验课,课余时间则可通过电话、短信、E-mail、QQ、博客等,开展相互讨论和争鸣问难,培植自由争辩的学习氛围。研讨缩短了师生之间的距离和空间,增强了师生的联系,激励了大学生自主探究学习的积极性和主动性,同时对教师的综合素质是考验和促进,起到了教学相长的效果,因此这种双赢的教学效果是融洽、亲密的。

3 结语

紧跟形势、及时调整教学方法和内容,是《信息检索与利用》课教学改革的必要条件。在现今海量信息的年代,大学生具备良好信息素养是今后工作和生活的要求,《信息检索与利用课》在高等教育中显得日益重要,其实施需要长期的实践探索。

【参考文献】

[1]周毅华.新信息环境下信息检索课相关问题探讨[J].图书馆论坛,2003(5).

[2]李明明.文献检索课教材更新探索[J].山东图书馆季刊,2005(2):108-110.

[3]徐庆宁.关于完善我国高校信息素养教育内容的思考及建议[J].图书情报工作,2006(11):110-112.

[4]刘彩娥.文献检索课教材改革的几点建议[J].大学图书情报学刊.2006,24(1):32-33.

[5]杨晓兵.网络环境下文献检索与利用课的改革与实践[J].现代情报,2008(11).

[6]孙会清.我国高校信息素质教育课程体系建设研究综述[J].现代情报,2008,28(4):205-207.

信息检索论文范文第8篇

【关键词】可视化;本体;期刊论文检索

“一幅图胜过一千句话”,信息可视化以满足信息检索用户日益增长的多样化、个性化检索需求为目的,帮助用户揭示信息背后隐藏的信息关联及规律,提高检索效率。本文使用文献[1]构建的数字参考咨询领域的本体及数据关系进行可视化研究,将信息可视化应用到期刊论文语义检索中,一方面实现了基于领域本体图的可视化导航,方便用户了解领域概念及概念之间的关系;另一方面将检索结果转换成图形,将期刊元素如作者、引用与被引用等多维关系转换成二维关系,显示在一个二维空间中,帮助用户理解检索结果、把握检索方向,以提高信息检索的效率和性能。

1.信息可视化的国内外研究动态

1.1 信息可视化在国外的研究

信息可视化研究被国际上列为热点研究课题是在20世纪90年代中期,以两个系列的国际研讨会为重要标志。一个是从1995年开始,每年10月在美国召开的IEEE Symposium on Information Visualization,除了定期召开会议外,还出版了一系列会议论文集,在业界产生了较为广泛的影响。与此同时,从1997年开始,IEEE每年7月在英国伦敦召开信息可视化国际研讨会(IEEE International Conference on Information Visualization),并同样出版了一系列会议论文集。欧美的这两个系列的国际学术研究会已形成了一种气候,它不断将理论研究与实际应用推向新的高度。欧美国家的可视化研究已经取得了一批具有领先地位的成果,在理论研究方面比较注重可视化模型方法,在应用领域不仅出现了一批原型系统,而且部分系统早已投入使用。

笔者以主题为“论文信息可视化”进行了EBSCO数据库外文检索,在EBSCO中查找的的数据库有:Academic Source Premier、Bu-

siness Source Premier、ERIC、Library、Information Science & Technology Abstracts、Teacher Reference Center。检索范围为1985-2010,检索式为“Title=(visualization)AND Abstract=(literature research+papers research)”,检索结果为34篇,剔除重复的1篇,共33篇相关文献,检索结果统计分析如表1-1。

EBSCO数据库中相关文献的检索结果显示,最早的关于论文信息可视化的外文文献是1991年Cort,Louise Allison撰写的“Word in Flower:The Visualization of Classical Literature in Seventeenth-Century Japan (Book)”此篇为一书评[2]。1992年后的5年中只有1篇相关文献。1997-2010年累计发表相关文献31篇,这表明新世纪以来国外对可视化在文献检索中的研究日益重视。笔者在研读以上文献时发现,国外在信息可视化的研究方面的论文主要集中可视化在医学中的应用、可视化工具在文献关系揭示中的研究、可视化检索模型研究、个人信息搜索并可视化显示等,说明可视化为文献检索提供可视的直观的效果,同时文献检索也促进了可视化技术的不断发展。

1.2 信息可视化在国内的研究

我国最初几年关于信息可视化的研究中大量的文献主要是对信息检索可视化概念的介绍,以及地理、空间、数据库、文献和多媒体等方面的可视化技术的介绍。现在己经有越来越多的学者关注面向网络及大规模信息资源的检索可视化技术、各个具体领域的可视化、各种算法的改进等具体问题。针对可视化技术在文献研究领域中的应用主要有:胡志刚、侯海燕撰文对科学技术期刊群中的17种期刊进行了聚类和社会网络分析,可视化地显示了各个期刊之间的亲疏关系和关联特点,其可视化对象是期刊及其期刊之间的关系,其研究对象是期刊论文[3]。鲍杨、朱庆华在论文中以CSSCI数据库收录的全部情报学领域的论文(1998—2007年)为数据源,运用社会网络分析方法,建立了较为完整的情报学研究领域引文网络、共引网络及作者合著网络。同时他们还选取其中的重要节点,用Pajek进行了可视化,体现了近10年来我国情报学研究领域的主要作者和论文[4]。张学福教授在信息检索可视化领域的研究成果颇多,他不仅介绍了信息检索可视化的基本问题,即信息检索模型、信息内容描述、可视化映射技术、可视化显示技术、全局映射与局部映射、实时可视化和人工参与的可视化等。而且从功能特点等角度介绍了几种代表性的可视化开发工具:OpenGL、Open Inventor、IDL和VTK等,以便用户根据其特点选择相应的开发工具来开发可视化信息检索的应用软件[5][6]。张学福教授带领的研究生有三篇相关的硕士论文:《基于引文的信息检索可视化系统研究》一文基于信息检索可视化技术及引文理论,研究并构建了具有个性化特色的集检索、可视化及统计分析功能于一体的基于引文的信息检索可视化系统[7];《基于摘要信息的中文信息检索可视化系统研究与实现》分析比较国内外典型的信息检索可视化系统,并将基于词共现的概念空间方法与信息检索可视化技术相结合实时生成概念空间图,实现了检索过程和检索结果的可视化,设计并实现了集成信息检索、情报分析和服务功能的基于摘要信息的中文信息检索可视化系统,并对系统进行测试与评估[8]。

可视化的检索平台在国内的研究有人立方[9],谷歌挑歌[10]等。人立方关系搜索是微软亚洲研究院正式的一款新型社会化搜索引擎,它能够从中文网页中自动的抽取出人名、机构名、地名以及中文短语等,根据搜索的关键词和与其相关的人名之间的关联度强弱自动的计算每一个人名与关键词直接的距离、数据大小以及具体的摆放位置等等,并通过一条有标明人际关系的细线连接他们。谷歌挑歌相比其他音乐搜索引擎来说,谷歌挑歌采用的是一种相对模糊的搜索模式。该系统不是根据歌名或歌手名来搜索,而是调节节奏从舒缓到强烈、声调从低沉到高亢、音色从丰富到单纯这三个滚轮,依次在音乐库中挑选出符合条件的歌曲。虽说是相对模糊的搜索模式,但对寻找某一类型的歌曲还是很有帮助的。

可视化技术在期刊检索中的应用有中国科学院国家科学图书馆在2010年开发的可视化检索平台[11]。该系统的可视化借助Flash软件实现,输入的检索词仅限英文,检索的文献也仅限英文文献,从主题、作者和期刊三个方面形成可视化界面,为检索提供了一定的指导作用,但是其检索的最终结果也是以列表的形式实现。比如检索计算机学习方面的文献,限定返回记录数2000条(有50-4000之间的5种选择),在检索框中输入“computer study”以主题可视显示,“computer study”目标体(文献节点)分“case study”、“effective”、“model”、“experimental studies”等目标体,选择“experimental studies”,结果就会以列表形式显示48条文献目录,浏览文献目录人工查找自己所需的文献。

从整体上看,我国在该领域的研究与应用还处于起步阶段,与国外先进技术有较大差距,研究呈现出零星、分散的特征,没有形成规模。主要研究单位有武汉大学信息资源研究中心,中科院国家科学图书馆,中科院软件所及部分大学的图书情报院系和计算机学院等。

2.基于领域本体的可视化导航检索机制的设计与实现

基于领域本体的可视化导航检索首先确定可视化对象,这里的对象包括基于领域本体的领域概念集合和文献及其属性两类。其次,构建可视化空间。即降低高维向量空间的维数,构建低维可视化空间,这是可视检索的关键,不同的可视化检索工具构建可视化空间的方法不同,一般来说,构建可视化空间应主要考虑两个因素:一是以其信息可视化的方法为基础,二是以其自身文献信息系统的结构为基础。本文基于领域本体概念的可视化导航按照双曲树[12]的表现方式,将层次关系显示在一个双曲平面上,然后将双曲平面映射到显示区域。而期刊论文语义检索结果由于受人类认知能力的限制,我们只能感知到一维、二维和三维的物理对象,所以我们的可视化空间只能是二维或三维,显示维数不同,接口的空间表达能力也就不同。本系统为了能清晰地表现节点文献的属性,将四维关系降为二维显示,方便用户理解和使用。

2.1 基于领域本体概念的可视化导航

目前出现很多检索系统采用了无定型关键词的询问系统,只要输入检索词,平台就会询问希望用到的代名词、相似词及下位词等,以便用户拓展查询。而基于本体的可视化检索系统用可视化的方式显示检索词的语义关系,一方面体现可视化的优点,以直观的可视的形式为初入本检索领域的用户介绍该领域的具体内容及研究热点等问题;另一方面,避免了用户筛选词的过程,本系统根据领域本体库中概念间的语义关系,直接检索,将最全、最准确的结果反馈给用户。基于本体的导航机制通过揭示信息对象间的语义关联,能够准确、深入地表征信息的内容,是一种高层次的内容导航方法。本系统采用Flash工具,以本体概念为节点,实现了可视化的导航。执行代码如下:

2.2 基于本体的期刊论文检索结果可视化

期刊论文的检索结果可视化是基于用户需求的智能导航,其目的是通过期刊论文间的关系指导用户检索所需文献,即随着用户浏览意图的不同,提供不同的信息,实现动态导航。因此,用户使用过程中,用户点击不同的属性按钮实体,将根据实体类别生成不同的检索结果。这种导航是根据不同的中心节点内容动态生成。例如点击甲文献,则以甲文献为中心节点,以同著者文献、相关文献、参考文献、被引文献为四个属性按钮实体,点击任何相关文献按钮实体,则生成相关的文献,如果选择相关文献中的文献乙,则以乙文献为中心节点,并动态生成乙的属性按钮实体和相关文献。可视化的显示通过Flash调用JS方法,对数据库元数据进行检索,录入XML中,然后调用显示。具体代码如下:

期刊论文检索结果可视化导航,将中心节点文献的四维属性降为二维关系显示在页面。如果属性有值则显示节点球体,同时显示节点文献题名;如果属性值为零则不显示。随着鼠标在属性节点的点击转换中心节点。其实现代码如下:

3.基于本体的期刊论文可视化检索系统介绍

3.1 领域本体的可视化

基于本体的期刊论文可视化检索系统以数字参考咨询领域的期刊论文为例,在用户只知道数字参考咨询这个大类,而对下位类领域知识不了解,却需要认识该领域知识的用户提供帮助,即给初入数字参考咨询领域的用户指引方向;同时也为身在参考咨询领域的人员理顺知识结构,指导期刊论文的语义检索。用户只要点击导航列表中的数字参考咨询,主页面中将显示本文中构建的本体图,此图实现双曲几何的可视化,将层次关系显示在一个双曲平面上,然后将双曲平面映射到显示区域。点击图中的概念节点,系统将以该节点为检索词列出相关的文献。可视化导航图如图3-1。

3.2 可视化导航列表

点击本体概念的可视化导航中任意节点,系统就会以该节点为输入词将语义检索结果以列表图的形式返回到用户桌面。以下以点击参考咨询2.0为例,其实现效果如图3-2。

3.3 检索结果的可视化导航

以可视化导航列表为基础,点击任意一篇文献题名,系统将以该篇文献为中心节点,以参考文献、同著者文献、被引文献和相关文献四个属性值为四个检索方向,实现文献在可视化状态下的连续导航。将中心节点的四维关系将为二维关系显示。图3-3为点击期刊论文《虚拟参考咨询2.0全景扫描》,可视化导航以该文献题名为中心节点,以参考文献、同著者文献、被引文献和相关文献四个属性关系展开显示。

点击被引文献,《虚拟参考咨询2.0全景扫描》这篇期刊论文的被引文献将以被引文献按钮为中心散发开来。其效果如图3-4。

点击参考文献则以参考文献按钮为中心展开该篇文献的参考文献题名,其效果如图3-5。

点击同著者按钮则以同著者文献按钮为中心展开该篇文献的同著者文献。如图3-6所示。

由于本系统数据量只有1362条,所以检索结果有可能是1条记录或没有相关记录,这种情况可以随着数据量录入的加大逐渐得到改善。

点击相关文献则以相关文献按钮为中心展开《虚拟参考咨询2.0全景扫描》的相关文献题名,其效果如图3-7所示。

以上都是针对《虚拟参考咨询2.0全景扫描》的相关可视化导航,而相关属性按钮展开的文献节点同样在鼠标的点击下变为中心节点。如图3-8,点击相关文献《基于知识管理框架的合作数字参考咨询服务》,则中心节点就会变为《基于知识管理框架的合作数字参考咨询服务》文献题名,同时显示与之对应的该篇文献的相关文献。点击其他文献也是同样的道理。

只要系统中存有相关数据,则就有记录显示,如果没有相关数据,则不显示。同时,为了用户返回方便,系统提供了后退按钮,使用户操作起来来回自由且方便。

4.总结与展望

信息语义检索及可视化导航是一个较新的研究方向,随着信息检索技术及信息可视化技术的发展而发展起来,同时随着网络信息资源激增,以及用户信息需求的进一步提高而获得了更大的发展空间,将日益显示其优势。而在实际检索环境中,信息语义检索及可视化显示并没有得到广泛应用。本文针对传统期刊论文检索系统可视化效果差的不足,实现了对数字参考咨询领域期刊论文基于本体语义图的可视化导航检索系统的开发。提供了基于本体的可视化导航,方便用户对领域知识一目了然,同时能指导用户检索,让检索变得轻松自如。

然而,目前系统的可视化不能以线条的长短或球体的大小来指导记录的权重或重要性,需要进一步改进。在动态效果等方面也需要进一步完善。

参考文献

[1]张学梅.基于本体的期刊论文检索系统研究.图书馆学研究(理论版),2011(12):66-71.

[2]Cort,Louise Allison.Word in Flower:The Visualization of Classical Literature in Seventeenth-Century Japan[J].Journal of Asian Studies,1991(2):171-173.

[3]胡志刚,侯海燕.科学技术学期刊群的可视化分析[J]大连理工大学学报(社会科学版),2009(2):119-123.

[4]鲍杨,朱庆华.近10年我国情报学研究领域主要作者和论文的可视化分析——基于社会网络分析方法的探讨[J]情报理论与实践,2009(4):9-13.

[5]张学福.信息检索可视化基本问题研究[J].中国图书馆学报,2006(3):37-40

[6]张学福.信息检索可视化开发工具[J].现代情报,2005 (11):38-41.

[7]孙巍.基于引文的信息检索可视化系统研究[D].黑龙江大学信息管理学院,2007:1-73.

[8]陈颖.基于摘要信息的中文信息检索可视化系统研究与实现[D].黑龙江大学信息管理学院,2007(2):1-56.

信息检索论文范文第9篇

>> 文献的网络信息检索简述 试析高校文献检索课的网络检索教学 基于大学生信息素养教育的文献检索课教学改革 基于元认知理论的文献信息检索教学改革 网络环境下高职学生的文献检索教学 基于建构主义的文献检索课教学方法探讨 基于教学模块的文献检索改革与实践 基于本体的专业文献检索 基于P2P技术的网络信息检索探讨 网络信息检索的工具 基于网络资源利用的化学化工文献检索 基于本体的无线网络文献检索研究 基于向量空间模型的信息检索技术的探讨 基于信息素养教育的高校文献检索课改革 基于仲景学子培养的医学文献信息检索课程设置研究 基于信息素养教育的高职院校文献检索课思考 关联理论视域下的文献信息检索相关性的探讨 《网络信息检索方法》教学设计的优化 探析网络背景下的信息检索教学设计 利用网络进行文献检索课教学的实践与探究 常见问题解答 当前所在位置:).网站参考国内外学习支持系统结构的先进理念、建立了以下体系,为信息检索学习搭建学习情景。教学网站的资源包括:

(1)教学管理:将教学设计包括教学计划、课程内容、考试要求等,贯穿于学期准备、学习目的、学习内容、学习任务、学习媒体和学习评估等要素的设计中。

(2)网上课堂:采用PowerPoint,Authorware,Flash视频等软件制作动画演示,结合文本、动态展示教学内容的教案和教材。这些电子教材突出了以学习者为中心的理念,辅以多维环境技术和分析技术、心理支持技术和交互技术、元数据技术,在检索技术、数据库应用、信息调研等各个教学方面,为学生提供上网、互动、开放、自习方式的学习环境。网上课堂除了在软件制作上突出新颖性、多媒体性,更重要的是加强内容的新颖性,及时更新有关数据库、网站变化的教案,不断跟踪实用、适用数据库的应用,积累教案。复旦大学文献检索教学网站上,已经有文理医三个专业的教案及数据库、网站教学近30种。电子教案、实习指导出版了三个专业近20版(每月更新)。并且在广域网上开放,无须账号密码即可使用。

(3)学习策略指南:学生带着科研课题进入课程学习,学习支持系统必须进行策略学习指导,以正确引导学生构建自身知识体系.

指南围绕课题,从关键词确立到规范检索句法提问式的构造,从数据库检索到专业重要网站的选择和利用,从核心期刊的确立到权威著者的引文分析,从科研论文、综述文献的应用和引用分析研究到撰写,将信息检索学习与信息素养能力培养目标密切配合。

在校园网现有全文数据库的资源中,学生不仅从全面系统的数据库入手,系统的获取学术信息,在学习策略的指引下,进一步在internet大环境下,深入各专业数据库和专业协会、网站等进行信息分析研究。将检出的信息融入知识体系,与科研课题相结合,开展更为全面专业的信息调研。

2.信息资源环境

Internet校园网数据库平台和数字图书馆的发展,是开展网络信息检索与利用课程建构主义学习支持的基础情景。

图书馆馆藏目录体系从个体馆藏到联合目录和全国高等教育文献保障系统。核心期刊确认体系如JCR(美国科学引文数据库期刊引用报告)、中文核心期刊要目总览等。

全文数据库如中国期刊网,万方数据库等中西文全文电子期刊。网络数据平台如Web.of.know.ledge,从关键词到文摘到全文及引文检索,从期刊、学位论文到专利文献会议文献,从生物医学到人文理工的一站式多学科权威学术信息的提供。多元信息数据体系Ovid.ebsco.oclc从专业新闻稿,学术期刊专家评估信息到全文,从原始文献到三次信息检索,专业网络信息如中国知识工程基础设施网,中国高等教育保障体系Calis等。

特种文献如生物信息学数据库NCBI.EBI.CIB的序列报告,蛋白质结构预测……;专利文献如美国专利和商标局(www.uspto.gov),中国专利信息网;标准数据库如中国工程技术标准信息网,各国标准网站;学位论文PQDD,中国学位论文数据库等。

这些资源都构成了信息检索乃至信息素养能力培养的庞大网络信息资源知识体系,为信息检索提供了丰富的资源前景,

3.信息检索教师与平台设计人员密切配合,根据信息教育的特点,以WEB为基础,信息检索与利用远程教育教学为管理系统,采用B/S、C/S混合体架构结合的体系,建立远程教育平台。自愿参加远程教育的同学,在登记注册后,可以在广域网上自由使用网站资源、网上递交作业、进行网上咨询和交流。在图书馆资源丰富的馆藏、电子资源、完善的文献保障系统的大环境下,为学生构筑信息检索的互动学习网络支架,

在广域网教学网站支持下,学生不受时空的约束,自由的选用任何时间和地点,自主选择感兴趣的话题,自行决定学习方式和时间,通过学习支持系统提供的信息资源环境、远程教育平台、教学网站资源库的学习情景,获取知识,建立和构造自己的知识体系,培养自己的信息素养能力,并且通过信息化教学辅导体系反馈给教师。教师在学习支持系统中,能够保证学生在任何时间内自由使用检索实习机房和实地指导。实习机房维护由文检课教师自己兼任,定期进行网络通畅保障工作包括软件更新、硬件调配等,保证实习基地的设施完备和正常运行。

[参考文献]

[1]杨木容.对文献检索课网上教学的探讨[J].图书馆杂志 2005(7)

[2]李晓玲.符礼平.王宇芳等.信息检索网上学习支持系统[J]. 图书馆杂志(12)

信息检索论文范文第10篇

【关键词】信息检索 研究进展 可视化

引 言

迈入信息社会,网络已成为人们生活中不可或缺的一部分,而信息检索理所当然地成为人们融入网络的一个重要途径。在互联网迅速发展的同时,信息检索的研究也取得了较大的成绩,信息检索的理论和实践对推动互联网的发展有着重要的作用。为进一步了解我国信息检索的研究状况,本文对2007 -2011年这5年间的相关研究进行统计分析。

数据来源

笔者在CSSCI数据库中以“信息检索”为关键词,时间设定为2007-2011年,检索共得到398篇文献,以这些文献为基础,利用文献题录统计与可视化工具来分析信息检索研究的进展情况。

研究方法

作为现今多学科中一种常见的信息或数据可视化形式,科学知识图谱是通过对某学科领域在特定时间段内发表的学术论文或者专著的作者、题名、关键词、作者机构等信息用可视化的图谱形象地展示学科的核心框架、前沿领域和其他有关的信息,也可运用多元分析手段得出某学科领域在特定时期内形成的以作者、文献、期刊、机构等为节点的图谱[1]。由于科学知识图谱能够直观地展现学科知识结构,自20世纪80年代创制以来得到广泛的传播和深入的发展,出现了较多的知识图谱分析工具。本文选取了Citespace、Netdraw和SATI这三种代表性工具来统计文献信息和绘制科学知识图表,通过对检索到的信息检索研究相关文献信息进行统计和可视化展现,更清晰地展示这5年间信息检索的研究概况。

研究状况分析

4.1文献总量与年度分布

在这398篇文献中,研究论文有359篇,综述23篇,评论8篇,报告4篇;涉及的学科有管理学、语言学、艺术学、经济学、社会学、教育学等,其中图书馆、情报与文献学是最多的,共352篇;在年度分布中,2007年113篇、2008年100篇、2009年73篇、2010年61篇、2011年51篇,如图1所示:

从图1中可以看出,有关信息检索的研究文献在2007-2011年是逐年递减的,其中下降幅度最大的是2009年。笔者用同样的检索关建词在CSSCI数据库中查看往年的文献数量,发现我国信息检索的研究是经历了一个又冷到热再组建到冷的发展,有关文献的高峰期是在2004-2005年,之后由热逐渐转冷的过程由图1可以清晰看到。

4.2 文献的期刊分布

这398篇文献分布在32种期刊上,平均每种期刊载文量是12.44篇,其中发表1篇的有10种,发表2篇的有3种,发表3篇的有2种,发表4篇以上的有17种,如表1所示:

这17种期刊都是图书情报类期刊,共发表文献376篇,占所检索出的文献总量的94.47%。这项统计也进一步说明了图书情报类的期刊是信息检索研究文献发表的主要阵地。其中发文篇数在50篇以上的有《情报理论与实践》、《情报杂志》、《图书情报工作》。

4.3 作者与机构的分布

笔者对这398篇文献的作者进行了统计,共有581人,发表3篇以上文献的作者有38人。表2列出了2007-2011年间发表文献最多的前19位学者,也就是发文总数在4篇及以上的作者及其所在的机构。需要说明的是,表中的数字可能不是每一个学者的全部发文量,因为笔者检索文献时设置了关键词和CSSCI来源期刊等条件。

从表3可以看出,武汉大学以5年发文29篇、平均每年发文5.8篇高居榜首,其次是南京大学、中国科学技术信息研究所、中山大学、北京大学等机构,从高产机构的分布来看,信息检索研究的主力军还是来自高等院校。

4.4 高被引作者的分布

为更好地显示信息检索领域作者的学术影响力,笔者从作者的被引视角来进行分析。经统计,在2007-2011年间发表的398篇文献中,引用文献共4 291篇次,篇均引文数为10.78篇次。在统计过程中剔除了无效引文和署名为机构或课题组的引文,最后统计出了作者被引数, 2007-2011年被引数在5次及以上的作者,共20人,如表4所示:

从表4中可以看出,被引次数最高的是G.Salton,其次是赖茂生、T.Saracevic、N.J.Belkin、P.Ingwersen、周宁等学者,排除国外学者,国内被引次数排在前列是有赖茂生、周宁、成颖、张晓林、吴丹、马费成、李景、黄名选、孙茂松、曹树金等学者。图2显示的是高被引作者按中心度分布的可视图,中心度越大,在图中表示的圆圈越大,其在信息检索领域的影响也越大,其与被引次数作者的分布基本一致,更形象地表示了被引作者的影响力。

4.5 核心研究主题的分析

为更好地分析和展示近几年信息检索领域的研究主题和研究进展,笔者对这398篇文献的关键词作了统计分析。统计发现共有861个关键词(无关键词的文献不在统计范畴),而共现次数越多的主题词就越能成为近几年的研究热点。出现频次在5次及以上的关键词,如表5所示:

图3是对共现次数高的关键词进行了可视化的结果,可以更清晰地表示主题词的分布特征。从表5和图3可以看出,排除 “信息检索”这一关键词之后, 2007-2011年间关键词共现较高的有:本体、跨语言信息检索、查询扩展、网络信息检索、数字图书馆、信息检索系统、搜索引擎、向量空间模型、关联规则、检索模型、信息可视化、语义网、信息查询、智能信息检索、Web 2.0等,这些高频主题词无疑构成了近几年信息检索领域的研究热点,其中跨语言信息检索、网络信息检索、查询扩展、信息检索模型与系统、语义网等是最受研究者关注的。

信息检索研究当前存在的问题

5.1 信息组织特别是网络信息组织标准化、规范化研究滞后

网络发展迅速,网络信息和更新非常快,而且网络的开放性使得任何单位或个人都可以在网上随意信息,但信息者不会依据一定的标准或规范去组织他们的信息,而这些呈指数增长却又无序的网络信息增加了信息检索的复杂度。要提高信息检索的效率, 必须从源头上来解决相关问题, 实行网络信息组织标准化、规范化[2]。这方面的问题在信息检索领域还有待解决。

5.2 检索技术和工具的适应性研究滞后

当前我国对于检索技术和工具的研究大多是集中在一般说明和比较分析方面, 很少有较具体的改进方案的提出和实现,可以说我国信息检索的技术性研究较薄弱。而且从现在的信息种类来看,人们不仅是要检索文本和数据信息,而且更多地会关注图形图像、视频、音频等多媒体信息,所以要使人们在越来越发达的信息时代获得所需信息, 就必须致力于解决新的技术和新工具的研究问题[3]。

5.3 检索工具评价较模糊,检索语言有待改进

高性能的检索工具会大大提高检索效率, 能为信息检索者节省不少时间, 但面对较多的检索工具时, 检索者往往不知道如何选择, 因此需要一套较完善的检索工具评价指标作为选择的依据[4]。另外,并非所有的检索者都能懂检索语言, 他们更倾向于使用自然语言,而目前的检索结果往往无法满足真正的需求,所以应致力于方便易用的检索语言开发研究, 最终能使检索者用简易的检索语言来达到检索目标。

5.4 文献研究内容冗余、创新性低

笔者所检索到的398篇关于信息检索的文献,有不少是内容交叉、重复率高、可用性差的,使研究成果的质量降低,另有较大一部分仅仅是引进说明或分析比较国外的信息检索成果,与国外信息检索领域的研究深度差距仍较大。

信息检索未来发展趋势

6.1 个性化发展,对用户体验的关注越来越显著

信息的冗余、雷同乃至信息爆炸等问题时刻困扰着人们,而信息检索研究的目的就是要从纷繁复杂的信息中寻找出符合需求的信息,并且不同群体或用户个体对信息的需求欲望愈来愈强烈,这就促使了信息检索要向符合个性化服务的方向发展[5],更注重用户的检索体验,针对不同用户的不同需求来处理检索的相关问题。

6.2 智能化发展

智能检索是基于自然语言的检索形式,通过对知识库的推理和搜索,把现代人工智能的技术与方法引入信息检索系统,使后者具有一定程度的智能特征,其目的是使信息检索系统理解文件包含的信息内容和用户的信息需要,在对内容的分析理解、内容表达、知识学习、推理机制、决策等基础上实现检索的智能化,得到用户能直接加以利用的知识或信息[6-7]。随着计算机智能技术和网络技术的发展,信息检索的智能化发展是必然趋势。

6.3 融合趋势更加突出

信息检索不仅仅在计算机学科、图书情报学领域作用突出,在医药、生物、农业等领域也逐渐应用较多,现阶段更有与金融商务、电子商务、网络技术等学科融合紧密,成为了不可或缺的重要应用工具。在经济全球化的发展进程中,信息是发展的支持要素,而且信息检索会更融入全球化的发展中,与其他更多的学科和领域相融发展。

6.4 专题信息、多媒体信息等新的信息检索发展显著

专题化信息检索是基于某一信息领域或某一特定用户领域的检索,针对特定的用户群或领域,在标引的过程中可以构建专业词库,大大提高标引的深度和专指度;网络上多媒体信息越来越多,根据用户自身体验,在图像、视频、音频的多媒体基础上进行新技术的信息检索。专题和多媒体信息检索同样也是个性化信息检索发展的重要部分。

6.5 多语言、全球化信息检索发展稳步前进

由于互联网是一个巨大的数字资源库,包含不同语言信息,随着信息查询用户素质的不断提高,对全球信息了解的需要越来越强烈,针对这种需求,在网络版叙词表的基础上,利用新的智能检索技术,实现不同语种间的有效转换,可以使用户检索不同语言的同类信息。这种多语言、全球化信息检索也会是今后发展的一大趋势。

结语

信息检索是一门技术性和实践性很强的学科[[8],在网络信息化时代,我们更应认识到现阶段信息检索领域存在的问题,加强理论研究,大胆实践创新,顺应发展潮流,信息检索领域的研究才能得到真正地长足地提升。

[参考文献]

[ ] 侯剑华.工商管理学科演进与前沿热点的可视化分析[D].大连:大连理工大学,2009.

[2] 谈大军,陈晓转.1998-2003年我国网络信息检索研究论文的定量分析与研究[J].现代情报,2004(12):66-69.

[3] 常春.网络信息检索存在的问题及发展方向[J].情报杂志,2003(11):93-94.

[4] 韩圣龙.网络信息检索工具评价指标[J].情报学报,2001,20(4):471-477.

[5] 黄如花,张春蕾.网络信息检索的发展趋势[J].图书情报知识,2002(4):49-50.

[6] 毕维峰,刘剑锋.网络环境下数字图书馆信息检索发展趋势[J].现代情报,2007(6):89-90.

[7] 刘宏伟.现代信息检索在网络环境下的发展趋势[J].现代情报,2006(10):67-68.

上一篇:铁路通信论文范文 下一篇:信息素养论文范文