信息检索过程中的用户交互行为及其影响因素

时间:2022-10-01 12:24:46

【摘要】Information Research Center, Wuhan University, Wuhan430072 〔Abstract〕Focused on the interactions between users and system, this paper elabrates the general methods of...

信息检索过程中的用户交互行为及其影响因素

〔摘要〕阐述信息与用户交互的情报理论基础,从行为发现、行为认知和相关反馈三个层面反映用户交互研究的通用研究方法,并针对用户信息素质差异、检索系统功能差异和检索社会文化背景差异提出用户交互的影响因素,讨论其对检索工具的影响。

〔关键词〕信息检索用户交互认知分析相关反馈

〔分类号〕G252.7

User Interaction Behaviors and Effect Factors in Information Retrieval Process

Pei Lei

Information Research Center, Wuhan University, Wuhan430072

〔Abstract〕Focused on the interactions between users and system, this paper elabrates the general methods of user interactions research form aspects of behaviors discover, cognition and relevant feedback. Then, it analyzes the main effect factors of user interaction behaviors in information retrieval process, such as users' literature, retrieval tools' functions and socio-culture background. At last, it gives some advices on promoting the functions of retrieval tools.

〔Keywords〕information retrievaluser interactioncognition analysisrelevant feedback

国外大量研究表明,用户的差异性逐渐在网络检索行为中得到重视,网络检索系统逐渐从异质化的资源整合扩展到异质化的用户需求整合。在信息检索研究中,也开始从用户交互角度考虑网络信息资源检索机制和机器学习功能,开发针对特定用户组的检索系统和个性化的信息导航。但是,目前国内这类交互研究主要集中在算法和技术改进层面,而信息行为分析层面的文献并不多见。另一方面,正如唐宇萍所言[1],“用户认知对情报检索具有战略性的研究意义”。因而,本文主要从情报学理论和信息行为层面讨论信息检索过程中的用户交互过程和改进策略,以期引得国内同仁的关注与探讨。

1用户交互行为及其研究现状

用户交互研究是通过研究用户与检索系统对信息需求的生成、表达、传递、处理和反馈的全过程来改良检索系统的检索效率,或者建立面向用户的网络检索工具的研究方法。从理论背景来看,用户交互研究整合了用户认知研究、系统学习理论、社会信息学和信息检索,通过用户信息检索的心理需求,用户需求表达,人机交互(HCI)中的沟通、学习与反馈,跨语言和跨文化环境的社会影响,提高检索系统的信息识别和匹配来提高检索效率的研究机制。从研究方法上看,用户交互研究的出发点是用户特征,以用户为中心开展的面向用户需求的适应性系统改良,形成对检索过程的反复匹配和精炼。

目前,用户交互研究主要集中在用户检索交互行为、用户认知、系统学习与反馈等几个方面,逐渐形成了基于统计的用户需求调查研究方法、基于用户认知的知识概念映射方法、基于系统相关反馈的智能学习以及推理方法等典型的研究方法。通过中国期刊网的文献调研,发现我国在上述领域已经形成了一定的研究规模(如表1所示)。但是,交互检索和用户行为研究还并不多见,而且用户检索行为也并没有从用户需求、情报认知和相关反馈研究领域独立成专门研究。相对而言,国外在20世纪90年代已经开始系统研究用户交互行为,Wilson用户交流通用模型、Ingwersen用户交互检索过程模型、Saracevic交互检索层次模型以及Belkin对用户交互过程的认知解释都是这一研究领域的标志性成果。

2 用户交互行为的研究方法

2.1用户调查统计研究方法

用户调查统计研究最常用的方法是通过网络检索实践中用户与系统交互数据的大样本定量分析方法。比如Amanda Spink和Bernard J. Jansen在《网络搜索:网络公共检索》中通过众多搜索引擎的检索数据统计分析来研究用户的检索行为特征,进而对用户公共网络检索行为特点进行综合研究[2]。

还有一类是对小样本的持续研究,通过对固定样本的跟踪研究来发掘用户的检索行为特征和习惯。比如Cothey对英国的206个大学生进行了10个月的网络信息查寻行为的研究[3],对URLs的事务日志分析5 431个用户信息搜寻的行为,为网络信息资源的建设和规划提出定量化的决策依据。此外,还有Schacter等1998年对儿童群体的检索特征和过程研究[4]等。

2.2用户认知研究方法

20世纪70年代后,一批研究者提出把认知研究作为用户研究的理论基础,并逐渐将情报认知理论引入信息检索研究。1992年,P. Ingwersen专门分析了用户认知特征和用户认知分析方法,并提出了基于用户认知交互的查询模型[5]。该模型指出,用户的信息目标揭示、检索结果类型设定、信息理解推理和用户支持设计是认知检索的四个关键因素,通过领域分析、认知任务分析、生命周期测试和实验测试等方法可以完成“用户认知概念与系统检索指令的概念桥接”。而Belkin的ASK理论提出信息检索的任务是尝试描述、理解和解决知识的非常状态,并在1995年建立了一个信息查寻模型关注信息查寻过程中的检索行为[6],该模型认为认知交互过程主要包括交互的目标(学习――选择)、检索方式(识别――详述)、资源类型(信息――元信息)三个方面。Saracevic的用户交互检索模型[7]可看作是一个“层次化的模型”,它包含三个层次:界面、认知与状态。其中,认知层次上,用户和系统的输出发生交互,通过这种交互,用户获得与其问题状态相关的文本信息。

此外,Dervin的意义建构理论提出构建以概念为基础的系统开发模型,Kuhlthwu、Ellis和Wilson对非确定性和问题解决理论的研究等也将用户思维行为与信息检索过程结合形成基于用户认知的信息检索过程。国内还有一些学者关注认知中介知识结构[8]和认知主体的相关性研究[9]。

2.3系统相关反馈研究方法

相关反馈的目标是从用户与查询系统的实际交互过程中进行学习、发现并捕捉用户的实际查询意图,并以此修正系统的查询策略,从而得到与用户实际需求尽可能相吻合的查询结果。目前,关于系统相关反馈的研究:一是对系统相关性的揭示;二是对系统反馈机制的研究。有些学者还采用匹配、相似度、系统相关反馈、主题性等术语描述系统相关,但在反馈机理上主要还是通过机器对检索对象相关性的识别来改进检索效果。迄今为止,主要的相关反馈方法包括词汇选择相似性相关研究、语法结构相似性相关研究、词频相关和概率模型相关研究等。

词汇选择相似性相关研究是解释用户或者标引者与系统之间的词汇选择相似性,但是标引者主题词选择存在相当的不一致性,不同标引者对同一对象的标引存在很大差异,使得纯粹词汇的相似难以反映内容相似度。而在语法结构相似性相关揭示中,目前还缺乏强大的能够支撑语法分析的语义和语用知识库,尤其还涉及跨语言及跨文化的协调。相对而言,基于词频和概率的相关性研究能够具有多维、动态、可测度和反馈控制的特点,具有相当广泛的应用,也是当前大多数相关反馈技术的理论基础。

在应用层面,基于相关反馈的各种检索技术采用最多的是向量模型,即将文本或者图像都表示成特征空间中的向量形式,从向量模型的角度出发,开发检索模式。典型的相关反馈技术算法模型包括MARS系统中实现的查询向量转移算法,CBIR模型权重调整算法,SVM的相关反馈算法以及基于贝叶斯的反馈算法等。

由于相关反馈可以实时地修改系统的查询策略,为检索系统增加了自适应功能,提高了检索效率。但是,相关反馈在控制信息搜集方面主要还是关注文本或信息本身的内容揭示来改进检索,文本内容与用户需求表达之间的匹配关注程度仍然不高,也是ACM SIGIR 2006提出的今后算法改进的重点突破领域。

3信息检索过程中用户交互行为影响因素

信息检索过程中的用户交互行为主要包括用户需求表达和系统反馈两个过程,两者相互作用,通过系统对用户需求的反馈,能够改进和提高用户对检索认知及检索需求表达的准确性。因此,用户交互行为涉及用户的信息认知和表达能力、系统功能、用户社会文化背景等相关因素。

3.省略、Alta Vista和Ask Jeeves等搜索引擎1997年到2003年的查询数据[2],在网络公共查询中,大约2/3的用户习惯一次检索到位,超过6/7的用户不会使用两次以上的查询检索,平均检索查询次数是1.6次;只有大约8%的用户接受或者利用模糊检索来获取信息,使用布尔代数和专业查询的用户大约占总用户数量的1/18,但检索语言错误非常多。

在用户检索行为研究中,尤其在非搜索引擎的浏览查找中,记忆、操作印象和检索路径存储都是影响信息检索效果的因素。有学者指出[10],用户经验一是指用户自身的网络使用经验,二是包括检索系统对用户访问路径的记录和对用户访问习惯的学习。因此,网络信息检索用户交互一方面应该提高用户的基本信息素质;另一方面应该通过揭示和披露用户信息素质,在系统层面建立与用户素质相适应的使用与导航体系,优先考虑用户的适应程度。

3.2检索系统功能

检索交互的本质是人和机器的相互学习,人对机器的学习体现在用户的信息素质上,而机器对人的学习则反映在检索系统的设计上。纵观检索系统学习机制的设计,主要有两大类:一类是行为识别,通过对特定用户的检索行为特征进行归纳,设计个性化的检索系统,缩减用户的检索步骤;另一类是逻辑推理,利用检索信息内容的关联,提供用户检索决策支持,提供推理机(专家智能)和Push服务。

在行为识别中,检索系统认知理论吸纳了心理学家对信息处理过程和学习认知行为的基本理论,提出在认知语境之外主要提供三种行为揭示机制:①认知结构理论,用户在基本认知过程和结构中是一致的,如果系统能够揭示出认知特征,借助知识推理,反映认知过程,也就是人工智能过程;②用户认知测试,要么通过问卷或标准问题组反映用户的信息认知特征,要么通过用户定制,让用户自我表述认知特征,进而设计不同风格、领域和粒度的信息资源;③知识兴趣群体(COPs),通过兴趣社区的模式,以关联、推荐、志同道合者交流反映用户认知特征。

逻辑推理更多是系统工程,提高智能模拟和推理的准确率是人机交互的关键。目前,逻辑推理不仅关注推理规则的设计,而且还逐渐整合语境、资源特征、社会环境因素,将界面风格、整合信息粒度、用户认知能力进行统一考察。

总之,对检索系统用户交互的关注,使网络信息检索系统在资源展示的内容与形式、界面设计、检索式编制、资源粒度、网站构建、系统对检索词的处理都得到不同程度的关注与改进。

3.3社会文化背景

信息检索作为知识过程,涉及认知和内容匹配,社会文化背景的差异必然会影响用户在语言、检索过程和资源选取上的差异。社会文化背景对信息检索交互的影响主要在于信息检索的社会化趋势。而信息检索的社会化主要有两层解读:

信息检索需求的社会性。检索需求来源于生活和工作的社会环境,识别用户信息检索需求依托用户社会环境,社会环境和检索过程交互进行。

信息检索过程的社会性。检索过程社会性是指除用户的知识领域、检索技能和检索经验外的常识能力、操作习惯、思维特征及文化背景对检索过程的影响,主要表现为社会暗示、协作行为、环境适应和跨语言协调。其中,信息检索专家对社会协作行为和跨语言检索最为关注。社会协作检索从检索入口词对数据库的信息映射检索流程,向信息映射和人际关系关联相结合,从检索信息内容向检索信息专家转变。在跨语言检索研究中,对翻译机制和语义消歧方法研究较多,成立了文本检索会议(TREC)、跨语言评价论坛(CLEF)、日本国家科学信息系统信息检索系统测试集会议(NTCIR)、美国计算机协会信息检索特殊兴趣小组会议等组织和研究中心。

4用户交互研究对检索工具的影响

信息检索的用户交互技术是改良信息系统功能和效果的重要手段,因而也是国内外信息机构和企业所关注的热点问题。2006年,ACM SIGIR会议主题就是互动搜索分析,围绕搜索引擎模型、翻译技术、点击和浏览行为模式,构建“为预测网络搜索结果偏好而了解用户的互动模型”和“通过一体化用户的行为模式来改进网络搜索的优先次序,提高检索命中率的检索模型”[11]。

在检索理论和模型研究中,面向用户/任务的检索理论、用户需求搜集策略、用户认知能力的可视化和资源展示的可视化、基于用户的信息检索系统构建、用户查询反馈控制、基于用户的文本过滤等问题也逐渐成为信息检索工具研究的热点和难点。

参考文献:

[1]唐宇萍.用户认知观视野中的情报检索.情报理论与探索,2004(5):458-461.

[2]Spink A, Jansen J. Web search: public searching of the web.[2006-12-20].www.sis.pitt.edu/~aspink/DIY%20spink.doc.

[3]Cothey V. A longitudinal study of world wide web users' information searching behavior. Journal of the American Society for Information Science and Technology, 2002,53(2):67-78.

[4]Schacter J, Cung K W K, Dorr A. Children's Internet searching on complex problems: Performance and process analyses. Journal of the American Society for Information Science, 1998,49(9):840-849.

[5]Ingwersen P. Information retrieval interaction:1992.[2006-12-10]. www.db.dk/pi/iri/.

[6]Belkin N J. Cases, scripts, and information seeking strategies: on the design of interactive information retrieval systems. Expert System with Application, 1995(9):379-395.

[7]Saracevic T. Digital library evaluation: Toward an evolution of concepts. Library Trends, 2000,49(3):350-369.

裴 雷

武汉大学信息资源研究中心武汉 430072

上一篇:组织效能影响因素实证研究 下一篇:用h指数对我国图书情报学界作者进行评价