人类信息行为研究的几个主要问题

时间:2022-09-02 07:47:10

人类信息行为研究的几个主要问题

[摘要]阐述人类信息行为研究的主要问题,包括用户认知、用户信息行为及其与系统交互的研究现状。首先从情报检索的两大研究范式出发,分析情报检索认知范式的特点,进而介绍认知情报检索的研究,认为这一领域对丰富情报学的基础理论和深入认识用户具有重要的基础作用。其次,介绍国外用户信息行为研究取得的进展,包括美国学者等建立的一系列行为模型所包含的要素,即目标与任务、情境、情感和可信度等。最后讨论相关性和情报检索评价中的非效率效果因素。

[关键词]认知范式 认知情报检索 用户行为 用户-系统交互 相关性

[分类号]G352

本文拟介绍信息行为研究的几个主要问题,是《情报检索发展的几个前沿问题》一文的补充。国外同行在情报检索的背景之下研究信息行为,使得情报学的情报检索研究具有较强的人文传统。信息行为也逐渐成为国内情报学的研究前沿,本文即将反映情报检索研究中的这一“人文”侧面,从情报检索的认知范式出发,介绍用户认知和行为的研究,最终落脚于用户与系统交互的研究。

1 情报检索的认知范式与认知研究

1.1情报检索研究的认知范式

Ellis认为情报检索研究的范式可以分为原型化范式和认知范式,但是目前的认知范式的范式特征不如原型化范式完备。Ellis认为“用户与信息系统之间的实际交互作用是以一种远比原型化范式的假设更加复杂的相互作用为媒介的,而且它是主观的,尤其在相互作用期间是动态的”。在情报检索的认知范式之中,反映知识结构和认知的复杂交互模型取代了对交互式情报检索特征的简单刻划。

1.2 Belkin与ASK理论

Belkin的ASK理论认为从行为角度研究信息要关注两种关系:①信息与信息接受者知识状态之间的关系;②信息生产者的知识状态和目的与信息接受者知识状态之间的关系。USA这两种关系可以体现在语言和认知层面上。用户参与信息交流就是认知到了自己知识的不足,并将这种不足转化为交流结构。Belkin把ASK分成明确定义的ASK和模糊定义的ASK两类,进而建议信息中介应该更多地了解用户对问题的了解程度,而不是用户不清楚的问题。

1.3 Ingwersen对认知情报检索的贡献

Ingwersen认为在情报检索交互的过程中,用户的知识状态包括认知模型、工作空间、实际知识状态、问题空间和不确定状态。这5种知识状态依次包含,并与真实世界相互联系。进而,Ingwersen提出了认知空间的多元表示和信息空间的多元表示,并认为时间在其中起到了非常重要的作用,并假设用户与认知源和时间的差距越大,其认知的一致性就越低。

近年,Ingwersen引人情境这一概念,在情境框架下集成信息查寻与检索。主要体现在:①阐述情境在个体认知中的作用,提出社会与个体认知影响的互补原理;②在IS&R框架中详述社会情境的作用,社会情境与组织和文化一起构成认知模型的重要组成部分。

Ingwersen的研究覆盖了几乎所有用户研究的要素,包括交互、需求和情境等。尽管这种“大一统”的结论很难为实际的情报检索系统实现所采用,但是他的理论为情报检索用户研究的发展方向和研究体系的确立做出了突出的贡献。

1.4成就与局限

用户认知研究为了解情报检索中用户的认知状态和任务类型等起到了理论指导的作用,深化了对用户的认识;对于人对信息认知状态的属性及维度和信息本身的属性及其维度有了较为清晰的认识;同时在情报学的研究中引入认知要素,使情报学研究从上个世纪60年代的文献一系统视角转向用户视角。这些都是用户认知研究对于情报检索和情报学发展的贡献。上世纪90年代末,有些学者指出认知学派的另外一些潜在的问题,例如过于关注个人而忽视了个人所处的工作、生活环境及其影响。认知学派的学者对此进行过回应,与此同时,他们也开始加强了对用户的信息环境、工作环境等方面的研究,从而进一步充实和丰富了认知学派。

2 用户信息行为研究进展

信息行为的研究内容十分广泛,涉及到从需求的产生、搜寻、查寻直到信息利用的全过程。其中,人类信息行为模型研究是人类信息行为研究的重点内容之一。Wilson介绍了Wilson、Dervin和Ellis等人的模型,指出了信息行为、信息查寻行为和信息搜索行为之间的包含关系,并认为人机交互(HCI)的研究与用户的信息交流行为有着密切的关系。Fisher等人对72种信息行为理论、模型进行了逐一介绍。本文拟对这些模型中的核心要素进行探讨,具体而言,包括用户的目标与任务、情境、情感和可信度。

2.1目标与任务

用户参与到信息活动中,都有自己特定的目标及与这个目标相关的工作任务;用户的目标、动机和工作任务会对用户判断信息的有用性产生影响,继而影响他们的信息行为。虽然我们知道这一点,但是研究中还存在很多问题。

首先,需要全面了解与用户信息行为相关的目的、意图和工作任务,然后将它们进行区分,并尽可能地整合在情报检索系统中。目前有少量研究试图去寻找特定的工作任务或者检索意图与信息行为之间的联系,但是还没有为信息系统的建设指出明确的方向。

其次,还需要从各种潜在的信息中推断用户的目标、意图和工作任务,比如利用用户之前或当下的信息行为来分析。从当前的研究来看,我们都是从预先指定的目标、意图和工作任务来进行分析的,在推断方面没有实质性进展。

Bystrtim主要关注用户任务,将用户任务分为5种类型,并分析了用户任务复杂性对信息查寻的影响。Kuhlthau则关注某些特殊群体的工作任务和搜索任务的特征,尤其是信息查寻中的不确定性的影响,并认为用户所处的任务阶段决定了用户信息搜索与利用的差异。

2.2情境

情境是认知学派对信息行为研究的一个新的热点,人们逐渐认识到除了用户本身的特点,用户所处的情境对他们的信息行为、相关性判断等方面都有影响。但是,现在仅能找出相关环境的几个方面,然后针对各个方面采用相应的技术。我们不仅需要识别出情境特征的层面,还需要发现这些方面是如何影响用户的信息行为产生的。

情境研究一个很重要的内容就是对当前工作任务的研究,这也是情境研究中的热点。目前,用户在使用情报检索系统的时候需要从他们正在进行的工作任务中短暂脱离,而一个好的系统应该整合在他们工作的平台上。但是,没有一个通用的方法可以将情报检索整合于用户的工作环境,而应当为每个特定的工作环境采取不同的整合方法。当前我们的任务就是将情报检索真正地整合到各种特定的、真正的工作环境中进行尝试和检验。2.3情感

尽管Kuhlthau已经证实了情感因素在信息查找过程中的重要性,但是情感因素对情报检索的影响研

究到目前为止还没有重大进展。

我们能够猜想一个人的心情会如何影响他与系统的交互过程,但是我们还不能确定用户与信息交互的过程中其情感是怎样变化的,哪些交互过程会引起他们情感的变化,这些情感变化如何对后面的信息行为产生影响,其中哪些情感体验是用户“喜欢的”或“有用的”。从情感因素上来说,我们的目标是让用户有愉悦的信息搜索体验,而且有效率。

2.4可信度

早在Maron关于aboutness的讨论中就提到可信度,之后一般将可信度作为与相关性判断有关的题目进行研究。大多数人认为可信度就是关于网页或者文档的属性,但是它从本质上讲是人的一种判断行为。我们应在情报检索系统中融入这一概念,并应用它将对用户最有用的信息过滤出来。对可信度的研究目前主要有两种方法:第一种是考虑网页的链接结构,如谷歌的PageRank就是利用它来计算每个页面的质量排名。一个好的网页应该是与许多权威性的网页链接,并且本身也是一个权威性网页。另一种方法主要通过自动过滤模型对网页或者文档本身的特征进行提取,如客观性、论证深度、作者或信息者的可靠性等方面。

可信度是一个多学科交叉的研究概念,不能仅仅局限于文档相关性的判断中,因为除了文档以外,人们需要对各种各样的事物进行可信度的判断,包括对与情报检索系统的选择等交互的各个方面。应该放宽视野,综合考虑人与信息交流的整个流程中的信息行为来对可信度进行研究,并融入到情报检索系统的构建中。

3 用户与系统交互的研究

3.1检索系统界面设计

针对情报检索系统,研究者利用实验研究考量了各种影响情报检索系统可用性的因素。Drori和Alon比较了采用不同方法显示检索结果的4种文献检索用户界面,得出以下结论:①以分类法排列检索结果效率最高,最易为用户理解;②界面显示使用分类法有利于可计量评测和主观评测;③显示检索词所在上下文可提高检索效果,缩短检索时间;④用户更喜欢有分类法和上下文的界面,而这也是在检索时间测试中用时最短的;⑤对用户最重要的因素是对结果正确性的信心等级;⑥对用户最不重要的因素是检索的舒适感。

研究者也试图通过实验结果总结出适用于情报检索系统的人机交互原则。如:张进和Fine提出了情报检索系统界面设计中考虑用户行为的8条原则:饱和原则、具体原则、最小阻力原则、熟悉原则、激励原则、确定性原则、简单原则和下拉表格原则。

在基于内容检索的交互研究中,任金昌等讨论了多媒体情报检索在输入输出方面的差异,并使用多模态技术改善多媒体情报检索系统的界面设计。袁保宗等详尽介绍了多模态技术的框架和关键技术,并实现了一个原型系统。Chien等介绍了他们通过输入声音对中文文本和普通话演讲进行检索的工作成果。Fabio通过实验观察到:对于能识别较高层次上的词汇错误的语音查询,经典情报检索技术也显示出生命力;在短查询中,无论相关性反馈标准与否,都可以有效提高语音查询处理的效率。

3.2理论方法的相互影响

Ng认为情报检索和HCI都包括情境性和计划性等模块或者属性。Dunlop、Johnson和Reid类比情报检索评价方法与HCI实验室实验中对用户的观察手段,提出了信息系统评价的6层模型:文本集合、不同的文献类型、交互、策略、任务和学习。Spink以用户为中心,探索并评价了用户与网络搜素引擎的交互能力。

1996年欧盟建立Mira工作小组,取得了大批研究成果。Dunlop和Johnson关注交互过程中的时间和价值因素,并认为协同技术可以作为检索延迟加剧问题的可能解决方案。Dunlop融合Mizzaro的4维相关性模型与Pejtersen的7层评价框架而建立了Mira研究的基本评价框架,并体现了他们先前研究强调的不应忽视时间因素的理念。此外,如美国国家科学基金的信息技术研究项目(NSF 99―167)中,专门对信息系统中的人机交互、社会、经济影响因素进行了立项研究。

国外的研究具有鲜明的实验特色。研究者依据实验室实验或利用人类学方法的实地田野调查,总结出许多深入细致的情报检索中的交互规律。Spink在实验中发现由于查询交互,所有被试人在其信息问题、信息搜寻和个人知识中都出现了不同程度的认知转换;但对比之前研究,当次研究用户没有在信息问题阶段或信息问题理解阶段发生负面转换。Roast通过实验发现:①以有效的资源利用为目标的系统设计不能改善用户体验;②将检索的层面分解成全文和文献表示能够帮助检索过程,但是会打扰用户行为;③出现计算延迟时,有效的系统交互设计应使用户了解系统内部机制。

4 相关性与情报检索评价的再认识

4.1主要相关性理论

Mizzaro将相关性分成4个维度:信息资源集合、用户信息需求、组件和时间。此相关性模型框架较为清晰地说明了相关性的多维度、多层面和动态性特点,说明了情报检索和利用过程中的信息损失。Saracevic的相关性模型是一个分层模型(见图1),同时也是一个动态的过程,但是它不是问题解决的,更多的是交互问题。Mizzaro的真实信息需求、感知信息需求、检索请求和查询都存在于用户的大脑之中;而Saracevic的系统相关、内容相关则存在于客观的载体之中,这与Saracevic研究用户行为的背景有关。

Mizzaro和Saracevic的相关性模型在任务、情境、情感和认知等方面均有所涉及,是一概括的情报检索、信息行为的研究框架。对相关性的深入认识可以从理论上解决情报检索的某些难题,推进范式的演进。这又以情报检索评价的发展为集中体现。

4.2交互检索的评价范式

研究人员早已认识到了TREC的评估方法不适合交互式情报检索系统,而且也一直在尝试开发其他适合的试验方法和指标。这种尝试包括TREC InteractiveTrack.CLEF和INEX Interactive Tracks以及Bodand等人提出的模型。但是到目前为止,还没有找到可以解决现实中兼容性和归纳性之间冲突的方法。

要解决这个问题,有两种方法值得讨论和探索。一是根据网络搜索引擎中搜集到的大量的用户检索数据进行分析。如果可以将用户搜索目的与信息行为结合分析,或许能得到更好的结果。另外,可以建立一个基本标准,并根据这个标准来搜集用户情报检索实验中的数据,累积成为一个用户信息行为的测试集。这种方法可以解决归纳性的问题,还可以节省实验成本,但是会存在数据效用的问题。

5 结语与展望

本文对信息行为研究的主要问题进行了回顾,力求从基础视角对浩繁的信息行为研究做一扼要的梳理。进行这一工作的前提是对情报检索研究范式的了

解。认知范式肇始于上个世纪70年代,是继原型化范式之后又一具有影响力的主要情报检索研究范式。从情报检索活动对用户知识状态的影响开始,逐渐发展出一支以用户为主要研究对象的生力军。这些研究者注重情报检索中交互的作用,侧重对用户的信息行为进行观察、分析和建模,与原型化范式侧重对系统和文献建模形成鲜明的对比。

到目前为止,已经发展出上百种应用于不同情境的信息行为模型,情境则是信息行为研究的又一热点。何谓“情境”?目前学术界对这一问题的答案仍莫衷一是。但是这并不妨碍我们对情境进行分门别类的研究,最终归纳出情境对信息行为影响的一般规律,乃至情境对信息(检索)系统的影响规律。除情境外,目的与任务、情感和信任等元素亦是影响用户行为的主要因素,也是我们需要着重考察的对象。

这些问题的集中体现则是相关性的研究。Mizzaro和Saracevic的相关性模型各有特点,且较为全面,是相关性模型的代表。尤其是Saracevic的分层模型,其侧重交互的特点对交互情报检索不无影响,这亦是情报学研究者将用户一系统交互理论引入信息行为乃至情报检索研究的一个基础。HCI研究不仅仅对界面设计层面,而且对基础理论和情报检索评价的研究都有深刻的影响。随着研究的深入,信息行为研究向着完备化和个性化的方向迅速发展,并深刻影响着情报检索的研究。

一方面,目前大多数搜索引擎和情报检索模型提供的只是搜索功能,但是实际上人们所从事的是一系列与信息相关的交互活动,不仅仅只有搜索这么单一的行为。我们在情报检索模型和技术的研究中只是简单地考虑特定的检索过程是不充分、不恰当的,应当将与情报检索行为相关的各种行为联系起来,并在情报检索系统中提供对多种信息行为的支持。目前对于不同信息行为的本质、它们之间的区别和联系、各种用户信息行为的诱因还不明确,因此,只有在对用户的基本信息行为有充分了解的基础上,才可以构建出支持多种信息行为的系统。

另一方面,个性化研究是目前信息行为研究中一个非常活跃而且重要的方面。但是,目前的做法是仅仅试图找出当前或者过去行为的一个方面,如页面浏览时间、点击率或将用户浏览、存储或者使用的信息作为相关反馈的依据等。这些研究只是孤立地考虑用户的信息行为的一个方面。用户的目标、任务、个人对所搜索的信息的了解程度以及情境等因素都会影响人们对信息行为的解释。个性化研究中首先需考虑个性化包含的维度和层面,然后找出每个维度的各种影响因素,探索各个影响因素之间如何相互作用,最后综合这些因素开发技术而实现真正的个性化。

上一篇:知识组织最新研究与实践进展 下一篇:情报研究方法发展现状与趋势