网络图像检索的提问式特征研究

时间:2022-10-04 10:33:36

网络图像检索的提问式特征研究

[摘要]为了解中文网络检索情境下图像检索需求表达方面的行为规律,设计用户图像搜索实验来采集网络图像检索过程中的提问式进行小规模实证研究,一方面获得图像检索提问式的构造和语言语法方面的一般特征;另一方面通过对高效图像检索过程中提问式的专门分析,揭示高效图像提问式的个性特征。最后结合研究结果讨论提出图像检索需求表达规律和图像检索策略。

[关键词]图像检索检索需求提问式 用户

[分类号]G354

1 引言

读图时代,网络图像资源海量递增,图像检索需求空前旺盛。为了更好地开展网络图像检索服务,对用户图像检索需求表达行为以及与检索系统交互行为的研究已成为必要,而图像检索提问式则是一个恰当的研究切入点。当前有一些围绕图像检索提问式的实证研究,在图像检索提问式的一般语言特征、提问要素组成以及修饰行为等方面得出了一些有价值的结论,参见笔者前期的相关研究。但是,对基于中文的图像检索提问式的特征还了解甚少,国内还没有开展相关研究。基于此,为了解真实情境中的图像检索需求表达和演进,本文设计了网络图像检索的受控用户实验来采集用户进行图像搜索任务时的检索提问式及其变化序列,围绕图像检索中提问式特征进行小规模实证研究。

本次用户实验于2010年4月进行,随机选择了某大学的若干个大学生为起点,通过他们发展各自的同学或老乡,最终征集了30名日常生活中有网络图像搜索体验的大学生被试,其专业分布广泛,男女皆有,基本符合实验要求。笔者基于某大学的网络实验室环境,布置了三个不同类型的网络图像检索任务,要求被试尽快而准确地完成任务,不限定每个搜索任务时间,搜索过程利用屏幕录像专家全程录制成视频。实验开始前,对被试进行了10分钟的关于视频软件使用的培训;我们帮助并确保每个被试正确设置了相应技术参数和保存路径;清空IE浏览器的历史记录和收藏夹,以避免受前一位搜索者行为的影响;实验结束后,对被试进行了问卷调查和访谈。在数据分析阶段,人工对视频样本逐个进行内容分析,按时间点序列采集其中所有提问式,共采集被试在完成不同图像搜索任务过程中的图像提问式648个,作为提问式分析的样本。很多被试在构造图像提问式时,利用了图像搜索引擎提供的相关搜索或输入提示词功能;这些智能化输入词汇,正是由一个汇集用户群体智慧的图像搜索的历史词汇的语义网络所提供,能够反映真实用户群体的提问式构造特征。因此,无论是被试自行构造,还是在搜索引擎系统引导下生成图像提问式,都成为用户图像提问式构造的研究样本。

2 图像检索提问式的构造特征

借鉴赖茂生、屈鹏等人“网络用户搜索中语言使用行为的实验研究”的相关研究思路,从三个方面考察图像检索提问式的构造:①构造依据,指选择哪些图像需求描述要素来表达图像检索需求;②构造目的,即检索提问式是否明确,考察用户的图像检索需求和检索目标的清晰程度;③构造途径,指提问式是通过何种方式生成的,如自行构造、高级搜索生成、相关搜索生成等不同途径。

2.1 提问式构造的依据

根据Jrgensen和Cunningham等对图像描述要素的划分,本研究考察6类基本要素在图像提问式构造中的运用情况,即:图像元数据(metadata)、图像内容(content)、图像风格形式(genre/style)、视觉特征、图像抽象概念、情感。其中,图像元数据参照艺术品描述类目CDWA(categories for the description of works of art)的核心元素,重点考察其中4个子项,即大小、技术、主题、来源;图像内容分为对象、情节、关系、地点、时间5个子项;视觉特征分为颜色、形状、纹理3个子项。

实验中,6类基本要素在图像提问式中的出现频率分布情况统计。648个提问式中统计到的要素出现频次为1092次,平均每个提问式中包含约1.7个要素(169.5%),这表明用户在构造图像检索提问式时,倾向于组合多个要素来表达,例如:“夜晚的月亮”,包括时间和内容两个描述要素;“矢量图运动排球”中包括技术、事件情节和对象三个要素。具体地,43%的提问式基于单一要素;57%的提问式包含2个以上的图像描述要素。

就要素分布而言,图像内容要素在图像需求表达时占绝对优势地位,平均每个提问式中至少包含1个图像内容要素(108.0%),亦即用户在表达图像需求时一定会涉及图像所包含的对象、事件情节、地点等要素;24.4%的图像提问式中会包含图像元数据;17.9%的提问式中会包含有抽象概念;13.9%的图像查询请求会针对图像形式/类型提出具体要求;用户更多地就高层语义开始检索提问,图像低层特征运用并不多。各种要素子类出现的频率分布。

首先,用户在描述图像检索需求时,优先选择的要素依次是对象、事件情节、抽象概念、图像形式/类型、地点、主题、技术、颜色等,这些是用户构造图像提问式的主要依据。其次,图像所含对象(人与物件)在图像需求表达中具有绝对优势,在66.7%的提问式中均会出现,比例远高于其他要素,这与Jorgensen的研究结论一致0。Choi和Rasmussen基于Shatford模型对美国国会图书馆图像数据库的查询提问进行了分析,结果认为大多数图像内容优先采用人物、物件、事件或环境(包含地点或时间)等来描述。

2.2提问式构造的目的

正如J6rgenen等研究所指出的,“虽然用户倾向于不断调整提问式,但他们其实不清楚如何去调整以及如何控制这一调整过程”。本研究也观察到这一现象:用户在提问式构造上表现出一定的盲目性,提问式的调整频繁发生,实验中,被试在每个图像搜索过程中平均需提交图像提问请求7.3次,最多的提问式调整次数达32次之多。被试在每个检索入口提交查询请求的平均次数为4.4次,最多达19次。Goodrum和Spink对搜索引擎EXCITE的33 149个图像查询请求的研究结果是,用户进行一次图像搜索平均提交3.36个查询请求。显然,中文图像检索过程中图像请求的次数更多;与朱明泉等对文本搜索的结果(每个引擎上提交请求的平均次数是2.17次)相比,图像检索过程中尝试图像请求的次数是文本请求次数的3倍之多。

由此可见,在网络图像搜索过程中,用户构造提问式的目的并不总是很明确,用户在图像检索过程中表现出不断尝试和调整图像检索提问式的行为特征;在很多时候,用户在图像检索需求表达方面感觉到障碍,这种障碍比在文本检索中似乎更大,中文图像检索情境比英文检索情境中的障碍更大。

2.3提问式构造的途径

从实验结果来看,被试构造图像检索提问式的途径可概括为6种:①W1,根据检索任务和结果浏览来自行构造提问式;②W2,直接利用图像搜索引擎的输入提示词;③W3,根据输入提示词进行适当改造;④

上一篇:刍议高强高性能混凝土技术在房屋工程施工中的... 下一篇:从人的感受角度论人机工程学在家具设计中的应...