大众标注研究进展

时间:2022-04-15 07:09:13

大众标注研究进展

[摘要]探索国内外大众标注研究的相关问题,辨析大众标注的概念,概述国内外大众标注研究的发展历程与现状,分析国内大众标注研究与国外的差距,探讨大众标注的研究特点与趋势。

[关键词]标签 大众标注 概述

[分类号]G250.76

为了解国内外有关大众标注(folksonomy)的研究情况,笔者分别以folksonomy、social tagging和Collaborative tagging等作为检索词,查询了ACM和LISA数据库,获得与大众标注这一研究主题相关的文章,然后进行人工去重。同时利用yahoo、google和baidu等搜索引擎,查找与大众标注相关的网络资源,共获得国外有关大众标注的相关文章70余篇。在国内有关大众标注的研究文献方面,笔者主要对vip、cnki和万方数据库进行了查询,经去重和剔除不相关文献,共获得10余篇与大众标注相关的研究文献。

1 大众标注的概念

大众标注是web2.0环境下信息组织的一种新方法。若以2004年大众标注这一概念首次被Thomas Vanderwal提出作为大众标注的研究起点,那么,迄今为止,有关大众标注的研究刚刚走过三个年头。三年来,围绕大众标准的定义、发展背景、历史演变、优缺点、发展趋势等问题,国内外学者开展了广泛而深入的研究。

1.1 标签的概念研究

国内外学者围绕标签的研究主要是从其内涵和外延两个角度进行。在标签内涵的研究方面,国外有学者指出,在大众标注的具体实现过程中,标签是一种自由形式的关键词元数据,赋予标签的过程则被认为是一种标注行为。国内学者倾向于将“tag”译为“标签”,具有标示作用。也有学者将标签视为一种主题词。在标签的外延研究方面,有学者对哪些要素可以作为标签进行了研究。Noruzi A认为,标签可以是概念、类别、分面或者是实体。Scott A Golder等人认为标签的种类主要包括:表明事物范围的标签,表明标注对象类型的标签,表明所有者的标签,对类别进行归纳的标签,表明事物性质或特征的标签,自我识别用的标签和表明事物用途的标签等。

1.2 大众标注的概念研究

大众标注是信息组织的一种新的理念,也是一门新兴的技术方法,对其称谓与内涵的理解可谓见仁见智。大众标注一词由美国互联网专家ThomasVanderWal于2004年底提出。据不完全统计,围绕大众标注这一概念,国外学者使用了10多个同义词或近义词加以解释。Thomas VanderWal认为大众标注是“自下而上的社会分类法”。Clay shirky认为大众标注是由大众创建的、具有扁平特点的命名空间。David则认为大众标注是一个完整的标签集,由一个或两个以上的关键词组成,是共享内容管理系统的用户对其个人创建或的内容进行分组或分类,以便于检索的一种方法。笔者认为,大众标注是网络资源的利用者为了便于自己或他人获取和利用由自己或其他人创建的某一数字资源,而对该资源赋予标签的过程或结果。所赋予的标签可以是网址或符号,也可以是具有实质含义的词汇、短语或句子。

2 国外大众标注研究的发展历程

大众标注的概念直到2004年才被提出,至今,有关大众标注的研究已经走过了三个年头。下文简要回顾大众标注研究的发展历程。

2.1 2004年:大众标注概念的普及与推广

2004年8月,大众标注的概念被首次提出,与大众标注相关的问题开始进入研究人员的视野。这一时期的研究主要集中于概念的普及与推广。作为大众标注的早期研究人员,AdamMathes和DavidN Sturtz在2004年12月发表了重要论著。Adam Mathes研究了专业人员、内容创建者和用户在创建元数据方面的不同表现,并以deLlcio.us和flickr为例,全面分析了大众标注的发展起源、局限性、模糊性、同义性、在查找和浏览方面的优势、工作原理、不当使用和相关研究的发展趋势。DavidN Sturtz对大众标注的内涵、应用实例(如delicio us,fSckr)、应用前景以及未来的研究方向进行了探讨。

2.2 2005年:将大众标注置于具体应用领域中进行研究

2005年,有关大众标注的研究发展迅速。Tony Hammond等在“D-Lib Magazine”上发表的综述性文章,围绕大众标注的发展背景、渊源、定义、与元数据的关系、与传统分类的关系、类型、用户使用心理分析、优点与不足、工作原理、改进措施和未来发展趋势等问题进行了研究。据不完全统计,2005年以来,“D-Lib Magazine”上已发表6篇有关大众标注的研究文章。从目前掌握的资料分析,国外学者已开始倾向于将大众标注置于具体应用领域中进行研究。Terrell Russell指出,通过上下文权威标注方法,利用用户在标签社区中使用标签的声誉,可以发现和定义认知权威性,查找出某一领域的权威专家以及发现专业人士最经常涉足的领域知识。

2.3 2006年:大众标注系统构建的研究

2006年,有关大众标注的研究焦点似乎是侧重对大众标注系统构建的研究。Elaine Peterson的文章回顾了传统信息组织方法的实现流程与不足。Dye等人分析了南用户创建元数据对数字信息进行大众标注的实质及优缺点。Adam Seldow开始在教育领域引入大众标注,试图将大众标注网络引入到学校教学资源的共享之中,并深入分析了这种应用的优缺点,探讨了大众标注在K-12阶段的应用前景。Chi-Lung等提出将web2.0和大众标注应用到图书馆信息服务的设想。而TrantJ则构建了大众标注在博物馆中应用的场景。

3 国内关于大众标注的研究

国内学者自2005年开始对大众标注进行研究。由于时间较短,目前国内有关大众标注的研究仍处于起步阶段。不仅核心研究作者、核心研究机构和核心研究期刊尚未形成,在研究主题的深度与广度方面也仍显薄弱。

3.1 国内大众标注的研究概况

据不完全统计,目前国内有关大众标注的研究文献大约10篇左右,研究者主要集中在图书情报领域。上海复旦大学计算机系沈凯凯等撰写的“Folksonomy as a Complex Network”(英文)是国内有关大众标注的第一篇研究文章。毛军等发表于《现代图书情报技术》的文章是国内图书情报领域有关大众标注研究最早的一批论文。随后,马然、梁桂英、常唯、崔景昌、黄霞丽等学者也都发表了有关大众标注的研究成果。

3.2 国内大众标注研究中存在的不足

与国外相比,国内有关大众标注研究的深度和广度仍显不足,主要体现在以下几个方面:

3.2.1 研究内容有待深化 由于大众标注是在国外兴起的一

种新技术,国内学者对此领域的研究还不是很深入,相关论著也比较少。并且多数文章还只是侧重在从概念层面开展研究,停留在探讨大众标注的优缺点等较为宽泛的问题上,研究内容有待深化。

3.2.2 研究领域有待拓宽在国内首篇有关大众标注的文章中,作者介绍了大众标注的概念、大众标注和标签的关系,并将大众标注视为一种网络进行研究,采用实验方法论证了大众标注的各种静态属性。但是,多数学者的研究工作还只是停留在探讨大众标注的特点,某一大众标注系统的功能等方面,研究领域有待拓宽。

3.2.3 研究工作有待加强与国外相比,国内对于大众标注的研究尚未引起学术界的广泛关注。到目前为止,国内尚未举办过以大众标注为主题或分主题的学术会议,专门的研究网站也未出现,研究工作有待加强。

4 大众标注研究的发展态势

2005年10月,英国UKOLN(The UK Office for Library andInformation Networking)召开了“互联网图书馆员国际大会”,其中一个研究专题即是关于大众标注的研究。2006年,JCDL(JomtConference of Digital Library)也有关于大众标注的研究。于2007年10月举行的美国信息科技学会(ASIS&T)2007年会设立的“社会计算与信息科学:合作研究与实践”研讨主题也涉及大众标注的内容。在受到日益广泛关注的同时,大众标注的研究内容也在不断深化,已从早期的围绕概念、发展背景、优缺点和改进措施等内容的研究,向注重应用、细化领域(如标签、界面、可视化)和探究模型等方向发展。2007年,国内外有关大众标注的研究呈现出以下一些发展态势:

4.1 注重研究大众标注的系统组件

注重研究大众标注的系统组件(主要是标签和浏览界面)是2007年国外大众标注研究的一个特色。在标签研究方面,Hends、A1-Khalifa和Hugh c Davis等人认为,大众标注提供一组可以用于描述信息资源的不受限制的关键词。显然,其具体含义会随着语境的不同而有所差别。A w Rivadeneira等人指出,标签云图是对一组词语,也可以说是诸多标签进行可视化揭示的一种方式。Georgia KouMka等构造了一个框架用于对标注系统和用户标注行为进行建模,并提出一种基于可信任标注的信誉体系、用于对同一标签所汇集的所有文档进行相关度排序。李瑞等人研究了如何通过标签云图和大众标注匹配的方法来提高浏览效率。

4.2 从不受任何限制向有一定限度的控制过渡

作为介绍大众标注优点的代表性文章之一,Noruzi A在2006年发表了“大众标注:不受控制的词汇”。到了2007年8月,他却在题为“大众标注:为什么我们需要受控词汇”一文中指出,应该采用各种新技术,建立关键词、地名、人名、机构名称、资源名称等受控词表推荐用户使用,并建立有效的控制机制。此外,Guy M和Michael Peinhopf等也撰文指出需要对大众标注中的标签实行推荐与限制策略。

4.3 注重查找与搜索效率的研究

通过研究用户的标注行为,大众标注将可以被进一步应用到数字资源相关度的排序之中。进入2007年,学者们更进一步关注大众标注的查找与搜索效率问题。Samantha Hastings、HemalataIyer、DianeNeal、AbebeRorissa和JungWonYoon等均撰文开展研究。Sung Eob Lee和Steve SanKi Han构建了一个概念模型和一项评估机制,研究了标注系统Qtag的搜索性能。鲍盛华等也开始研究大众标注工具用于提高网页的搜索效率。

4.4 将大众标注与语义web、本体结合起来进行研究

将大众标注与语义web和本体结合进行研究是一种新的发展态势。在国外,Hak Lae Kim等人研究了大众标注在爵义web中的应用,通过形式化的概念分析,构建了一种用于在标注博客的标签中实现具有上下文关系的大众标注新方法,并在标签中建立起概念层次。Gruber等人试图综合运用本体和大众标注的优势,构建大众标注中各种标签词的本体。Al―Khalifa等人则提出在创建语义元数据的过程中开发大众标注的价值,指出通过分析大众标注中的各种标签,在虚拟社群中创建新的标注以及由机器抽取关键词并确立关键词之间的关系,可以进一步挖掘出大众标注的潜在价值。在国内,有关学者围绕本体与大众标注的研究也开始出现。

4.5 重视大众标注的应用研究

从已经发表的论著分析,有关大众标注的研究正在由“只是针对大众标注本身”向“将大众标注与特定系统、特定领域相结合”,将大众标注作为一种组件嵌入到其他系统中或各个具体应用领域加以应用的方向发展。Piotr D、Adamczyk、Michael B和Twidale等分析了在多学科背景下整合设计实践面临的各种难题与系统开发经验。Martins指出大众标注可用于改进搜索质量,并描述了大众标注理念在软件组件搜索引擎中的应用情况。Scott Bateman开始研究如何将大众标注应用到e-Learning系统中。ArchXan提出了创建大学图书馆大众标注的设想。BruceLionelMason、SueThomas等则着重研究了大众标注在跨学利交流中的应用。

5 结语

在web 2.0环境下,以满足全体网络用户的共享和交流为根本出发点的大众标注显示出其独特的优势。将大众标注与语义web、ontology相结合,推出更为智能化、更为个性化、更易于操作以及更加有利于组织和利用信息的方法与技术,将是未来大众标注领域较为前沿的研究课题。

虽然本文力图从概念、研究历程、研究趋势等角度全面揭示国内外有关大众标注的研究情况,但因为有关这一主题的研究文献较为分散,未能将2004年以来与此相关的文献收集齐全并加以分析,更由于笔者能力所限,以上所述不足之处在所难免,恳请各位专家学者批评指正。

上一篇:网络环境下ACA方法的应用研究 下一篇:大众标注网站服务功能与运营模式分析