基于Wiki与Folksonomy的专业信息服务研究

时间:2022-09-29 10:59:58

基于Wiki与Folksonomy的专业信息服务研究

[摘要]探讨专业信息服务的发展及Wiki和Folksonomy在专业信息服务中的应用机理,分析Folksonomy对专业信息资源组织的优化并在此基础上,提出基于Wiki和Folksonomy的专业信息服务组织及其实现模型,对专业信息服务的运行机制进行剖析。

[关键词]Wiki Folksonomy专业信息服务

[分类号]G250

Wiki的应用种类众多,有知识共享Wild、Wiki百科、wi―ki创作和专业Wiki等等。在众多的Wiki应用中,专业Wiki以其独特视野对专业理论的传播起着重要作用,成为专业信息集散地,具有极高的价值。因为专业,才会形成系列的讨论、研究,留下足够分析的空间和机会。本文所指的专业wi―ki是指专家或者精英们共同协作而完成的、具有明确的专业方向和较高信息质量的,与一般的Wiki百科有一定的区别。因为Wiki百科注重知识广度,而专业Wiki则注重知识的深度。两者的服务对象与参与对象也不同,Wiki百科服务对象是一般的网络用户,参与百科知识写作的也是普通的用户;而专业Wiki服务对象则是专家、研究人员或者大学教师等具有相关专业知识并从事某领域较深层次研究和工作的人,参与专业Wiki写作的也是这一类用户。

在专业Wiki中,采用Folksonomy分类方法可以使得普通用户成为专业信息组织的主人和受益者,它赋予用户完全的自由,使用户可以为网络事物创造自由的、甚至可以是“杂乱”的元数据。通过个人自由分类,用户可以更容易地对所标注信息进行查找、分类。对信息贴标签,自由分类是个人行为,主要是为了自己利用信息的方便,但是由于信息和标签的公开性,却使得大量的这种行为积累、聚类,而不得不具有了社会性,从而每个用户在不经意间就为专业Wiki做了贡献。

1 WiKI和Folksonomy在专业信息服务发展中的应用机理

1.1 专业信息服务发展及其对新技术的需求

专业信息服务最初是由传统图书馆提出来的,主要目的是提高信息提供的专指度和更好地开展参考咨询服务、定题服务、推送服务等新的服务项目,这一阶段较有代表性的专业信息服务组织主要有专业图书馆、各专业科研机构门户等。随着信息服务的社会化发展,单靠图书馆、科研机构提供的专业信息服务远远不能满足社会用户的需求,于是出现了很多由行业协会、专业信息服务公司及其相关团体提供的专业信息服务网站,这些网站一般对用户提供本专业相关的参考信息服务、资源导航服务、专业站点连接服务、业界动态、新闻、讨论组等专指度较高的信息服务,如中国旅游信息门户、美国环境保护局(EPA)环境保护资料库(EMCI)等等。这些专业信息门户不仅是人们检索专业信息资源的助力器,也是了解专业动态信息和与专家交流的工具。然而,从这些专业信息服务机构信息组织与服务的实际情况来看,很多机构都面临着很大的经济压力和沉重的信息搜集与组织负担,以至于很多专业服务门户网站信息更新周期从一天延长至数天甚至于数月,严重影响了专业服务质量。在专业Wiki中,采用Folksonomy分类方法可以使普通用户成为信息的组织者和利用者,将此技术应用于专业信息的组织与服务中,一方面可以分担专业信息服务机构工作人员的部分信息搜集与组织工作;另一方面也大大丰富了专业信息门户的信息内容,提高信息服务质量。

1.2 Wiki的技术原理及其在专业信息服务中的应用

Wiki的原理在于开放编辑和自由协作,用户可以修改系统中所有开放的信息文本,Wiki系统则记录下所有用户修订的版本历史,如在自由的百科全书Wikipedia中,各个词条最终形成的中性客观定义就是在这样的机制中产生。它通过文本数据库或者关系数据库实现版本控制,因此可以随时找回以前的数据进行对比。版本控制使多人协作成为可能,既可以保护内容不会丢失,又可以让任何信息被任何人修改和删除,但是最后剩下的是最好的参与者,因为系统会清除垃圾文字,最终保留最有意义的内容。

目前,Wiki技术的应用主要集中在专业图书馆及其科研服务机构提供的专业服务中,如图书馆数据库、图书、网站等的评论(Buffer WikiRef),使用者可以提供对于参考资源的看法;另外,它也用于专题资源介绍(BizWiki)、图书馆实务经验分享(LibSuccess)、图书信息服务领域文献(LISWiki)、图书馆利用指导(instructionwiki.org)、重要议题讨论(Library2.0 Wiki)、主题指引(SJCPL,subject Guides)等等方面。应用Wiki技术,以此提升社会化专业信息服务的信息组织与服务质量还有待进一步研究。

1.3 Folksonomy的技术原理及其在专业信息服务中的应用

传统系统设计中信息的分类工作一般都是参照专家的定义,然后再培训用户接受。分众分类方法集中体现了“人人平等”和“群体智慧是无穷的”思想,让每个用户都能贡献其对信息编码分类的知识,系统用统计汇总的方式把那些最能被众人接受的分类法凸显出来,作为系统的推荐分类法,从而在系统的后继使用发展中获得更大的传播优势,这里应用反馈促进了分类规范的形成。其分类机理如图1所示。

这种方式并非没有尊重专家和权威。专家权威在作为普通用户参与标注分类时,如果因为认识深刻而提供了更能把握信息本质的分类,就更可能在与普通用户不准确不精当的分类竞争中脱颖而出获得更多人的接受。因此,这种分类法把权威的产生机制和影响机制融入到信息系统中,在分类定义方面把权威的影响限制在其真正有权威的领域,去掉了“晕环效应”(即因为在某个领域获得权威,而得到过多的话语权――对另外一些并非其专长领域的话语权),从而更增加了对真正专长于某个领域专家的尊重。将此技术应用于专业信息门户的信息组织与服务工作中,必然大大提高专业信息组织的质量和可信度,促进专业信息门户的全面发展。

2 Folksonomy用于专业信息组织的优化

2.1 改善系统内信息的组织结构

Folksonomy的设计使得信息的组织由传统平面树状的层次结构转向基于自由标签关联的网状结构。因为,信息一般都具有丰富的语义,网状结构更适合表述信息之间的复杂关系。

2.2 优化信息导航和分类设计

在传统内容管理系统中,系统管理员常常不知道如何更好地设计分类栏目,如果对既有的分类不满意,想进一步细化分类或调整分类时,需要对所有相关信息进行修改;而基于自由标签的信息导航,不仅可以从多种分类中(代表不同的信息认知)检索到同一信息,还可以方便基于单项信息的分类修改(即可以修改某单项信息的分类而无须调整所有的相关信息)。

2.3 突破基于文本分词和词频分析的内容聚集的假设

信息间是否关联取决于各个信息的提供者对自己内容

的概括,而不是完全由机器和算法决定。信息的标签是创作者对其高度概括带有创作者的主观认知特点,而基于文本分词中词频分析的信息之间的关联则是纯粹客观的算法,抹煞了信息的主观性。基于社会标签的内容关联聚集的假设是文本作者最了解自己本文的意义内涵,其总结的关键词(添加的自由标签)应该是最有概括性的。

通过结合Ping(在Web2.0系统上新内容时,能够向另外一个系统发出更新通告的方法)机制,Folksonomy还可以实现跨系统间的信息分类聚合,这需要第三方专用服务系统的支持(见图2)。图2中Technorati是标签聚类系统,其他各系统在(Wiki、del.icio.省略等)对各种类型的资料添加某个共同的标签时向标签聚类系统(Technorafi)发送Ping消息,并在标签上添加链接到Technorati中的对应标签页(这两个步骤在一些系统中是自动完成的),实现了不同系统中同一标签的信息的双向关联。

3 基于Wiki与Folksonomy的专业信息服务实现

Wiki与Folksonomy的出现为专业信息资源的建设与服务提供了一个新的模式,这就是专业信息资源建设与服务的规模合作,即在花费较少成本的情况下,通过互联网和相关的技术把大批的专业信息资源建设者与服务者以自愿的方式聚集在一起进行合作。如果说以Linux为代表的开放源代码运动是一种早期的合作,并证明了基于兴趣和自愿的合作不仅是高效率的,而且可以产出高质量的信息产品,那么,Wiki与Folksonomy的兴起,则为我们提供了网络环境下专业信息资源的建设与服务的规模合作方式的新素材。尽管这种专业信息资源的建设与服务方式还处于形成和发展过程中,我们还不能完全认识与预测其最终的展开图景,但我们相信,这种新的专业信息资源的建设及服务模式蕴涵着全新的价值和巨大的能量,将对传统信息建设与服务产生价值颠覆及深远影响。

3.1 专业信息资源的建设与服务流程

利用Wiki与Folksonomy技术进行专业信息资源的建设与服务的流程(见图3)。这是一个完全开放的规模合作专业信息资源的建设与服务系统。Wiki技术本身并没有提供“把关人”的功能来保证条目的质量,系统管理员仅仅是对蓄意破坏者和不良行为进行必要的管理。不同于传统的信息生产模式,专业条目的编辑并没有资格认证和身份限制。每个条目由“共识”进行控制,通过用户的不断讨论与协商最终达成一致意见。因此,专业信息资源库中的某个条目的版本是不断变化的,单个的人或编辑群并不能真正决定某个条目的最新状态。在技术方面系统仅提供如下的功能:追踪条目的状态,检查条目的更改和“讨论”页面,记录所有条目的编辑版本。版本维护这一系统功能的重要性表现在其保证了没有任何一个破坏是不可恢复的。换句话说,用户对系统的任何操作都是可逆的。实际上,恶意破坏者删除条目付出的代价要比贡献者恢复条目所付出的代价大得多,往往破坏一个条目需要5―10秒的时间,而恢复到相对正确的状态只需要点击一下按钮。这种时间成本上的不对称有利于信息建设者,进而保证了条目的质量。在系统营造的这种基于条目的规模合作专业信息建设环境中,相互信任被假定居于核心地位,相互影响会帮助用户不断地改进条目的质量。将条目的改进维持在一种讨论的状态中,通过反复的修改直至达成精确而相对稳定的状态。

相比之下,专业信息的组织则是通过Folksonomy进行的其方式比较简单。采用条目分类、检索和超级链接来对信息进行组织,与传统的网络信息组织方式类似,但是用户在对信息的分类方面有较大的自由度;浏览用户通过Wiki引擎可以直接访问专业信息库。他们可以选择分类浏览和条目检索的方式来查询相关专业信息,如果对所见的相关条目信息不满意或者满意,可以直接参加到关于该条目的讨论中去,甚至还可以直接对该条目进行编辑以完善其内容。此外,通过Folksonomy聚类系统,很容易实现不同系统问的同一个标签内容的聚合。

3.2 专业信息资源建设与服务中的问题及其解决方式

・历史流图。麻省理工学院的Femanda B.Vi6gas和IBM研究院的Martin Wattenberg、KushalDave三人开发了历史流图方法。该方法可以将多用户规模合作信息生产过程(即条目的演进过程)可视化。后台技术应用标准的diff算法,通过比较连续的历史编辑版本而跟踪变动。它可以直观地揭示如下信息:条目随时间的变动、恶意破坏行为的出现、作者的分布、条目的成长和编辑战。

・蓄意破坏和不良行为。这类问题的表现主要有:批量删除、庸俗信息、虚假信息、虚假链接、带有明显偏见的非中立信息。正常的删除行为是被允许的。事实上,虽然破坏行为非常频繁,但一半的“批量删除”行为会在3分钟内得到修复,一半的“庸俗信息”会在2分钟内得到修复。由于实际存在的恶意破坏行为,Wiki系统条目的可信度曾颇受质疑。系统规模合作信息生产模式本身所拥有的自疗功能,在事实上对此给出了答案,有效地保证了其条目的质量。

・专业信息建设中的谈判与共识。条目的创建和演进过程就像谈判,在专业信息生产过程中,用户阐述自己的观点,接受或对其他用户的观点提出异议并给出理由,通过不断的讨论、争辩,最终使条目达到相对稳定的状态。从长远来看,某一条目通过谈判终能达成共识,但如果在一段时间内,人们就某一条目的观点各成一派并偏执己见,则会发生“编辑战”。谈判或“编辑战”并不受条目的限制,而也可能只是一个标点的增删,或者与条目相关的其他事实。所有作者相互之间秉承中立原则而不断地谈判(修改)而达成共识。

・匿名用户与信息生产。Wild倡导的自由精神与现有的知识产权制度有一定程度的抵触。由于Wiki是基于GNU自由文档许可证的,因此获取Wiki的资源完全是免费的。Wiki的拥护者说“知道了这一点,会鼓励人们协同创造,因为他们明白这是一个公共的工程,每一个人都可以从中受益”。Wiki的反对者则表示匿名也会“鼓励”将他人的成果“贡献”出来。Wiki中可能出现拥有知识产权的段落、图片和分散的条文。这将触及知识产权拥有者的利益。

・Wiki中的每个条目正文都有版权信息。需要注意的是,版权法所保护的只是一种想法的创造性表达方式,而不是想法或信息本身。因此,阅读一个专业信息的条目或其他著作后使用自己的语言表达出来,然后再提交给Wiki的过程是完全合法的。虽然有了“反版权”的法律保障及免责声明,但具体到用户层面,即创建和编辑条目时,如何尽量避免知识产权冲突还需要构造相应机制来保障。

上一篇:构建无障碍网络信息环境的研究 下一篇:面向大学生信息素质教育的参考咨询服务