Web2.0环境下基于SNA的用户信息行为过程建模研究

时间:2022-10-14 10:43:34

Web2.0环境下基于SNA的用户信息行为过程建模研究

[摘要]通过对网络社会信息行为的分析,建立web2.0环境基于sna用户信息行为过程模型a该模型以用户为中心,通过分析其资源网络构建及演变,从而导出用户的信息行为过程模式。行为模式的每个周期内用户行为过程会呈现网络资源“少一多一少”的三段式演进特征,同时该特征会随着时间的推移产生周期性波动。以豆辩网为实例,通过数据分析对该模型进行验证,符合理论预期。

[关键词]Web2.0 信息技术范式 社会网络分析 网络社会 信息行为

[分类号]G203

在Web2.0信息技术范式下,信息源、信息渠道以及信息接受者三者之间的关系不再呈现明显的层级结构,信息源与信息接受者两者角色重合于单―个体,而信息渠道则由单一中心流向边缘转变为点对点双向和多向传播。伴随技术推进,开放、对等、共享等理念强化了“网络社会”这一概念,宏观上表现为网络的去中心化以及全民参与性。网络不再局限于“传输媒介”这一功能,而逐渐演变成为一个庞大用户群体构建自我及持续交互的开放平台。按照社会网络的观点,用户为“行动者”,他们之间的关联即为“关系”,由于其被纳入一个普遍的参与式架构当中,且彼此对等、互联,故而通过广泛交互逐渐形成一个复杂网络图景。本文试图从社会网络视角,对用户的信息行为过程进行建模,并通过实证分析进行验证。

1 理论基础

1.1 信息行为

文中对于用户及其行为模式的界定限于以心理学、社会学、人类学等理论为基础的行为科学,即从个体行为角度而言,遵循“需求一动机一行为”这一基本模型。其中,用户为该信息技术范式下,使用Web2.0的应用服务进行信息获取及交互的个体和群体;用户行为可以理解为用户在需求的驱动下,接受此类服务过程中所展开的一系列基于互联网的活动,如交友、评论、分享、日志等Web2.0技术环境中衍生的行为。由于“当前的范式变迁或可视为从主要以廉价之能源投入为基础的技术,转移到主要以廉价的信息投入为基础的技术”,且“新范式的第一个特征乃是信息便是其原料”,也就是说该范式中用户行为都可以认定为围绕信息展开,故用户行为可以在某种程度等同于“信息行为”。信息行为在学术界的含义界定各不相同,但基本内容皆为个体对其所需要信息采取的搜寻、传递、存储、利用等行为。从行为目的角度来看,用户信息行为主要包括:信息、信息交流、信息查寻、信息选择、信息下载、信息吸收、信息利用等。

1.2 社会网络

近年来社会网络及社会网络分析法等相关理论有了迅速的发展并为我们提供了描述人群关系结构的自然方法,其中社会网络指一组行动者及连接他们的各种关系的集合。本文所研究的信息行为中,行为的基本属性包括行为者以及行为对象。在Web2.0环境中,用户根据信息需求所展开的获取、搜寻、处理等行为实质上都导致用户以及一系列行为对象之间普遍交互。故用户行为的过程便是行为者与行为对象建立关联的过程,此过程映射为用户资源网络的动态变化过程。其中,行为对象既包括物理存在的客体,也包括以人为中心的主体。本文中用户以u(User)表示,行为对象客体以O(Objeet)表示,行为对象主体则以s(subjeet)表示。其中用户是单独的行为个体,而行为对象主体则不仅仅包含个体用户,还包含在Web2.0环境中普遍存在的小组、活动圈此类由众多用户个体组成的群体组织及活动。

2 用户信息行为过程建模

2.1 模型构建

有关信息行为的研究,国外已有比较成熟的模型,如Dervin的“意义建构”理论、Kuhlthau的信息寻求过程模型和Wilson的信息寻求行为模型等。综观国外信息行为研究的典型模型,对于信息行为的研究大多倾向于对“信息寻求行为”的研究。这类研究大多以“用户个体”为中心,围绕用户个体特质、行为习惯以及所处的信息环境来设置测量变量,其目标指向于信息检索系统的设计。

随着网络的发展,对于信息行为的研究,相关学者一直都处于探索之中,其中Chatman(1996年)、Taylor(1991年)等多个学者开始从社会网络角度来研究信息行为,他们指出社会网络在信息寻求行为的支持与阻碍方面起到了十分重要的作用。其中,学者Sonnenwald认为人类的信息行为是由个人、社会网络、情境和背景共同形成的,信息行为从某种程度上来说是个体及其信息资源的一种协作,并提出“informa―tion horizon”的概念,即指明用户寻求信息的范围和领域,它包含了各种信息资源。依据社会网络相关理论,用户信息行为过程即用户以自我为中心进行的资源聚集过程,通过观察用户的信息资源网络在时间序列上的改变,便可获知用户信息行为的基本规律。文献中在探讨在线社会网络的结构及其演变中指出,在线社会网络的密度随时间呈现快速增长,下降、衰退及缓慢稳定增长的三阶段式演变规律。对于一个普通的用户而言,从产生信息需求到满足需求这一过程也满足一定的规律:情报需求一情报动机一情报行为一情报满足一新的情报需求。综合以上理论论述,笔者提出本文的用户信息行为过程模型,如图1所示:

2.2 模型解析

2.2.1

自我表达 类似于人的社会性存在,在网络社会中个体也必须找到相应的接口,才能确立自身的存在。在Web2.0信息技术范式下,用户行为启动便始于自我表达。如图1所示,用户经过注册/登录之后,获得进入网络的通行证,并以自我(u1)为中心,各类资源,从而形成最初的内部网络构建。其目的是为了展示自我,确立个体的自我定位,从宏观角度可视作一个新的信息源初步建立。

2.2.2 资源储备 在资源储备期,用户主要从事外部网络构建。在此阶段,用户处于活跃期,行为密集。

按照Tatsuhito Nagaya提出的“信息摄入框架”模型,用户在好奇心的驱动下启动记忆,并意识到自身信息或知识库的缺陷所在,从而寻求并选择相应的信息。具体到本文中的模型,用户u1在自我表达阶段一定程度上明确了自身的信息导向,于是在初始少量资源的累积上,通过关系的相互性及传递性浏览并选择相关信息,并与这些主体或客体资源建立关联。随着时间推移,累积的资源数量成一定比例递增,但此期间用户的注意力仍旧是分散的,其目标是在需求的最大限度内实现其“信息纳入”。

2.2.3

自我构建 经过活跃期大量资源储备之后,用户支出相应的成本,并获得适当的满足感。按照节点与节点之间关联的相互性及传递性,从理论上而言,个体的网络是可以无限扩展的。但面临大量的节点资源,用户的资源储备行为并不能维持在一个高密度的活跃期。该阶段用户行为放缓,从而导致其资源增长速度放缓,但在网络规模相对稳定情况下,其的资源网络的密度增加,同时相应的关系强度也增大,个体开始充分享受其构建网络所带来的信息进行更深入的

自我构建。

2.3 演变过程

综观以上三个阶段,用户在各阶段中信息需求及行为特征不一,随时间的推移,三个阶段逐步推进。“自我表达”阶段用户的内部网络构建行为侧重于自主产生信息行为,与其他用户交互行为很少。随后在一系列需求因素的驱动下,用户开始广泛地开展各种如信息、信息查寻、信息选择、信息交流等行为以寻求相应的信息资源从而满足需求,并进入一个活跃的“资源储备”阶段。参照文献中的信息摄入框架模型,从个体层面来看,用户信息相关行为受到很多因素影响:生理、时间、经济、兴趣以及记忆、感情的超载或饱和等。即意味着用户的接受能力是有限的,或者说在一定的时期内是有限的。当用户已经储备相对足够的主体和客体关系资源,用户资源量相对饱和并因此产生了相应的满足及疲惫感时便进入了第三阶段,即“自我构建”阶段。这个阶段用户关注的信息范围相对缩小,侧重于某些信息资源并对其投入更多的时间、精力等,从而形成较强的关系。

需要说明的是本文是从网络随时间演变角度来模拟用户的信息行为过程,其中自我表达、资源储备和自我构建三个阶段并非不可逆转。如果将其置于横向的时间轴上,用户这三个阶段的行为是呈周期性波动的。遵循英国情报学家威尔逊提出的信息寻求模型观点,认为模型构建前提之一为信息需求并非是最原始的需求,而是源于更为基础性的需求――即心理、认知和感情三方面的需求。由于用户的行为直接来源于其需求和动机,而这些认知、心理和情感因素总是处于周期性波动中的,如用户在自我建构阶段对某一主题的内容感兴趣,从而广泛与该类资源建立关系之后进入自我构建期;而当用户兴趣转移时,则又可能从第三阶段回到第二阶段,重新进行下一轮行为循环。无论从宏观或微观角度,用户所处的网络及以用户个体为中心的网络都处于时序的动态变化之中。

3 实证分析

本文借鉴社会网络的观点对Web2.省略)进行实证研究。通过自主开发的程序进行信息采集与抽取,从豆瓣网中随机选择用户,采集并获取豆瓣用户的行为数据。程序基本流程如下:随机生成用户ID,利用用户ID获取用户的豆瓣主页,通过文本分析,得到载有用户行为数据所在网页的网址,获取这些网页的源码,利用形式匹配和文本分析的方法,抽取用户的行为数据:用户行为的类型、时间、用户对行为的评论等。程序对抽取的信息进行规范化处理,利用MySql数据库加以存储,形成本次研究的数据集。研究数据集共包括725位用户,共有行为类型51种,行为数据39 998条,时间跨度为1年。在整个实证阶段,将“用户行为量”等同于以用户为中心聚集的“资源量”进行统计分析研究。

3.1 用户统计分析

用户总数725人,根据注册时间以及行为习惯不一致,用户在该期间的行为次数不一。所有用户平均行为次数约为55。具体分布情况如表1所示:

3.2 行为类别分析

在初始采集数据中,用户行为共有51个子类别,根据行为对象对其进行重新归类整合。由表1可以看出,用户所从事行为共14类,具体分布见表2。

3.3

用户行为周期性波动分析

在本文中,随机抽取的用户行为时间始于2008年2月26日,止于2009年2月21日,时间跨度近1年。数据抽取过程中所有行为以“日”计量,但为了便于统计分析,在本文中以“周”作为计量单位,行为时间跨度共52周。本文要求探索用户在时间序列上的行为规律,为了使实证的结果更为精准,故对初始样本制定相应的筛选规则:第一步,剔除行为次数总量小于30的用户,用户总量由725人降至376人;第二步,剔除行为时间总长不超过1周的用户,用户总量由376人降至340人。最终确定的样本大小为340人,行为总量34629。

在本文所构建的模型中提出,用户行为在时间序列上是呈现出三段式变化的,即“自我表达一资源储备一自我构建”三个阶段,从用户所构建的资源量上应该服从“少一多一少”三段式分布。在本文的实证方案中,主要从资源量上对用户的行为三段式特征进行初步验证。其中涉及到三个变量,用户量/周(u),行为量/周(A),用户平均行为量/周(Argact=A/U)。在此需假设用户自注册开始,其行为是持续性不间断的。本文通过用户周平均行为量Argact对其持续1年的行为过程进行模拟,如图2所示:

可以发现在用户的整个行为过程中,随着时间的推移,用户的行为量是呈现周期性变化,其中按照模型所假设的每个周期中呈现资源的“少一多一少”三段式分布。为了进一步精确数据,去除短期的偶然因素引起的变动,对最终筛选数据进行中心移动平均处理,生成由原始数据派生的新的时间序列,见图3。

通过图2与图3对比可以发现,经过中心移动平均处理之后,图示曲线更为平滑,其周期特征更明晰。

根据图4,从中提取完整的“少一多一少”三段式周期共8个,如表3及图4所示:

统计结果显示,用户在整个行为过程中,随着时间的推移其构建的资源量呈现周期性波动特性,其中一个三段式行为周期长平均为5,25周。综合以上图表及分析,从用户资源总量的分布特征已经验证了前文模型中提出的构想。

4 结语

本文以用户为中心,从网络构建和演变角度对用户的信息行为过程进行建模和分析,结合微观和宏观分析视角,提出了崭新的观点。其中“用户信息行为过程模型”所提出的三阶段及周期性波动特性已经基于Tatsuhito Nagaya的信息摄入框架理论,并通过“豆瓣网”的用户行为数据分析得到初步验证。此规律对于Web2.0环境下各类网站的持续性建设提供指导性思路,并服务于用户行为数据的挖掘及发现。以本文的研究结论为基础,该模型的深入验证与挖掘仍待进行。如用户行为各阶段资源网络规模、密度及结构特征,如何测定?由于用户的行为呈现周期性的波动,那么相邻周期之间各个相同阶段存在怎样的关系?而强弱关系又如何界定?笔者将在后续的分析中深入每个周期对用户行为规律进行探讨。馆关系管理体系下,加强业务过程控制,有助于增强图书馆在网络环境下的适应能力,提高服务水平。

6 结语

网络环境下,信息需求呈现多样性特点和复杂化趋势,扁平化的组织机构和网络化的管理模式更加注重关系管理和过程控制。在此背景下,本文提出了图书馆关系管理理论和模型,旨在提高图书馆管理效益,增强图书馆在网络环境下的适应能力。图书馆关系管理系统是以服务对象为主体,以信息需求为导向,它不但关心个体图书馆业务,而且关心整个网络环境下的图书馆联盟。因此,图书馆关系管理能够适应网络图书馆运行机制。当然,具体应用还有待进一步的实践和研究。

上一篇:同步协作信息检索模型及其机制研究 下一篇:近代目录学史的研究进展(1840―)