微博客用户信息交流过程中形成的不同社会网络及其关系实证研究

时间:2022-06-17 11:01:27

微博客用户信息交流过程中形成的不同社会网络及其关系实证研究

[摘要]论述微博客已快速成为人们信息交流重要工具之一,跟踪微博客用户在时间周期内关于桌一话题的交流数据,发现用户在信息交流过程中形成关注、评论、转发和引用四种社会关系网络,指出四种关系网络有其不同的结构形态,但同时又具有某些共性特征及联系。研究结论对于进一步研究网络社区用户信息交流理论、探索微博客的应用均具有意义。

[关键词]微博客 信息交流 社会网络分析

[分类号]G206 TP393

1 引言

近几年,微博客网站及微博客用户人数都在迅速增长,除了这种在规模上表现出来的繁荣外,笔者还观察到其他一些变化:①从用户交流的内容上看,用户之间的信息交流已不再仅仅是微博客创始初期所具有的家常式唠叨的特征,交流的内容已涉及政治、经济及文化的各个层面;②从用户互动的情况看,微博客用户不再是简单地及告知信息,而是表现出很强的互动性,来自不同领域的、匿名及非匿名的用户之间的辩论比现实社会中辩论更为真实,自发地形成了思想争鸣的环境;③从用户的关系看,用户之间除通过关注或被关注关系而聚合外,还可能因为具有现实社会中的组织关系、具体的行动、共同的兴趣或共同的话题而聚合,从而形成了不同的社会关系网络。微博客悄然发生的变化,将可能导致微博客不仅仅是一个为大众提供闲谈的平台,也不仅仅是一个信息的场所,不断增加的交流功能将可能使它的应用领域进一步扩大到教育及学术交流领域,成为更为有效的信息、共享、交流、讨论和学习的平台。

目前,人们对于微博客用户信息交流模式、网络结构、相互关系、交流程度等问题尚不清楚,而这正是揭示微博客信息交流本质的关键,对于研究新媒体的信息交流理论、开拓新的应用领域或深化现有的应用也有着重要的意义。

为此,本文随机抽取了新浪微博客上的一篇博文,跟踪该博文引发用户交流而形成的各种关系网络,最后利用社会网络分析软件,测量、比较和分析四种网络不同的结构形态及其交流特征,并对其中的原因进行解释。

2 数据的采集与处理

在新浪微博客平台上,随机选择ID为1554014995的用户于2010年3月8日发表的一条关于农民工生存状态的博文,内容包括文字和图片(http://t.省略/1554014995/k4CeUoLKt),利用自编程序,采集了3月8日23点55分到3月29日13时时间周期内,转发或者评论该贴的用户,共采集到2 466个用户,记为集合u,提取每个用户的ID、关注的次数(指在集合u中某用户关注其他用户的人数)、被关注的次数(指集合u巾某一用户共被u中多少用户关注)、发评论的次数、被评论的次数、转发的次数、被转发的次数、引用的次数、被引用的次数,并分别记录用户两两之间关注、评论、转发、引用的关系及次数,从而得到用户转发、评论、关注和引用的四个关系矩阵,其中除了关注矩阵为二值矩阵外,其他都是非二值矩阵,即不仅包括用户与用户之间的关系(评论、转发或引用),还包括用户与用户交流的强度(评论的次数、转发的次数或引用的次数)。

由于用户的ID号位数较多,为了便于叙述和观察,将用户ID重新从1开始编号,因此,下文中的用户ID均是用户对应的编号。

3 结果分析

3.1 不同交流网络的结构及形态

以上述建立的四个关系矩阵数据为基础,利用软件Netdraw,分别绘出关注网络、评论网络、转发网络和引用网络。

3.1.1 关注网络它是在时间周期内参与转发或评论并存在关注关系的用户之间形成的关系网络,箭头指向被关注用户,同时根据被关注的数量多寡显示节点的大小,从图1可见,该网络存在高被关注的节点,用户之间的关注关系通常存在于农民工原始贴传播过程之前,与传播活动没有直接关系,但是它对于观察用户交流的影响因素却很重要。

图1的外环部分是一个包括有1064个用户的最大的关注子网络(即组件),但内核部分却包含多个子网,甚至存在多个仅有2―3个用户组成的超小子网。外环部分之所以形成了巨大的子网,主要是因为其中包括了更多的高被关注用户,这些用户各自形成了较大的网络后,又通过其他用户将网络连通,形成更大的子网。而内核部分仅有序号为300和94两个高被火注的用户,因此除了用户300形成个85个用户子网外,其他用户形成的子网均较小。

3.1.2评论网络它是在时间周期内存在评论关系的用户之间形成的关系网络,箭头指向被评论用厂1,根据被评论的数量多寡显示节点的大小,如图2所示:

图2中显示存在一个最大的节点,它是原创用户节点,他共被评论了l叭1次,远远多于其他任何用户被评论的次数,在话题的传播过程中,原始节点相比其他传播节点,会接收到更多的评论,由于原创节点数据与其他数据相差太大,使得图中无法清楚地显示其他重要的传播节点,此外,为了更清楚地观察到除了原始节点以外其他用户的交流情况,删除了原创节点(出于同样的原因,以下在转发网络及引用网络中,也作同样处理),得到图3所示的评论网络:

该网络节点的大小仍根据被评论次数的多寡显示。图3较图2更好地反映了原创贴后,用户之间相互交流的情况,它清楚地显示了网络中存在一些具有一定规模的小团体(或称为讨论组),每个小团体都有自己的核心节点,但是交流的互动性和连通性并不好,小团体多显示为简单的星型结构,并且多数普通用户与核心用户的交流是单向交流。

3.1.3 转发网络它是在时间周期内存在转发关系的用户之间形成的关系网络,箭头指向被转发用户,根据被转发数量的多寡显示节点的大小,如图4所示:

图4与图3相比,有两点差别:①图4较图3有更多的节点,这说明,相比较评论行为,用户更愿意做较为省力的转发行为,当用户列话题具有更大兴趣时,才会发生评论行为;②转发网络中所存在的小团体的规模较评论网络的规模大得多,并且用户之间有更好的连通与交互。

3.1.4 引用网络 它是在时间周期内参与转发或评论所有交流行为的刚户之间形成的引用关系网络,箭头指向被引用用户,根据被引用数量的多寡显示节点的大小,如图5所示:

引用数据是根据用户在微博客主页上显示的引用信息:***@A@B@C***”,提取每个@后的用户名(如A)而得到的,因此得到所有参与交流活动的用户引用关系及引用的先后路径。图5显示了引用关系网络中存在比评价和转发网络更大的小团体,每个小团体都有自己的核心节点,不同的是,在引用网络中,发现有些核心节点(如1723和300)也是关注网络、评论网络或转发网络中的核心节点,但有些核心节点(如704和621)却不是评论网络或转发网络中的核心节点,查看其引用的路径,发现后一类节点(即不是高被关注者)之所以成为引用网络中的核心节点,是因为他们的传播行为发生在信息传播周期的早期,并且

在传播过程中遇到高被关注的节点后被迅速扩散到更多的用户,从而吸引了更多的引用。显然,如果高被关注者的传播行为发生得较早,并遇上多个高被关注者相互承接,则会使传播在范围和速度上达到最佳效果。

3.2 网络特征及其关系

四种社会网络表现出了不同的网络结构形态,其中的原因还需要利用社会网络分析相关指针进一步分析和比较。

3.2.1 网络中心性分析和比较 中心性是社会网络结构研究的重要工具,它包括三种测度方法:点度中心度、中间中心度和接近巾心度。其中,点度中心性是测度用户在网络中所处位置的重要指针。一个点的点度中心度等于网络中与该点有直接联系的点的数量来计算,当网络是有向网络时,每个点将有两种点度中心度测量,一种对应的是点人度,另一种对应的是点出度,点入度是网络中指向该节点的节点的数量,点出度是网络中某点指向其他节点的数量。在本研究中的四种网络均是有向网络,并且除了关注网络矩阵是二值矩阵以外,其他的三种网络矩阵都是多值矩阵,即点与点之间不仅有关系,同时还记录了所发生关系的次数。这样在计算评论、转发和引用网络的点度中心度的时候,可以将“与该点有直接联系的点的数量”改进为“该点与所发生联系的点一共联系的次数”。改进后的算法,不仅能体现用户之间是否存在交流,还能反映用户相互交流的频度。

在UCNET中调入四种矩阵数据,按照以下路径:Network>Certrality>Degree,在“Treat data as symmet-“ric”提出框中选择“Yes”,则按人度和出度分别显示四种网络的点度中心度,按人度排序,将每种网络的前20名用户的用户序号、出度及人度列表比较(见表1)。从中发现以下现象:

四种网络中,用户的人度均体现出明显的集中与分散现象,即少数用户拥有大量的人度,大量的用户拥有少量的入度。从入度比例看,人度衰减非常快,在2466个用户集中,742个用户仅获到不超过两次的关注,459个用户仅得到不超过两次的评论,701个用户仅得到不超过两次的转发,462个用户仅得到不超过两次的引用,也就是说,在网络中处于中心地位的是极少数人。

四个网络的核心节点具有高度的重复性,即出现在其中一个网络中的核心节点,也往往是其他三种网络的核心节点。

高被关注是用户进入信息传播与交流系统,受到更多的评论、转发和引用的主要因素,而用户的交流行为(评论、转发与引用)并不是吸引更多交流行为的动因,以下三组数据说明了这一点:①用户被关注数与被评论数、被转发数、被引用数的相关系数分别是0.760956、0.906 135和0.7328875;②用户转发数与被转发数、被评论数、被引用数的相关系数为:0.206729、0.092 65和0.066263;③用户评论数与被评论数、被转发数、被引用数的相关系数为:0.027332、0.136103和0.146165。

以上第一组数据说明,用户的关注数与被评论、被转发、被引用均存在高度相关性。特别是与转发数的相关系数高达0.906135,说明在交流网络中,用户的信息是否被广泛地传播和交流,与该用户是否是网络中被关注的核心节点有很大关系,核心用户在信息传播(即转发)中所起的作用比在信息交流中(即评论)所起的作用更大。第二组和第三组数据说明,用户的转发和评论行为与他被评论、被转发和被引用不存在相关性。也就是说,在关注网络中,处于边缘的用户的转发和评论行为,并不一定会引起更多的转发和评论行为。但是边缘用户的交流一旦与核心用户形成了强交流关系时(这里认为强交流是多次相互交流),情况则可能发生变化,这时边缘用户可能会引起更多的交流行为,如序号为48的用户,其入度仅为3,不在关注网络的前20名内,但是却在转发和评论网络中被列在人度前20名内,原因就是该用户与关注网络的核心用户206具有多次反复的交流,从而进入以206为核心的小团体中,受到小团体中其他人的关注。这一结论对于企业营销具有现实意义,微博客中存在大量处于关注网络边缘地位的中小企业用户,他们由于现实中的地位,很难成为高被关注者,但可以通过与核心用户建立交流关系而成为信息交流网络中的核心用户,达到信息传播的目的。

①入度比为人度数与所有用户入度总数之比;②表中同时出现在三个以上网络的用户编号及其在新浪微博中的用户名对照:1723一左小祖咒,987-连鹏,300唐师曾,406-水煮鱼皇后,710-老榕,1015-胡同台妹,561-马英十,206-易天,1147-王蕃。94-吴祚来,8-江郎才溢三世,107-大蚂蚁诗平

3.2.2 网络组件分析和比较 网络组件(component)是指在网络中存在的最大的相连的子网络,组件分析可以观察构成网络各子网络的规模和结构,在UCNET中调入四种矩阵数据,按照以下路径:Network>Re-gions>Component,分别得到关注网络、评论网络、转发网络及引用网络的组件数分别是736、1559、805和684,对于每类网络,根据节点数的大小,将节点数大于或等于三的组件排序,并计算组件所包括的节点数占总节点数的比例,得到表2:

从表2中可发现以下现象:

关注网络中存在一个巨大的组件,远远大于其他三种网络中最大的组件,该组件含有1064个节点,即在用户集u中,43.1%的用户通过关注关系形成了相连的子网。在关注某一话题的用户集中,如果其关注网络存在的组件越大,越利于信息的传播。

评论网络较其他网络,所包含的组件规模最小,最大的组件只有135个节点,即在评论网络中形成了一个个小规模的交流团体。

转发网络组件存在几个较大规模的组件,大于评论网络,可以解释为在信息传播及交流过程中,转发是比评论更易完成的交流行为,因此也更易形成更大的传播网络。引用网络也存在几个较大规模的组件,规模大于转发网络和评论网络。

四种网络有一个共同的特点是,最大的组件与第二大的组件之间的节点数有很大的差别,特别是关注网络,第二大的组件仅有83个节点。此外,每个组件包括的节点数、点总节点数的比例衰减非常快,即大的组件都很少,每种网络中存在大量节点数较少的组件,关注、评论、转发和引用网络节点数分别为736、1559、805和684,但节点数不超过三的组件分别高达675、1493、751和629。

4 结语

网络环境下的用户信息交流不同于前互联网时代的大众传播、组织传播与人际交流,多篇文献用5W理论解读网络社区的信息交流,认为网络社区中的信息交流是任何人可以在任何时候、任何地点、采用任何方式、对任何人去发表意见,但本研究中发现,社区信息传播中的who与whom是有区别的,处于现实社会中的名人及名机构的影响力已转移到网络社区,在信息传播的过程中往往起着who的作用,而普通用户虽然仍有话语权,但往往被信息海洋所淹没,成为交流中的whom,这点可以解释很多中小企业在微博客、BBS等社区开展营销时而未见效果的原因;在传播渠道上,也并非畅通无阻,往往会因为节点未处于信息中枢或因为用户不作为(转发或评论)而使信息中断;在传播时间上,处于不同传播时间点上的用户的传播能力也是不同的,信息早期有核心用户传播并在传播过程中不断有核心用户承接,才会得到较快而持久的传播。用户信息交流是一个复杂的行为和过程,本文主要是从信息交流的关系层面剖析传播的现象和规律,研究结论对于进一步探索新媒体信息交流理论,探索微博客在教育、学术交流、网络营销及网络社区监测管理方面的应用实践具有一定的作用。

上一篇:微博客信息传播结构\路径及其影响因素分析 下一篇:并购事件中的网络口碑研究