知乎上的社会实验

时间:2022-09-30 04:10:48

知乎上的社会实验

知乎就是一个社会,算法的调整就是一次社会动荡。

在近几年的中文互联网上,知乎是一个无法忽视的存在。没有一个网站能像知乎这样,虽然只有2000多万用户,影响力却无处不在;没有一个网站像知乎这样,同时扮演了问答社区、搜索引擎、大众点评、新闻社区、情感论坛、 第一人称文学网等这么多角色。这就是一个生态。

知乎的用户结构:两极分化的金字塔

2014年8月的知乎用户调查数据报告为我们勾勒出了这群“中文互联网鄙视链”最顶端的群体的画像。然而,知乎这个2000万人的“知识社会”的社会结构是什么样的?这时候就要请出知乎数据大帝,“看知乎”的创始人苏莉安同学。

他于2014年8月通过以3,507,426名总用户为样本进行数据挖掘而推出的《第一次民间版知乎用户分析报告》让我们可以一窥知乎用户的行为习惯、分工构成。

69.14%的用户是完全没有人关注的“小透明”,83.76%的用户从未回答过问题,96%的用户粉丝不足10人,而粉丝数超过1000的“大v”只占总用户的万分之九。而零关注、零提问、零回答的“三零用户”占全体用户的59.65%。65%的人只关注粉丝上千的3000多位“牛人”,近一半的人把所有目光完全限定在粉丝过万的729位“大牛”之上。

这不只是一个金字塔社会,更是一个金字塔“顶角”小于1度的“针尖型”社会。这也印证了绝大多数用户对于知乎的定义――“上知乎就是为了瞻仰神人”、“上知乎涨姿势”、“上知乎就是为了开阔眼界”。也许新浪微博还能暂时安坐在“社交媒体”的交椅上,但是知乎真该放弃社交大梦了(然而并没有)。不妨再补上一刀:在知乎你关注一个人时只有1.25%的概率得到回粉。

“大V路线”对于新浪微博来说可谓“成也萧何,败也萧何”,知乎也是如此。虽然从去年开始,处于“成败转折点”上的知乎开始“矫枉过正”地赋权于“小透明”,还激起了少数大 V先拂袖而去的连锁反应。不过,在此之前,知乎一直不遗余力地推动着“造星运动”,发掘了一批在线下默默无闻,却能依靠问答成名的“知识英雄”。

知乎的中心化程度远远高于Quora,知乎创始人周源的关注者是Quora CEO follower数量的6倍。在知乎上, TOP 1 的“大V”李开复有87万粉丝,而Quora上最受人追捧Wikipedia创始人Jimmy Wales不过15万follower。

是中国网民的从众心理、追星效应在作祟么?显然并不是。这样一座高耸入云的“知识金字塔”是知乎亲手铸造的。

“新版的动态是一个以人为核心的信息流。”这是2012年8月16日知乎首页改版时周源的解释,之所以将用户关注的问题、话题、回答“折叠”进通知和话题动态里,只是为了拯救被不同维度筛选出的内容乱糟糟充斥的feed。知乎放大“人”作为信息节点的能量,希望用“人肉过滤器”来实现信息的筛选。(知乎团队当仁不让地扮演了curator的角色,黄继新也在“当我取消关注黄继新、张亮等人后,我在知乎是否更开心?”这一问题下为自己的刷屏行为辩护:“我现在其实是通过人肉的方法来解决系统将来依靠算法和产品来解决的问题。”)因为“基于问题/话题的feed设计可以在内容范围上实现信息筛选,但无法在内容质量上进行信息筛选。”

“虽然动态出现什么内容,完全是个性化的选择――感兴趣就保持关注,不感兴趣可以取消关注,但,这个成本对大部分用户来说仍然太高了。”在周源眼中,向微博、人人等SNS网站靠拢,对于新用户来说是一个学习成本更低的选择。

如此一来,高关注用户“事实上”就成为了决定什么话题、问题、答案能被大多数用户看到的“实名编辑”――关注度即权力。他们的一举一动,一个回答、一个关注、一个点赞都能被成千上万的用户看到。

“大V出场自带300赞”、“一处大V,全站大V”、“新手的回答只有被大 V的金手指临幸,才有机会出头”、“大V组团刷屏”……关注度马太效应造成的“知乎怪象”愈演愈烈。而2014年12月之前以点赞数论高低的问题排名机制更是放大了大V的马太效应。

我们可以顺便看一下“邻家小妹”豆瓣的情况。撑起豆瓣相册半壁江山的“福根儿”不过才有18万关注者,而水木丁、逯女神等所谓的“豆瓣红人”关注者都不超过10万人。

“人肉代替算法”的权宜之策一直持续到2013年11月的首页改版,造成的高关注用户与“小透明”之间的权力失衡已经难以逆转。也许,所有高门槛的UCG网站最终都会不可避免地演变成PGC网站。

首页的改版:人肉过滤还是话题过滤

我在《商业价值》此前所作《豆瓣十年,一朝重来》一文解析中,曾经提到过豆瓣在“内容发现”问题上的路线之争:算法推荐V.S.社交推荐。豆瓣虽然尝试着两条腿走路,然而每一条都有先天不足之处:推荐算法缺少用户的频繁“调教”导致精准度不高;社交推荐由于用户的低活跃度而内容稀缺。

与豆瓣在两种机制之间摇摆不定,首页来回“变脸”不同,知乎对于人肉过滤和话题过滤的优劣长短,对于内容运营和技术能力有着清晰的认识。前文提到的黄继新不惜“刷屏”充当人肉curator就是在早期推荐算法无法有效提高信噪比的情况下的一种权宜之计,用强运营来顶上技术的短板。

然而,首页只推关注人的改版引发了用户大规模的吐槽和反弹,堪称知乎的第一次信任危机。(甚至出现了“如果知乎坚持新版你会退出知乎吗?”这样的问题)周源不得不站出来一再解释改版的初衷源于话题推送的Bug暂时难以克服,“导致 feed 信噪比急速下降,很多新用户被骂。这种情况让我们很痛心。”

据知乎联合创始人张亮透露,首页feed之所以“一刀切”的改为以人为核心的机制,是因为同时(准确点说,是在首页动手术20多天后)在首页为话题开了一个入口(也就是把首页的领域变成了话题)。知乎的思路是:让订阅的用户和话题分开显示,各取所需。然而,首页feed却只有一个,话题被挤下首页,“躲进”二级页面。当用户要点开“话题”,然后在无数话题中选择一个,点击“动态”才能看到更新时,难怪他们会怒气冲冲地质问“首页的话题都不见了,那么关注话题还有什么意义?”

2012年8月这次怨声载道的改版风波说明:蹒跚学步阶段的知乎想要在Quora之外另辟蹊径时仍显稚嫩。一年多以后,一直饱受诟病的知乎首页终于“改邪归正”,这背后当然是知乎技术能力的不断成熟。用户关注话题下的内容才重新进入首页动态,相比两年前的升级之处在于“智能排序,动态内容会根据你的阅读偏好不断优化,越用越好用。”

问答排名算法:牵一发而动全身

我在前文曾经把知乎的点赞投票机制比作超级女声,然而与“一人一票”的民粹型民主相比,知乎的段位还是要高上一筹。这主要体现在知乎的问答排名机制上:在2014年12月之前,知乎的回答排序算法是:得分=加权赞同数-加权反对数,得分越高回答越靠前。

与简单粗暴的“一人一票,票票平等”相比,高权重用户的投票,会对排序有更大的影响,他们的回答也会具有一定的排序优势。按照知乎产品设计师黄涛的回答――“用户在某个问题下的权重,是根据他过去在相关话题下的回答得到的赞同、反对和没有帮助票数计算的。用户过去回答的得票,体现了其他用户在相关领域下对他能力的认可程度。”

如果把知乎比喻为一个城邦,那么他的治理规则既不是民粹式民主,也不是全然的精英统治,而是两者兼顾。这套机制一定程度上保证了那些“专业性”与“通俗性”兼具的答案能够浮出水面。

然而,很多时候,专业人士往往寡不敌众(据媒体报道,500万用户时的知乎有3000名高权重用户,比例仅为0.06%。哪怕他们手中的票以一当十,也还是杯水车薪),专业性往往要给“通俗性”让路,信息密度往往要给阅读让路。这也就是为什么知乎的榜首回答动辄洋洋洒洒几千言,连一篇分析房价走向的回答都要用暴漫、日和、网络热图“人为”地制造起承转合的“故事感”(毕竟,人人都喜欢看故事)。而很多专业领域的讨论仅限于向外行人“科普”的ABC水平。

苏莉安曾用“100字以上的答案掠走了赞同总数的80%;而1000字以上答案虽然总数不到4%,所有人点下的赞同却有40%落在它们头上。”来反驳“知乎变水了”这一论断。然而,知乎的“水化”当然不仅仅是由于抖机灵的回答越来越多,而是由于用户群体的不断扩大,用户平均水平的不断降低,一个回答要想获得高票赞同,不得不加入更多的背景介绍和通俗化包装。曾经满是干货的社区也就变得越来越“水”了。按照黄涛的说法“一些误导性、煽动性的高票内容,即使同时也有很多反对票,仍然排在认真、严谨但票数相对较少的优质回答前面。”

问题当然不止于此。单纯以“赞同数-反对数”对回答进行排序的机制忽视了“时间”这一重要维度。一旦某些时间较早的回答获得了高票,占据了高位,那么即使后来的回答质量更高,也会由于很难获得足够的曝光而赞者寥寥,从而被埋没。尤其是,知乎上的大部分问题的热度都会随着时间的推移“冷却“下来,正当其时的回答引起了足够多的关注,姗姗来迟的回答则乏人问津。没有多少人会从头至尾看完每一个回答,排名靠前的回答就成了“马太效应”的受益者。

久而久之,一个问题下面的回答就会像“化石”一样固化下来,新的回答很难出人头地。这对于跃跃欲试的新用户无疑是个巨大的打击,失去了源头活水的社区也会慢慢变得静若死水。

2014年12月,知乎开始对回答排名算法“动手术”了。

上面的威尔逊算法公式虽然复杂,但其实决定答案得分的主要有两个参数:赞同率p(赞同数/反对数)和参数 。按照知乎数据帝chenqin的分析:p设置得越高,绝对赞同数就越重要,设置较低时,赞同率就越重要。当 等于0时,赞同率将起到全部作用。而数学帝曾加则观察到:当n(赞同数+反对数)很大的时候,得分最重要的影响因素是 p,也就是赞同比。

相比于原来的算法,新算法最大的改变就是更看重赞同反对比,而不是赞同反对差,这意味着反对票的“杀伤力”大大增强。表面开来,那些“客观中立”、“四平八稳”、“摆事实不讲道理”的回答将会获益,而那些观点鲜明、站队明显、情绪化等容易“招黑”的回答将因为踩的人过多而沉底。

上文在分析“知乎为什么成功”时曾经提到:知乎人气高涨的一个原因正是吸引了价值观不同的群体(女权主义、中医、左)之间的站队、PK,形成了一个观点争锋的舆论场,提高了知乎的活跃度。然而,正如魏武挥指出的那样“真理越辩越明只是知乎一厢情愿的理想主义”,不同观点的PK导致知乎的虐气越来越重,一言不合便恶语相向,掐架谩骂成为家常便饭。长此以往,知乎理性讨论的氛围将荡然无存。相比之下,以科学事实类问题为主,聚集了一帮理科生的果壳问答则很少有此困扰。所以,“赞同数-反对数”的答案排序规则一直沿用至今。

加大反对票的权重就是对“站队现象”的一种矫正(也许是矫枉过正)。在新的算法下,xx粉和xx黑曾经“捉对厮杀”的回答因为互相踩踏将会双双降级,上位的将是各打五十大板,“安全无害”的回答。(在“中医是伪科学吗?应该如何看待中医?”问题下,排名第一的回答写道“中医不是科学,中医有效果,不解释。”)然而,争议越少的回答就越是好的回答吗?惩罚“有态度”的回答或许能够减少大家讨论时的“火药味儿”,让排名靠前的答案趋向“中立”。然而,增强反对票的威力却可能会鼓励“正反双方”互踩,使彼此更为“对立”。过去,读者只需要用点赞来“是其所是”,现在他们还倾向于用反对来“非其所非”。

知乎之所以选择不显示反对者的名字及数量,正是为了给答题者以正向激励,而不是负面激励。而如今,匿名、数量不透明的反对票却掌握了一个回答的排名升降,这种负面激励恐怕会给答题者造成更大的困扰,也会鼓励恶意反对的出现。

有63万粉丝的yolfilm甚至说出了这样的话:

当他们在微信群里得意洋洋地说,如何用小号集结,用软件把某某某的答案点反对时。你们知乎的设计,容我再说难听一些,就是为虎作伥。知乎若败,那第一个败象,就是2015年的“加大反对权重”设计。

友善度机制:知乎的“整风运动”

看了“如何评价知乎的友善度机制?”下面的80多个回答,你就会知道知乎管理员的“G点”有多低。以上4种言论在被人举报后都被知乎管理员判定为“不友善”,被扣除相应的友善度点数。而当友善度点数被扣完之后,用户就会被关进“小黑屋”,与被封号无异。要想恢复友善度只有3种办法:1.举报其他用户的不友善行为;2.做题(比如上面那5道判断题);3.等待每年的国际友善日大赦天下。

如果说加大反对票权重会让答题者遭受不知何处飞来的“暗箭”,那么友善度则会让题主回答、评论的每一个字都成为潜在的“靶子”。要知道友善度机制是“追溯以往”的,在2015年4月友善度机制上线之前的回答、评论也在举报者的纠察范围之内。也就是说,你在知乎上发的言越多,越有可能踩着别人的尾巴而遭到举报。果然,就在友善度机制上线不久,在知乎上回答过300多个问题,收获156万赞同,2.4万感谢的知友恶魔的奶爸就因为连续被十几次举报友善度被扣到了只剩半颗星,被剥夺了评论权限。为了防止有人继续“挑刺”,他删除了过去几年所写下的几百万字答案。

知乎友善度机制的初衷是鼓励和引导社区用户自治,构建和完善良性讨论氛围。然而,这种不举不究,鼓励用户互相揭发(举报别人可以提升自己的友善度)的做法实际上“防君子不防小人”。而且,由于对“不友善”的界定太过宽泛,管理员手中的自由裁量权过大。而且,在两个人你来我往的对话中,哪些是轻蔑、诽谤、嘲讽、挑衅、歧视……的言论,更是仁者见仁、智者见智,全凭管理员是不是“玻璃心”。要知道,管理员也是有立场的。这不是自治,而是由管理员来控制言论尺度。

知乎本想通过友善度设计发起一轮“整风运动”,却没有换来期望中的人人谨言慎行,而是成了意见不合者打击报复的“私器”。而且,知乎的惩戒机制对于那些“光脚的”三零用户无效,他们完全可以再换个马甲重新杀回来。而对于恶魔的奶爸这样重度贡献的用户则是一颗随时可能引爆的炸弹。这种表面上的权利平等恰恰是对内容生产者的不公平。用一位知友的话来表达就是“合着我一年敲几百万字的就活该被几个三零用户一晚上举报光了抄光了封号?”

早在2013年初就有人在知乎上忧心忡忡地发问:如何重建知乎上相互信任和友善的氛围?知友负二的回答可以送给知乎团队:知乎不是世外桃源,整个中国社交网站的环境有多糟,知乎顶多也就只能做到比其他人好那么一点点,不要对知乎抱有不切实际的幻想。

2000多万用户的知乎早已不是当年那个温良恭俭让的知识乌托邦。这个时候还想用一套机制来对抗人性,规范人们的言行,不切实际的理想主义只会适得其反。

上一篇:45年,“草根教授”的汽修励志路 下一篇:京东的技术面孔