世界上最了解你的人是谁?

时间:2022-07-18 01:06:06

世界上最了解你的人是谁?

看到这个题目,你会想起谁?或许是要好的死党,Ta了解你从小到大所有的糗事;或许是你的伴侣,Ta总是体贴入微,察言观色,帮你面对生活中的种种不顺;或许是父母、高中时代的玩伴、素未谋面却神交已久的网友 —— 也可能,脑海中闪过无数人的影像后,你会感慨一句,最了解你的人还是你自己。

现在,科学家会给你另外一个答案。

剑桥大学的心理学家麦克·科金斯基(Michal Kosinskia)、大卫·史迪维拉(David Stillwella)和微软研究院的索尔·格里皮(Thore Graepelb),在2013年《美国国家科学院院刊》(Proceedings of the National Academy of Sciences)发表的一项研究显示,一个人在Facebook上点“赞”(Like)的数字记录,可以较为准确地预测多项个人特征—— 诸如政治观点、 、性别、种族、性取向、智商和人格等等。

研究者使用一个Facebook上的插件,在自愿基础上,收集了超过5万8千名美国用户的资料。研究者采取了一种名为“机器学习”的方法,此法能自动分析海量数据,并从中获得规律,再利用得到的规律,对未知数据展开进一步预测。如此循环往复,规律的精度也逐步提高。

最终数据显示,这个算法根据人们在社交网络上所喜欢的页面,较为准确地判断出用户的多项资料和私人特征。它对种族判断的准确率为95%,性别判断准确率为93%,性取向判断准确率为88%,党派区分准确率为85% ,宗教派别判断准确率为82%。此外,它甚至还能预测父母是否离异、是否吸烟喝酒、智商高低、各项性格特征(如内向、外向),乃至对生活的满意度,等等,不过准确率比之前的个人特征要低。

由于研究者的算法是机器自动生成,因此总结出来的规律,有的经得起逻辑推敲,有的却有些匪夷所思。以智商判断来说,高智商的用户会喜欢The Colbert Report(美国一档政治脱口秀节目,主持人以辛辣幽默的语言评论当下时事)、Science(科学)、甚至是Curly Fries(将土豆削成弹簧状炸成的薯条)。而智商较低的用户会喜欢Sephora(丝芙兰,源自法国的化妆品品牌)、I Love Being A Mom(一个分享身为人母各种心得体会的页面)、Harley Davidson(美国摩托车品牌)和Lady Antebellum(美国乡村音乐组合)。而预测男性同性恋的“赞”包括No H8 Campaign(抗议活动,旨在反对美国加利福尼亚州试图禁止同性婚姻的八号提案)、Mac Cosmetics(化妆品品牌)、Wicked The Musical(百老汇音乐剧),而预测男性异性恋的“赞”则包括Wu-Tang Clan(武当派,一个美国嘻哈组会)和Being Confused After Waking Up From Naps(一个段子页面)等等。

谈到这项研究的意义时,研究者写到,通过人的网络记录而预测人的性格与喜好,可以改善诸多产品和服务。例如,广告商可以更有针对性地发放广告,电子设备可以根据用户调整自己的行为。不过,这种研究也暴露了隐私问题:当用户在互联网上漫游,随手点下“赞”的时候,他们自身的诸多心理特点,就这样呈现在其他组织的面前,甚至被加以利用。

这样看来,Facebook上的数字记录是不是比你的好朋友更了解你自己呢?通过人们在网络上的行为,来进行分析推断,还能了解你最近的心情,比如看看你是不是抑郁了—— 那么, 就算你在朋友面前强颜欢笑,也逃不过电子记录的眼睛。

点击的秘密

2012年,来自密苏里科技大学计算机科学、心理学、信息技术等多个领域的研究者,合作发表了一项研究,探讨如何借助人们的网络行为数据,发现心理抑郁的前兆。他们招募了216名大学本科生,收集他们平时上网的习惯,并调查了他们近期的抑郁倾向,对比得出结论。

值得注意的是,研究者并没有具体分析人们网络行为的内容。比如,你观看了哪些视频,发表了何种言论,这些信息自然会透露心理信息,无需分析。研究者关注的仅仅是你的上网方式,比如平时的上网时间、流量,都使用了哪些功能(电子邮件、下载行为等)—— 这样的数据,有预测效力吗?

进过分析,研究者发现,即使仅仅是通过简单的上网行为,也能窥探出你的心情。较大的网络流量、P2P文件共享、频繁地查看电子邮件、使用网络聊天、在不同网站和网络应用间随机跳转——这些表现都和较高的抑郁倾向有关。

这个结论有点耸人听闻?且听仔细分析。网络流量通常和电子游戏和视频有关,而P2P文件共享通常用于下载电影、照片、音乐等等,沉溺于这些内容当中,较有可能产生抑郁倾向。频繁地查看电子邮件,通常代表人比较焦虑,具有强迫性。在网络上聊天,说明可能缺少线下的面对面交流。而在不同的网络应用中跳转—— 一会儿看视频,一会儿看网页,一会儿查邮件,可能反映了一种缺乏(Anhedonia)的心理状态。这样的人需要不断频繁地寻找新鲜刺激,也意味着有较高的抑郁概率。

在研究者看来,通过网络行为判断抑郁倾向,有着潜在的应用价值。由于那些抑郁症患者或有自杀倾向的人,常常会隐藏自己的情绪,不轻易向外人表露—— 即使是亲朋好友或经常打交道的人,也有可能难以发现他们的异常情绪。他们亟需帮助,别人却不能知晓。因此,通过观察他们在互联网上留下的种种足迹,或许能够帮助我们找到抑郁症的踪影。

然则,这一方法同样模糊了隐私的界限,让人感到不安。以下场景会在未来变成现实吗?你正宅在家里上网,和陌生人网聊正high,看着新下载的视频,突然响起“咚咚咚”的敲门声,快递举着包裹站在门口,说道:“最新的抗抑郁药到了。”

这种通过网络数据了解个人的技术,正在往移动端发展。来自美国麻省理工大学媒体实验室、哈佛大学心理学系、法国里昂高等师范学校的四名研究者,在2013年发表了一项研究,证明可以通过人们的手机记录,来判断用户的性格特点。研究者在论文中写到,这是第一个通过手机基本记录来预测人们性格的研究。

早在这项研究发表之前,不少学者已经通过社交网络(例如文章开始时提到的Facebook研究)或是智能手机上的安装软件,来分析用户的性格。可是这些数据来源,通常需要征询用户的同意,安装插件,来取得权限,再进行分析。但这项研究不同的是,它采用的仅仅是用户的手机使用记录,例如通话、短信等基本信息。而这样的数据,更加容易获得。

研究者在麻省理工大学,收集了实验参与者的通话、短信和GPS记录,并通过问卷调查了他们“大五人格”。这一人格模型将人格划分为五个维度,分别是外向性、经验开放性、尽责性、情绪稳定性和亲和性。每个人都处于五个连续维度上的不同位置:外向性得分高者热爱社交活动,喜欢交友,寻找刺激,相对应的,得分低的内向者不好交际、喜欢独自思考;经验开放性得分高者有好奇心、想象力、寻找新的经验,而经验封闭者兴趣范围较窄,喜欢熟悉的套路;尽责性高分者自律,细心,有条理,做事审慎,但也可能过于完美主义或成为工作狂,而得分低者较为悠闲,缺乏目标;情绪稳定者内心平静,而得分低者通常易遭遇焦虑、愤怒和抑郁等情绪;最后,亲和性较高者善解人意,乐于助人,对人性乐观,而较低者则多疑多虑,缺少同情心,不太友好。

在手机使用的基本信息上,研究者开发出了一些新的指标,来更好地反映用户的交互方式。一些指标较易理解,比如用户通话和短信的次数,联系人的总数和多样性,主动发起联系的比例,在夜晚通话的次数,一小时内回复短信的比例和滞后时间,每天活动范围的半径和活动距离,每次联系(如通话、短信)的间隔时间,等等。另一些指标则比较复杂,例如通话、短信的“熵”(entropy),这一指标越高,反映出一个人常和较多的联系人交流,且交流的频率比较平均,而非集中于和固定的几个人交流。再如“AR系数”,指的是人们在前六小时内通话的次数,和在之后六小时通话的次数之间的关系。

这样林林总总,研究者采用了共有三十多项指标。在其基础上,研究者建立起一个模型,来预测人们的性格。这一模型在“大五人格”的五个指标上—— 情绪稳定性、外向性、尽责性、亲和性和经验开放性—— 的预测准确性,分别为63%、61%、51%、51%和49%,比随机猜测的正确概率平均高出42%。情绪稳定性,和每天活动的距离和活动半径密切相关。而短信联系的熵,能较好地预测外向性与亲和性。毕竟,外向的人更愿意广交朋友,亲和性高的人,也有更多的人愿意和他们交朋友。尽责性高的人,与通话间隔时间的方差相关。这些人生活有条理有组织,遵守时间。而经验开放性这一维度,则与平均短信间隔时间和主动发出短信的比例有关。

不管你愿不愿意,网络、手机等电子产品已经渗透到了人们生活的方方面面。当你在互联网上浏览网页,在社交网络上转发评论,在购物网站上消费,在LBS服务中签到,网络就在为你默默地建立一份数字档案,猜测你是一个怎样的人。

世界上最了解你的人,你现在的答案是?

上一篇:培养“干净”的生存智慧 下一篇:十月妈咪赵浦的“大肚经”