沃森还会做什么

时间:2022-10-29 11:48:34

超级计算机沃森并不想重复它的前辈深蓝的凄惨晚年,它为自己找好了出路:每年为IBM带去新生意。

这不是现在它自己就可以作出的决定—注意,我说的是现在。至于以后,这会是一个更重大的话题。

我们可以先从它怎样为IBM带去新生意谈起。接受《第一财经周刊》采访的沃森商业化主管Manoj Saxena最近透露说,IBM的相关规划已经制订到了2015年。而到了那一年,“包括沃森项目在内的IBM数据分析业务收入将超过160亿美元。”

这不算一个小数目,它看起来比深蓝要厉害多了。要知道因为击败了国际象棋冠军,深蓝也曾经名噪一时,但它最终只是成为了IBM每年公司折旧费用上的一部分数字。

很大程度上,这是因为沃森站在了深蓝的肩膀上。

2011年2月16日晚,在超过3500万名观众面前,沃森在美国著名的智力竞赛节目《危机边缘(Jeopardy)》中,击败曾连续74次夺冠的Ken Jennings和另一位选手Brad Rutter,拿走了100万美元奖金。后来Ken Jennings在他的题板上写下了那句被人们所熟知的话:“嗨,电脑们。现在,我们的新老大来了!”

他是被这样一台东西击败的:它有一块方型显示屏,还有90台IBM POWER 750处理器—其中包括2880个CPU,还有15TB的内存。这些都被藏在演播室上方的机房里。

IBM大中华区Power服务器产品部总经理侯淼解释说,这样的配置可以让沃森每秒进行80TB的浮点运算。这相当于每秒阅读100万本书籍,而它身边的Ken和Brad可能一辈子也读不完其中的1%。

类似这样的超强运算能力深蓝其实也具备,并且也正是依靠这种能力,它才可以每秒分析2亿步棋,最终战胜了卡斯帕罗夫。但如果要让深蓝参加智力竞赛,它可能一题也答不上来,甚至连问题也无法理解。

这正是沃森的强大之处:它可以理解人们所说的话,并快速做出反馈。这个被称为“头脑”的部分,是IBM为沃森研发的深度问题回答(Deep QA)技术。

再通俗点说,这是人工智能(AI)的真正开始。

举个例子的话,当沃森被问到“哪个城市在2008年举办了一项标志为‘五环’的重要赛事”时,它的整个处理过程是这样的:第一步,根据语法,找到“问题焦点”并进行标注,在这一题中,“城市”就是问题焦点;第二步,它会对“2008年”、“标志”、“五环”、“重要赛事”等关键词,按照不同权重进行知识库搜索,从中抽取初始答案;第三步,将这些初始答案—常常是成百上千个模糊答案,重新带回到问题中;最后一步,也是最关键的一步,沃森通过一个学习模型,综合搜索信息,对所有答案按照概率排序,将它认为可能性最大(概率最高)的三个答案显示到答题板上。整个过程都发生在几秒中之间。

IBM在全球拥有12个研究院,每年会投入60至70亿美元进行研发。“有一类研发公司内部称为Grand challenge。”侯淼说:“一旦研发成功,将会对整个社会产生非常巨大的影响。”

2000年初,时任IBM总裁的彭明盛第一次对研发部门提出了“Grand challenge”的目标,希望到2011年也就是IBM诞生100年时,能够研发出一款革命性的产品,影响整个计算机行业未来的走向,甚至能够对人类有非常巨大的帮助。

4年之后的一天,IBM研究经理Charles Lickel在一家餐厅里和同事吃饭,突然之间,整个餐厅安静了。他发现所有人的目光都集中在了大屏幕上,期待Ken Jennings扩大他在《危机边缘》节目中的连胜记录。

这个情景让Charles Lickel产生了一个想法:让IBM开发一款答题机器。这个想法很快得到了上层的支持。IBM语意分析与综合部接下了这个最具挑战性的项目,从2006年开始进行了一系列测试。

在最初的测试中,研究人员向沃森提了500个《危机边缘》中出现过的问题,沃森只能答对15%左右的问题,而节目中最好的选手,可以用比沃森少一半的时间答对其中95%以上的问题;从2007年开始,IBM给这一项目加派了15个研究人员,希望通过3至5年的时间把沃森训练成一架优秀的答题机器。

在此过程中,沃森进行了55次模似竞赛,这些比赛完全按照《危机边缘》的赛制,邀请节目中的冠军们和沃森进行比拼。当沃森答错一题时,沃森会对错误答案进行记忆,当下一次碰到同类型问题时,将对原有的答题逻辑进行优化,避免再犯同样的错误。这跟人类的自我改正十分相似。

在整个训练过程中,沃森逐渐取得了70%的胜率。到了2011年比赛前的最后几个月,沃森几乎可以击败所有的选手,它准备好了。

除了强大的计算能力和海量的数据来源,研究人员为沃森设计的自我记忆、纠错、学习的模型,成为沃森不同于其他超级计算机的关键。这样的“学习模型”,也出现在Google无人驾驶汽车的研发中:技术人员每天带着电脑上路,让它记忆人类在驾驶汽车的过程中,面对不同情况时的应对方法。

不同的学习模型可以造就不同的沃森,这也是IBM在考虑沃森的商业化方向时,需要面对的问题:沃森到底是什么、它应该解决什么问题。

在IBM的官方网站上,对沃森的介绍是“集高级自然语言处理、信息检索、知识表示、自动推理、机器学习等开放式问答技术的应用”,但这样一个文绉绉的解释,很难说服那些目标客户。这些客户通常只在乎自己的钱花在了哪儿、沃森能为他们做什么。

IBM资深副总裁和研究主管John Kelly在接受媒体采访时曾表示:“我们真的认为它可以用在任何地方。”同时他和他的同事也清楚地认识到沃森真正的“基因”:它可以在很短的时间内处理海量的信息,并从这些信息中找出有价值的部分,通过自然语言同人类实现信息的交流和交换。

这让沃森可以成为一个“智囊”、“顾问”和“助手”。那些需要处理大量数据、知识不断更新,同时又需要据此做出复杂判断的领域,成为了最能发挥沃森作用的领域。

沃森在医疗行业找到了自己的第一份工作。根据IBM和医疗保险公司Wellpoint的协议,从2012年年初开始,沃森将帮助护士们管理复杂的病例和来自医疗服务提供商的请求;然后,Wellpoint会开发一套面向医生的技术,使得医生可以通过自己的手机和平板电脑,了解肿瘤患者的身体状况。

侯淼说,选择医疗领域是因为这里具有良好的档案储存制度,积累了大量的医学数据、病历档案,并进行了科学的分类。这些大量的可搜索数据,是沃森发挥作用的重要前提。

不同地区医疗水平的巨大差异,也使得沃森拥有广泛的应用前景。“一些偏远地区的小医院也可以通过云端访问全国的医疗数据库,享受到沃森带来的服务。”

Mark Kris所在的Memorial Sloan-Kettering癌症研究中心(MSKCC)在1年前加入了这一项目。Kris是一位经验丰富的临床肿瘤医师,同时也是《危机边缘》的忠实粉丝。他告诉《第一财经周刊》,从2年前他在电视机前目睹沃森表演的那天起,就对沃森产生了兴趣。

过去半个世纪,人类在许多领域取得了突破性的进展,但癌症研究和临床治疗方面一直没有重大突破。按照Kris说法,在过去40年中,癌症研究方面最大的突破,仅仅就是让人类了解到了这种疾病的复杂性。

在癌症治疗领域,不同病人之间有十分微妙的差异,医生们需要有更好的方法了解和区分这些差异,因为这些小差异带来的影响,有时候可能是致命的。

无法准确知道这些差异的结果,就使医生无法针对每个人不同的病情确定最佳治疗方法。“化疗是常见的一种治疗方法,”Kris解释道,“但是你怎么在数十种不同的化疗选项中进行挑选呢?你又如何确定剂量?怎样的化疗频率才是最佳的呢?”

在现在这个阶段,沃森还不能马上成为这个救世主。它眼下的主要工作,还是通过搜索医学文献和历史数据,快速为某一患者找到情况相似的其他患者。这一过程可以帮助医生在相似案例间获得更多的有用信息,在信息更充分的条件下做出更有说服力的判断。在沃森之前,医生需要自己熟记每一个病人的情况,还要在新病人出现时立刻从头脑里搜索出相似对象,费时费力,准确性还不高。

在进入Memorial Sloan-Kettering癌症研究中心之后,“补课”是沃森要做的第一件事,MSKCC的员工和IBM的项目成员一起训练着沃森。从肺癌开始,研究人员通过分享关于肺癌的知识和经验,让沃森了解到所有关于肺癌的内容。

沃森沿用了它在参加《危机边缘》训练时建立的学习模型:它的所有答案最终都会以一个概率的形式出现,那个概率最高的答案,就是沃森认为的正确答案;当这个答案被证明错误时,沃森会找到它与正确答案之间的区别,以后再遇到同类问题时,就会更新原有的逻辑;另外,它还可以从其他选手回答的同一类型问题中归纳出答案特点,帮助它用来回答这类问题。

在经过6个月的培训以后,沃森成为了一名可靠的医疗助手。医生们在自己的平板设备中打开沃森的应用,录入数据并提出问题。几秒钟之后,沃森就会提供几个可能的治疗方法,并且以不同的数值表示确信程度。有的治疗方法有90%的确信度,有的则是80%。而选择哪种治疗方式,还需要医生最后拿主意。

2013年秋天,Kris将和他的同事一起利用沃森帮助真正的病人进行癌症治疗。IBM在前不久联合Wellpoint了第一款商业用“基于沃森的认知计算系统”。

相对于参加《危机边缘》时那个拥有几十排服务器的家伙,从体型上看,这个新系统已经瘦身了不少,仅为一个双门冰箱的大小。

其中一个很重要的原因是,《危机边缘》中的问题涉及人文、历史、地理、政治等众多方面,选手们碰到相似问题的概率甚至小于3%,所以需要用数量众多的服务器储存足够多的知识。而在具体应用到某一行业时,所需的知识量会小很多,而且遇到相似问题的概率也会提升很多,对服务器的数量要求也就随之降低了。

沃森原有的Power750处理器也升级到了POWER7+,性能提升了50%。沃森可以用更短的时间处理更多的信息。原来回答问题需要3秒的话,现在就变成了2秒。

在IBM不断改造和培训沃森、试图提升它的自我学习能力的同时,Google也在人工智能领域取得了突破—它们让计算机认识了“猫”。

2012年6月,Google X实验室用一个由1.6万多个处理器、10亿个内部节点组成的“虚拟大脑”,模拟人脑中“神经元”的概念,形成了一个“神经网络”。这个神经网络会不断接收新数据。在一些模型的帮助下,神经元与神经元之间传递的数据发生了变化,它具备了初步的学习能力。

10天之后,这个“虚拟大脑”分析了1000万帧从YouTube上随机抓取的无标签视频剪辑图片,并成功学习到了“猫”的概念,并从随后导入的2万张图片中准确找出了有猫的照片。

这些试图改变世界的工程师们的下一步,是使这些“学习模型”更聪明、更高效。

IBM正在琢磨怎样把沃森部署到各行各业。就在这会儿,一台沃森正在接受花旗银行的岗前培训,通过读年报、财经新闻、招股说明书、监视交易,以及学习更专业的金融术语,更好地给客户推荐投资组合,或者回答诸如“接下去的3个月内哪家公司最有可能发生合并?”这样的问题。

在这个过程中,沃森最大的问题在于学习的速度:如何在最短的时间内学习这个行业的知识、术语,并学会用这些知识进行“思考”。即便学习模型的架构被总体沿用下来,也会根据不同行业做出有针对性的调整。

沃森还需要变得更聪明。很多时候,病人并不能很准确地,甚至会错误地描述问题。“一个病人说他头疼,但他的问题可能在其他地方。”侯淼说:“这个时候,沃森就需要能够识别出这些问题。”这也是将沃森运用到其他行业要面对的问题—那些“错误的描述”、“善意的欺骗”都需要它去识别和破解。

信息处理技术的飞跃,已经让人类可以逐步摆脱“样本”的束缚,在最大范围内利用数据,并使计算机具备学习的能力。人工智能的下一个瓶颈,会出现在“认知”部分:即使在智力竞赛中击败了人类最优秀的选手、成为了出色的医生或是最可信赖的投资分析师,也还摆脱不了“运算机器”的身份。学习只是对逻辑和算法的不断优化,但机器本身并没有出现自我意识。

这是一个更长远和重大的话题,它还需要沃森们首先思考更迫切的一步:怎样改变那些需要依靠海量数据做出重复决策的行业的决策方式,将人类的创造力进一步解放出来。

上一篇:金银岛的创伤 下一篇:第二十届华南国际印刷展即将精彩绽放