人工智能的江湖

时间:2022-09-22 01:23:36

人工智能的江湖

在人工智能这个江湖,有着太多的天才和大师,有的“为笑傲江湖而昙花一现”,有的“沉沦数十载,一鸣惊人”,有的却“人在江湖,身不由己”。无论最终他们选择了一个什么样的剧本,最终都在人类探索自己智慧的道路上做出了贡献。

在工业界,围绕人工智能进行的技术和资本大战来得比2016年”AlphaGo与李世石的围棋对决有过之而无不及。谷歌早在2014年就打开了这场大战的序幕,以4亿英镑(约合6亿美元)的高价收购了英国人工智能公司DeepMind,这次的围棋大战的主角AlphaGo就是出自这家公司。 在这之后,与人工智能技术相关的并购高达数十次,总额达到几百亿美元。并购的主角都是些业界的大佬:谷歌、苹果、Facebook、Twitter、Intel、Saleforce、IBM逐步走上世界舞台的中国巨头们也当仁不让,华为、百度、腾讯、阿里等公司也纷纷砸巨资研究和开发自己的人工智能平台及产品。

细心的读者也许会发现,早在群雄进行人工智能的资本大规模混战之前的2013年初,谷歌孤零零地收购了一个叫DNNresearch的公司。细查一下它的底细,发现虽然这是一家只有3个人的公司,但是公司创始人却是一个叫杰佛里・辛顿(Geoffrey Hinton)的人。所有人工智能的江湖中人看到这个名字后都会为之一震,接下来会很信服地说:“谷歌真会买。这个生意做得值了。”辛顿是谁?他有什么故事?人工智能的技术江湖还有哪些大佬?我们就在这里说一说这个江湖吧。

江湖风起,祖师下山

说起这个江湖,最初应该提起的不是计算科学领域的学者,而是一位人们耳熟能详的哲学家和文学家:伯特兰・罗素(Bertrand Russell)。这位奇人活了近100岁,创建了逻辑分析哲学,同时在哲学的多个领域作出了卓越的贡献。1950年,他还获得了诺贝尔文学奖。那他跟人工智能有什么关系呢?很少有人知道,他还是一位数学家。他提出了罗素悖论,把逻辑分析和数学建立联系。1910年他发表了《数学原理》,对于20世纪的数学基础产生了巨大的影响。为什么要提罗素呢?因为下面提到的几位人工智能领域的祖师爷级的人物,都和这位“达摩老祖”有紧密的关系。

首先出场的是神一样的祖师:阿兰・图灵(Alan Turing),现代人工智能的思想来自于这位著名的科学家。这位大师一出场就是天才级选手,在剑桥学习的时候,他读到了罗素的《数理哲学导论》,开始了自己在逻辑学和数学结合领域的研究。1935年,年仅23岁的图灵就当选了剑桥大学国王学院院士。

在剑桥期间,图灵成为罗素最器重的研究员之一。除了图灵机以外,图灵的另一项伟大的贡献就是提出了著名的图灵测试。在他1950年的论文《计算机器和智能》(Computing Machinery and Intelligence)中,他首先提出问题:“机器能思考么?”同时,他提出判定机器是否具有智能的试验方法。在这项测试中,如果具备人工智能的设备能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则可以认为这个设备可以通过测试,也就是具备人工智能。

图灵测试在那之后的60多年里一直作为人工智能领域中标杆性的判定标准,也一直在这个领域是一座不可逾越的大山。直到2014年,才有智能设备首次通过图灵测试。为了纪念这位伟大的科学家,专门设立了图灵奖以表彰在计算科学领域的杰出贡献者。这被认为是计算机界的诺贝尔奖。

第二位出场的天才级祖师:诺伯特・维纳(Norbert Wiener)。维纳的老爸也是哈佛教授,很小的时候就带维纳拜访了罗素。在剑桥大学学习的时候,他就是罗素老祖的学生,18岁取得博士学位。了解维纳的人都知道,他是现代控制理论的奠基人。与此同时,他还为人工智能理论作出了卓越的贡献。维纳认为计算机是一个进行信息处理和信息转换的系统,只要这个系统能得到数据,就应该能做几乎任何事情。他从控制论出发,特别强调反馈的作用,认为所有的智能活动都是反馈机制的结果,而反馈机制是可以用机器模拟的。维纳的理论抓住了人工智能核心――反馈,因此可以被视为人工智能行为主义学派的奠基人,其对人工神经网络的研究也影响深远。此外,维纳靠控制论名声大噪的时候,得到了大笔的经费,邀请了一大批优秀的科学家在他的实验室工作,这里面就包括下面这位祖师。

第三位出场的大师颇有些令狐冲式的经历。沃尔特・皮茨(Walter Pitts)出身穷苦人家,连学都上不起。然而,天才级选手才不会受家贫的影响。他初中时读了罗素的《数学原理》,然后就给罗素写信。要知道,那时候罗素已经是著名的大哲学家了。看到他的见解,罗素还曾邀请12岁的皮茨同学去剑桥,可惜被皮茨的文盲父母粗暴地拒绝了。之后,上不起学的皮茨听说罗素在芝加哥大学任教,就只身跑到那里,被安排了一个打扫卫生的工作。

他这里碰到了神经医学教授沃伦・麦克洛奇(Warren McCulloch)。两位一拍即合,共同展开了计算神经网络的研究,并在1943年发表了神经网络的奠基之作(A Logical Calculus of Ideas Immanent in Nervous Activity),开人工智能的一个流派之先河。这一年,皮茨只有20岁,主要职业仍然是扫厕所。也是在这一年,他去了波士顿,结识了上面提到的控制论之父维纳。据说他在第一见维纳的时候,在这位学霸级教授面前推了一黑板公式,就被破格录取这位只有初中毕业证的大学旁听生兼清洁工为MIT的博士。这位祖师不仅仅是神经网络的奠基人,还精通多国语言,在植物学、化学、鸟类学、解剖学和物理等多个领域都有着大师级的贡献。

人工智能早期的故事说到这里,这个江湖还算清净。几位祖师爷分别在哲学、数学、逻辑学、认知心理学等多个方面为人工智能打开了大门。更为重要的是,这些祖师爷都曾是教书先生和研究学者,为这个领域培养出一大批高手,这些人在今后的江湖混战中各显神通。

华山论剑,1956

1956年,人工智能领域的一次史诗级的“华山论剑”在达特茅斯学院举行。在这次会议上,一个里程碑性的进展就是在学术界创立了人工智能方向,AI(Artificial Intelligence)就此诞生了!

关于这次会议的参加人数,一直都是个谜。有人说是只有11个人,有人说有20人之多。不管有多少人参加,这个阵容可以说是现代计算科学领域阵容最豪华的一次会议了。可以大致把他们分为三个类别:

神经网络学派:约翰・麦卡锡,马文・明斯基,沃伦・麦克洛奇。

符号学派:赫伯特・西蒙(也称司马贺),艾伦・纽厄尔。

其余道骨仙风酱油派:香农、所罗门诺夫、塞弗里奇、撒缪尔等人。

人工智能从一诞生起就分为两派。神经网络学派也被称为联结主义学派,其主要思想来自于对于人脑微结构的模拟,是一种自顶向下方法,颇似金庸笔下华山派的“剑宗”。而符号主义的主要思想是应用逻辑推演法则,主张从各个基本的“符号”出发,沿着严密的代数推理过程,让机器能得出与人的理解相同的结论。这是一种自下向上的方法,重视积累和逻辑,有点像金庸笔下华山派的“气宗”。

在一开始的人工智能界,大家公认的“名门正派”应该是“剑宗”这一派。连“人工智能”这个词汇都是这一派的创始人约翰・麦卡锡(John McCarthy)最早提出的。这位高手虽然算不上天才级选手,但是由于资格老且活的长,确实也做出了非凡的贡献。首先,他发明了人工智能界第一个广泛流行的高级语言LISP,在很长一段时间里垄断着人工智能领域的应用;他也是分时技术的发明人,使得计算机第一次能同时允许数十甚至上百用户使用。同时,他与明斯基一起创建了MIT的人工智能实验室,他自己后来又跑到斯坦福大学协助建立那里的人工智能实验室。为了表彰他在AI领域的杰出贡献,麦卡锡于1971年获得图灵奖。

另一位“剑宗”的掌门人马文・明斯基(Marvin Minsky)也是高手中的高手。早在1951年,他就设计开发了世界上第一台能够自我学习的人工神经网络学习机(SNARC),一举奠定了其在神经网络领域的创始人的地位。他创建了MIT的人工智能实验室,并为之付出了毕生的心血。除了人工智能方面的贡献外,他还发明了共聚焦显微镜(如今在生物医学领域发挥着重要的作用)以及头戴式显示器(后来逐步发展为现在的头戴VR装置)。1969年,明斯基获得图灵奖。这位高手还有个过人之处,就是一直活到了2016年。到后来,大家办点儿有影响力的人工智能的活动,都会请这位“剑宗”掌门。所以,他的名气是这个领域里最大的。

“气宗”的掌门赫伯特・西蒙(Herbert Simon)也是一位天才级高手,他一共有九个顶级大学的博士学位,一生在计算科学、认知心理学、公共行政、经济学、管理学和科学哲学等多个领域都有着卓越的贡献。他获得了1975年的图灵奖、1978年的诺贝尔经济学奖、1986年的美国国家科学奖章和1993年美国心理学会的终身成就奖。这样一位大家还是个出色的政治家,在上世纪七十年代为中美建交做出了很大的贡献。因此,他还有一个中文名字叫司马贺。1994年,他当选为中国科学院最早的外籍院士。

司马贺的搭档艾伦・纽厄尔(Allen Newell)也是这个领域响当当的人物,他们共同创建了卡耐基梅隆大学的人工智能实验室。他发明了IPL语言,是麦卡锡的LISP语言的基础之一。纽厄尔在1975年与司马贺一同获得了图灵奖。

除了两派的掌门人外,其他来打酱油的人也都是大师级人物。信息论的创始人香农当时已经是贝尔实验室的老大之一。如今,那条难以逾越的“香农极限”仍然是折磨现代通信界的一道梦魇。塞弗里奇则是模式识别的开创者。还有“归纳推理机”的发明者所罗门诺夫。其他人的背景就不一一赘述了。

“剑宗”的掌门把这些“绝顶高手”凑在一起,本来是要大家在一起闭门练功两个月,设计出第一个人工智能机器,从而开创一个学科。然而,“气宗”的老大们并不买帐,呆了一个星期就闪人了。这也为后来两派之间的“混战”埋下了伏笔。不过在会上,还是明确提出了人工智能的目标:学习或者智能的任何其他特性的每一个方面都应能被精确地加以描述,使得机器可以对其进行模拟。在这之后迎来了人工智能领域的第一个春天,达特茅斯会议上的与会者成为这一时期人工智能研究的主要贡献者。在这一时期,很多该领域的奠基之作被完成,也开辟了很多经典的研究方向。

“剑”“气”恩怨几多年

其实,“剑宗”和“气宗”的较量,从人工智能诞生的时候就已经开始了。事实上,“剑宗”的老大们在组织达特茅斯会议的时候,本来是想请一群大佬来,一起做两个月的“封闭开发”,最终见证自己的划时代贡献的。然而会议一开始,司马贺和纽厄尔这两个同门不同宗的外人却做了个让人刮目相看的报告,并公布了一款程序“逻辑理论家”(Logic Theorist)。这个程序可不简单,在那个“史前时代”,可以证明祖师爷罗素的《数学原理》中命题逻辑部分的一个很大子集,当场引起了大家的关注。

“气宗”的两位老大也够有个性,在那里只呆了一周,扫了个场子,赚足了眼球,也砸了“剑宗”的台子,扬长而去。据说此后的很多年里,MIT的人工智能教授和卡耐基梅隆的人工智能教授一直没法坐在一张桌子上,他们之间的交流只能通过研究生在私下进行。直到后来,各个大学的学生开始到对方大学当教授,这种门户偏见才慢慢消除。由此可见,科学家也不是圣人,也会为结下的梁子耿耿于怀很久很久。

其实当时“气宗”瞧不起“剑宗”也不无道理。毕竟,司马贺和纽厄尔有拿得出手的“逻辑理论家”。卡耐基梅隆大学一直有脚踏实地的传统,在这个时候显示出很大的威力。多年之后,“剑宗”创始人明斯基也不得不承认,“逻辑理论家”是第一个也是当时唯一一个可以工作的AI程序。而当时的“剑宗”还只是空谈,本来寄希望达特茅斯会议能够开天辟地,跑马圈地,创立自己当家的AI学科,还是被“气宗”两位老大搅了局。纽厄尔打心底里看不上明斯基,认为他除了“拉大旗作虎皮和稀泥”以外,没什么真本事,而且人也太刁滑了。在纽厄尔晚年,只说是香农邀请他参加这些会议的,对明斯基和麦卡锡只字不提,可见门户偏见有多深。

“剑宗”的劣势很快就有了改观,这要归功于一位来自康奈尔大学的心理学家:弗兰克・罗森布利特(Frank Rosenblatt)。这位神人是个实验心理学家,在尝试用IBM的计算机来模拟他在认知心理学上的发现的过程中,发明了一个名为“感知机”(Perceptron)的神经网络模型。这一下引起了不小的轰动,感知机证明了单层神经网络在处理线性可分的模式识别问题时,其实是可以收敛的。以此为基础,罗森布利特做了若干感知机有学习能力的实验。

感知机本来是可以让“剑宗”翻身的发明,然而“剑宗”的掌门人明斯基却并不买帐。因为,这位外来户的风头太盛了,甚至盖过了明斯基这位AI的创始人。当时,罗森布利特拿到了国防部和海军的大把经费,不可避免地动了MIT的蛋糕。媒体也对这位AI新贵大加赞赏,各大报纸头版头条都是他的新闻。罗森布利特本人也确实没把其他“剑宗”的人放在眼里,或者说他根本就不觉得自己要加入组织的。这可让明斯基这一派人马恼怒不已,他们开始了自己的反击。明斯基毕竟还是AI领域的学霸,想要踩死这个不知天高地厚的“异类”似乎易如反掌。他们动用自己的一切力量去否定感知机,明斯基甚至在自己的书中明确地说:罗森布利特的论文大多没有科学价值。很难相信这是一位科学界泰斗可以说出的话。罗森布利特毕竟不是这个圈子的人,在“剑宗”学霸明斯基的面前,还是显得势单力薄了很多,最终离奇地意外死亡。

可笑的是,明斯基本人也曾是神经网络的最大的拥护者,他的博士论文的主题就是神经网络,他最早的发明SNARC也是一台神经网络学习机。那时候,他却为了斗倒罗森布利特,连神经网络也一并打入深渊。后来,明斯基肯定也意识到自己的做法前后矛盾,想方设法摆脱与神经网络的干系。后来,他曾经接受采访说:他的博士论文从来没发表过,大概只印了三本,他自己也记不清内容了。看样子他是想极力开脱自己和神经网络学科的关系。

“剑宗”有了这样的掌门,在竞争中处于弱势肯定是不可避免了,而且这一弱就是几十年。后来很多学者称这一段时间为“二十年”。直到近十年神经网络“重出江湖”,才给罗森布利特,学者们也认为明斯基这样打压科学家的做法是不可原谅的。为了纪念罗森布利特,IEEE(美国电气电子工程师协会)在2004年设立了罗森布利特奖,以表彰神经网络领域的杰出科学家。2014年,这个奖项得主就是后来一统江湖的“剑宗”大师:杰佛里・辛顿。

“剑宗”暂时一统江湖

时间来到了20世纪70年代,人工智能领域碰到了第一个低潮期。由于长时间没有可实用的研究成果出来(或者说第一批先驱有些低估了这个领域的难度),主要资助方们渐渐失去了信心,甚至有些人认为人工智能就是个永远没法用的“玩具”。明斯基们给人工智能开了一个很高的调子,然而在很长一段时间里在搞派系斗争,却拿不出可以实用的成果。在这之后的几十年里,人工智能几经沉浮,有过短暂的繁荣,又经历过两次低潮期,最终迎来了真正的爆发期。

事实上,在神经网络的“”时代,还是有不少人为这个领域做出了有益的贡献。很可惜,科学家也是人,他们也需要经费来养家,养学生,养实验室。因此,当无数人给神经网络流派判“死刑”的时候,很多人都半途放弃了。有意思的是,神经网络其实是信息科学和神经科学相结合的学科。在众多科学家在斗争中从信息科学被“赶出来”之后,一些坚持这方面研究的人就把发力点放在了神经科学方面。他们当中的佼佼者就是哈佛大学的神经生物学家胡贝尔和威瑟尔。他们的研究虽然是围绕视网膜和视皮层展开的,使用的却是信息处理的方法。他们因此获得了1981年的诺贝尔医学奖。

当所有人对于人工智能失去信心的时候,还有这样一位“剑宗”大师,他一直在这个领域坚持了三十多年。让我们记住这个人的名字:杰佛里・辛顿(Geoffrey Hinton)。

这是一个在人工智能领域中“风清扬”式的人物。在几乎所有人都认为神经网络这个流派已经走到尽头的时候,他却一直在坚持!完全超乎偏执地坚持!经费的短缺,使之不得不辗转于多个大学,寻找落脚的地方。那时候他已经50多岁了,搞了三十多年被认为没有任何前途的研究,四处求爷爷告奶奶,希望能要来点儿研究经费。

关于辛顿和他的战友们,业界还流传着这样的故事。在2003年,以辛顿为首的十五名来自世界各地的神经网络研究者们齐聚温哥华,他们的主要目的是向加拿大先进研究院(Canadan Institue oF Advanced Research,简称 CIFAR)的基金申请经费。当时该基金的管理负责人Melvin Silverman问他们说:为什么CIFAR要支持他们的研究项目。

他们回答道:“因为我们有一些古怪。如果CIFAR可以跳出自己的舒适区(comfort zone),试图寻求一个高风险,极具探索性的领域及团队,就应当资助我们!”

最终,CIFAR同意从2004年起资助这个团队十年,经费总额为一千万加元。这些预算对于某些学霸来说真的不算什么。但是,对于已经山穷水尽的辛顿及其神经网络研究团队来说却是弥足珍贵的。CIFAR成为当时世界上唯一支持神经网络研究的机构。毫不夸张地说,如果没有CIFAR的资金支持,整个人工智能领域还可能在黑暗中继续挣扎。

拿到资金后,辛顿把神经网络这个流派改了一个名字,这就是后来威名远扬的深度学习(Deep Learning)。前面说的AlphaGo就是在这个基础上进行训练,积极“学习”围棋知识,最终战胜了李世石。

九十年代末,神经网络研究遇到的困境之一就是计算的瓶颈。那时候,人们提起神经网络的第一反应就是慢。深度学习也有同样的瓶颈, 需要的计算资源太多。当大量的数据在复杂的网络中进行训练的时候,真是让人“等得花儿已谢了”。当时有人调侃“剑宗”的研究试验流程是:一年做一次,一次做一年。

2009年六月,斯坦福大学的华裔科学家吴恩达(Andrew Ng,现百度首席科学家)博士与别人合作:“用 GPU 大规模无监督深度学习”。论文模型里的参数总数(即各层不同神经元之间链接的总数)已经达到一亿,与之相比,辛顿在2006年的论文里用到的参数数目只有一百七十万。论文结果显示,使用GPU运行速度和用传统双核CPU相比, 最快时要快近七十倍。在一个四层,一亿个参数的深信度网络上,使用GPU把程序运行时间从几周降到一天。后来,吴博士在谷歌的X实验室中,建造了当时最大的深度神经网络,支持17亿个神经元。他随后在斯坦福大学又造了一个超大号的神经网络,有112亿个神经元之多。

至此,全世界掀起了深度学习的研究和产业化狂潮。在各个领域里,最新的人工智能纪录不断被刷新。谷歌将语言识别的准确度从2012年的84%提升到现如今的98%以上。经过谷歌、微软、香港中文大学等多家研究机构的努力,图像识别领域中的标杆工程――人脸识别的精度已经超过了99%。要知道,人类对于自然图像序列的识别准确度也只有98%。再后来,就有了AlphaGo的故事,神经网络的黄金时代正式到来,“剑宗”暂时一统江湖。

上一篇:万里挑一聪明的孩子没饭吃 下一篇:拼凑出一个人有多难?