由“人机围棋大战”引发关于深度学习的思考

时间:2022-09-26 12:38:05

【前言】由“人机围棋大战”引发关于深度学习的思考由文秘帮小编整理而成,但愿对你的学习工作带来帮助。2.深度学习的发展 深度学习发展至今,不得不提一下它的发展历史,首先要说的就是神经网络的发展。众所周知,人类每时每刻都要处理大量数据,却总能以灵巧的方式提取值得注意的数据特征,并通过复杂的大脑对之进行处理。模仿人脑高效准确地表示信息是人类从很久很久以...

由“人机围棋大战”引发关于深度学习的思考

摘要:备受关注的谷歌AlphaGo和韩国棋手李世石的"人机围棋大战",最终以4:1的总比分告一段落。关于Alphago的讨论热潮此起彼伏,一个陌生的名词现如今成了大街小巷最热议的话题--深度学习。本文从深度学习的概念、发展和未来走近深度学习,并结合Alphago的技术对深度学习的具体内容有些许涉猎。

关键词:人机围棋大战,深度学习,人工智能,神经网络

1.深度学习的概念

讲到深度学习,不得不和大家所熟知的几个名词做一比较,例如人工智能和神经网络。其实,它们是相互包含的关系,人工智能英文名为Artificial Intelligence,即大家所谓的AI,它包含了语言的学习与处理,知识表现,智能搜索,推理,规划,机器学习,神经网络,遗传算法等多个领域,神经网络再进行分支,机器学习是其中一项,它是人工智能的核心,而所谓的深度学习就是机器学习中比较高端的技术了。也是近年来值得科学界和工程界注意的新兴技术之一。

用学术的语言来说,深度学习结构就是含多隐层的多感知器,深度学习通过低层特征形成更加抽象的高层表示。

2.深度学习的发展

深度学习发展至今,不得不提一下它的发展历史,首先要说的就是神经网络的发展。众所周知,人类每时每刻都要处理大量数据,却总能以灵巧的方式提取值得注意的数据特征,并通过复杂的大脑对之进行处理。模仿人脑高效准确地表示信息是人类从很久很久以前就梦寐以求的技术。

神经科学家经过研究发现哺乳动物大脑表示信息的方式:通过感官信号从视网膜传递到前额大脑皮质的时间推断出大脑皮质并未直接对数据进行特征提取和处理,而是根据分解和处理后的信息来识别物体。因此视皮层的功能是对信号进行信息特征提取和计算,而不仅仅是重建视网膜的影像。受大脑结构分层处理信息的启示,神经网络科研人员一直致力于多层神经网络的研究,经典的BP算法是解决多层神经网络的重要方法。但是该方法有一个严重的缺陷:由于误差存在,结果总是趋近于局部最小,随着网络层次提高,该误差会逐渐增大。因此BP算法仅仅对于较浅层的神经网络才能够做到令人满意的结果。为了更有效地解决多层神经网络,深度学习的方法呼之欲出。

2006年,加拿大多伦多教授,机器学习领域泰斗Hinton和他的学生在《Science》上发表了一篇文章,开启了深度学习的热潮。自此,深度学习领域的研究和应用层出不穷,在语音识别、图像识别,甚至制药界的发展都起到了极大的促进作用。近日,谷歌公司推出的Alphago更是深度学习的直接应用的典型。

3.Alphago所采用的关键技术:走棋网络、估值网络

回到Alphago的获胜话题上来,我们不禁怀疑起来:为什么一个机器人通过短短数年的时间可以打败当今围棋界的顶尖选手呢?那就让我们深入地了解一下Alphago的关键技术。

Alphago采用了两个神经网络:走棋网络和估值网络。走棋网络的目的是为了减少搜索的广度,做法是对于当前的棋盘状态,我们对下一步乃至下几步的走法,我们只考虑获胜可能性较大的走法,而不需要考虑获胜概率更差的走法,也不一定取得获胜概率最高的走法。剩下的问题就是如何得到可能的走棋的获胜概率,这就要用到深度学习了:通过已知的棋谱进行监督训练。为了防止相似性过高,同一个棋谱只挑选有限的几步进行训练,让机器记住较优的若干步走法,在实战中只需要走棋后对棋谱进行检测,选取胜率较高的一步走棋方案即可。

估计网络的话,就更容易理解了。对于一个静态棋盘,对黑子、白字、空白棋盘上的每个点进行赋值,比如分别赋值为1,-1,0。然后通过深度学习的方法得到该状态的胜率。具体过程与走棋网络的训练过程很相似,也是输入庞大的棋谱库,然后分析得到常见状态的胜率。在真正对战时,如果当前棋盘状态机器已经记录下来,我们就可以得到该状态的胜率,从而判断下一步该如何进行移动。

4.深度学习的未来

在赛前,围棋界的高手们都纷纷预测,李世石将会以大比分战胜Alphago,中国创新工场总裁李开复也认为,此次比赛李世石应该可以胜出,但是他也从理性的角度分析:人工智能最终会超越人类的左脑,成为新一代的顶尖智能代表。这也是人工智能能够预见到的未来。深度学习作为神经网络的重要方法,它的前景也不可估量。不过同样的,深度学习也存在着一些瓶颈需要我们去突破。

从理论的角度来说,我们对深度学习的理论样本复杂度是不确定的,也就是说,我们并不知道要输入多少样本进行训练,机器才能学到我们所期望的程度。从建模的角度,我们是否还需要更加优化的分层来加快深度学习的进度?从工程的角度,对于大量的数据计算,我们是否能够在更短的时间内得到结果?诸如此类的问题还有很多,那也就意味着深度学习还有更宽广的道路需要我们去开拓,如果这些问题都能逐一解决的话,人工智能的发展水平又能上升到一个新的台阶,电影中所描述的人与机器人共存的和谐画面将尽在眼前。

参考文献

[1]《Draft:Deep Learning in Neural Networks:An Overview》 by Jurgen Schmidhuber

[2]《A Deep Learning Tutorial:From Perceptrons to Deep Networks》 by Ivan Vasilev

[3]《Deep Learning for Natural Language Processing and Related Applications》 by Xiaodong He,Jianfeng Gao,and Li Deng

[4]《A Gentle Introduction to Scikit-Learn:A Python Machine Learning Library》 by Jason Brownlee

上一篇:车道偏离报警系统项目产品的开发、生产策略 下一篇:轧钢系统中影响浊环水水质的主要因素分析及解...