博弈论理论体系及其应用发展述评

时间:2022-10-29 12:34:08

博弈论理论体系及其应用发展述评

中图分类号:F270 文献标识码:A

内容摘要:本文在梳理经典博弈论理论体系及其应用领域的基础上,对其发展趋势进行了展望。分析显示:经典博弈理论按其发展的脉络来划分,主要包括静态博弈、动态博弈、完全信息博弈和不对称信息博弈等几大理论体系;其应用领域主要涉及管理学中的激励问题,信息经济学中的信息甄别、信号传递和社会学中“合作与冲突”这一古老而又永恒的主题;其发展方向表现为扬弃“理性假设”条件下的行为博弈。

关键词:纳什均衡 信息经济学 激励理论 行为博弈

经典博弈理论体系

博弈论又称对策论,英文名称是Game Theory,是研究一些个人,一些团队或组织面对特定的环境条件,在一定的规则制约下,依靠所拥有的信息,同时或先后,一次或多次,从各自允许选择的策略进行选择并加以行动,并从中各自取得相应结果或支付的过程的理论。博弈论的主要研究目的是研究博弈各方的行为特征,即各决策主体行为发生直接的相互作用时的决策特征;以及何种情况下采取哪种策略,会达到什么样的结果即决策主体决策后的均衡问题。

博弈思想可以追溯到我国古代“田忌赛马”的故事,但一般认为,1944年冯•诺依曼和奥斯卡•摩根斯坦恩合著的《博弈论和经济行为》形成了现代博弈论的基本分析框架,标志着系统的博弈论初步形成。上世纪50年代,数学天才纳什明确提出“纳什均衡”这一概念,使经济学中的均衡问题发生了质变(从“瓦尔拉斯均衡”突破到“纳什均衡”)。“纳什均衡”的提出抓住了问题研究的关键,为博弈论的应用和发展奠定了坚实基础。“纳什均衡”描述的是行动双方的均衡问题,即“如果一个博弈存在一个战略组合,任何参与人要改变这一战略组合都可能导致降低自身的效用水平(或只能保持原有的效用水平),因而任何参与人都没有积极性去改变这一战略组合,这一战略组合称为该博弈的纳什均衡。

“纳什均衡”实现了合作博弈向非合作博弈的转化,但纳什均衡是“基于一个时期的模式”而非“动态模式”,纳什均衡没有考虑自己的选择行为如何影响博弈对手的战略,且允许不可置信威胁战略的存在,经常遇到一个博弈中存在多个纳什均衡,难于预见哪个均衡会发生等问题。为了弥补纳什均衡的上述缺陷,泽尔腾发展了动态的博弈。泽尔腾动态博弈模型思想集中体现在他1965年发表的著名论文《一个具有需求惯性的寡头博弈模型》一文之中,在该文中泽尔腾对“子博弈精练纳什均衡”给出了正式的定义。其基本思想是:“在扩展型博弈中的任一决策点,现行局中人利用其先行优势及后行者必然做出理性的反应这一事实,来进行选择以达到最优的纳什均衡,有限完美信息动态博弈求解可采取倒推归纳法”。泽尔滕定义“子博弈精炼纳什均衡”的中心意义是将纳什均衡中包含的不可置信威胁战略剔出出去,使均衡战略不再包含不可置信的威胁战略。它要求参与人的决策在任何时点上都是最优的,决策者要随机应变,向前看而不是固守旧略。由于剔出了不可置信的威胁战略,在多数情况下,精炼纳什均衡也缩小了纳什均衡的个数,这也是子博弈精炼纳什均衡的优点所在。

纳什均衡严格依赖于现实博弈环境难于满足的“完全信息”假设,即“所有博弈参与人均知道博弈的结构、博弈的规则和支付函数”,针对纳什均衡中“完全信息”假设的缺点,哈萨尼建立了不完全信息博弈模型,拓展了纳什分析的应用范围。哈萨尼的不完全信息博弈是在纳什均衡的基础上吸收了贝叶斯研究成果,以贝叶斯定理为出发点,对纳什均衡作了广泛拓展。哈萨尼在其论文《贝叶斯参与人完成的不完全信息博弈》中提出了不完全信息博弈模型,还证明如何把不完全信息博弈模型转化为完全但非完美信息博弈模型,使得博弈模型易于处理,为信息经济学的发展奠定了理论基础。哈萨尼提出的“贝叶斯-纳什均衡”是指在静态不完全信息博弈中,参与人同时行动,没有机会观察到别人的选择;由于每个参与人按照贝叶斯原则仅知道其他参与人类型的概率分布而不知道其真实类型,且不可能准确地知道其他参与人实际上会选择什么战略;但是能准确地预测到其他参与人的选择是如何依赖于其各自的类型;因此参与人决策的目标就是在给定自己的类型和别人的类型依从战略的情况下,最大化自己的期望效用。即“给定自己类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性去选择其他战略组合”。而应用于不完全信息动态博弈的均衡的概念是“精炼贝叶斯均衡”,这个概念是完全信息动态博弈的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合,泽尔腾、克瑞普斯和威尔逊及弗登伯格和泰勒等学者为此做出了重要贡献。精炼贝叶斯纳什均衡的要点在于当事人要根据所观察到的他人的行为按照贝叶斯原则来修正自己有关后者类型的主观概率,并由此选择自己的行动。也就是说精炼贝叶斯纳什均衡是一个数学上的“不动点”。即满足:给定每个关于其他参与人类型的主观概率的情况下,参与人的战略选择是最优的;每个参与人有关其他参与人类型的主观概率均是按照贝叶斯法则从所观察到的行动中获得的。不完全信息博弈运用现代随机分析方法解决信息不完全或不对称下的决策问题,由此发展起来的不完全信息动态博弈模型使博弈论的理论研究与实际应用更加紧密。

博弈论的主要应用

就博弈论发展而衍生的信息经济学而言,除哈萨尼所做的开创性工作之外,维克里和莫里斯也对不对称信息条件下的激励理论做出了重要性贡献。维克里上世纪40年代关于个人所得税税制问题的思考:“收入均等化并不能解决理想税赋结构难题”,因为这一方案没有给个人努力工作提供激励,因而不会产生社会效率最大化。莫里斯通过设计递减税率回答了维克里的税制难题,并致力于信息不对称条件下隐藏行动理论方面的研究。莫里斯上世纪70年代的系列研究成果奠定了委托-理论模型框架,并确立了激励相融契约必需满足的两个约束前提。其一是参与约束:委托人所选的效用函数必须使人因接受合约而获得的效用不小于因拒绝合约而获得的效用;其二是激励相融约束:合约缔结后人在所选行动上的边际收益等于边际成本。

1970年,著名经济学家阿克洛夫在《经济学季刊》上刊发了具有划时代意义论文《柠檬市场:质量不确定性和市场机制》,该文研究了一种商品市场,其中出售者对商品质量的了解比购买者要多,并以二手车市场为例进行说明。由于文章阐述了一个简单而又深奥的普遍化思想,并因得到应用广泛而产生重大影响。阿克洛夫在该文中对具有逆向选择这一信息问题的市场进行开创性分析,指出信息不对称问题可能导致该市场崩溃,或者只有劣等产品充斥其中。“柠檬论文”解释了信息不对称导致的市场低效率,同时该文的另一个独到见解是经济主体有强烈的激励去抵消信息不对称问题对市场效率的不利影响。

继阿克洛夫之后,斯彭斯着重研究如何改善信息不对称以提高市场效率问题,即信号传递模型。信号传递模型描述的是信息富有的一方如何可靠地将信息传递给信息缺乏的一方,以减少双方之间信息不对称、促进交易的达成、提高市场效率。斯彭斯以劳动力市场为例,研究得出只有当信息富有者的传递路径产生的费用绝对高于其它传递途径产生的费用时,该信息富有者的信息传递才具有效率。该模型很好地解释了商标、广告、教育文凭等信息传递问题。为减少信息不对称,提高市场效率,提供操作上的理论依据。

在斯彭斯之后,运用博弈论来研究信息不对称市场的另一位集大成者乃诺贝尔经济学奖得主,信息经济学的集大成者斯蒂格利茨。斯蒂格利茨在1974年之后发表的一系列论文中,构建了以不完全信息和不完备市场为前提的新模型,描述了信息不对称条件下市场运行机制的变化。他通过对保险市场、农业土地租赁市场、信贷市场和劳动力市场的考察,证明了信息不完全和信息不对称的普遍性,说明在这样的市场中,传统的价格机制实现帕累托效率的有效性值得怀疑,从而对以彻底的私有化和市场化为导向的改革模式(即“华盛顿共识”)提出了质疑。其中,1981年斯蒂格利茨和温斯合作发表的文章《信息不对称市场的信贷配给》堪称当代信贷文献的典范,该文详细论述了信贷过程中不同阶段银行面临的各种风险。该文创立的逆向选择模型与道德风险模型对分析金融问题具有划时代意义。

继博弈论在经济学领域取得巨大成功之后,以以色列博弈论专家奥曼与美国国防经济学者谢林为代表的博弈论推崇者则努力运用博弈论来解决“合作与冲突”这一古老而又永恒的社会问题,使博弈论由经济领域拓展到社会领域。奥曼与谢林分别从数学和经济学的角度重塑了关于人类交互作用的博弈分析范式。谢林从非合作博弈的角度加深了人们对社会交互作用机理的理解,而奥曼则发现一些长期的社会交互作用可以运用正式的非合作博弈理论来进行深入分析。

博弈论发展趋势

博弈论以决策者之间的相互影响为主要决策因变量导致经济学从“瓦尔拉斯均衡”突破到“纳什均衡”的质变,经典博弈论从静态博弈到动态博弈,信息完全到信息不对称博弈均是在放松理论假设的前提下使博弈理论分析与经济社会现实更加接近,以增强其实用性和对经济社会现象的解释能力。经典博弈理论作为经典经济学的分析工具,其共同秉承的“理性人”假设、不可观测的效用函数假设和主观概率假设是经典博弈论的主要局限,上述假设的存在使经典博弈被戏称为“研究‘天才’决策的理论”,现实经济社会中也出现过很多经典博弈理论无法解释的异象。随着行为经济学的兴起并得到社会的认同,基于理性人假设的经典博弈理论自然而然遭受到行为学派的挑战,考虑参与者“有限理性”、“情感”、“环境”、“经验”、“制度文化”等现实因素的行为博弈论成为近年来博弈论的发展方向。

与经典博弈理论比较,行为博弈论的最大特点是考虑了人类的非理性因素,其研究目的是研究博弈参与人实际做出了什么行动,可以说行为博弈论是实验经济学与行为经济学的一个分支。行为博弈论近年来在“囚徒困境”模型重释、投资博弈模型、可置信威慑的议价博弈模型、大陆分水岭协调博弈模型及选美比赛博弈模型等方面取得了重要进展,很好地解释了经典博弈论无法解释的一些现象。但行为博弈同样面临“有限理性”中“有限”度的量化,“经验”因素中参与者的“学习”问题以及“学习”如何及何时影响博弈均衡结果等问题。上述问题的存在形成了行为博弈未来的主要研究方向:一是学习过程中的自利行为和利他行为怎样导致社会偏好的变化;二是在重复博弈中,随机最优反应函数的地位如何,参与者关于博弈对手和环境的信息信念如何变化;三是组织、团队乃至企业的博弈行为将在何等程度上与个体博弈存在差异,引发该差异的机制是什么,社会认知空间的变化对博弈行为有何影响等等。

结论

值得一提的是经济领域的至高荣誉诺贝尔经济学奖特别偏爱博弈论领域的集大成者。瑞典皇家科学院诺贝尔奖委员会分别于1994年、1996年、2001年和2005年将诺贝尔经济学奖授予经典博弈论的杰出贡献者纳什、泽尔腾与哈萨尼,博弈理论的实践人、激励理论创立者维克里和莫里斯,博弈论衍生的信息经济学的奠基人及集大成者阿克罗夫、斯彭斯与斯蒂格利茨,博弈论应用领域的拓展者以色列数学家奥曼和美国国防经济专家谢林;以表彰他们在博弈论领域的卓越贡献。博弈论领域的多次获奖彰显博弈论对现代经济理论特别是市场交易理论的突出贡献。

参考文献:

1.张维迎.博弈论与信息经济学[M].上海人民出版社,2004

2.斯蒂格利茨,沃因,韦坎德.契约经济学.经济科学出版社,1999

3.John Chahes Harsanyi. Games with Incomplete Information Played by Bayesian Players Parts I, II and III. Management Science, 1967

4.John von Neumann and Oskar Morgenstern. The Theory of Games and Economic Behavior. Princeton: Princeton Universty Press.1944

5.Akerlof, G. The market for lemons: quality uncertainty and the market mechanism. Quarterly Journal of Economics. 1970

6.The Royal Swedish Academy of Sciences, Advanced Information on the Bank of Sweden Prize in Economic Science in Memory of Alfred Nobel , 2001, www.nobel .se

上一篇:基于集成驱动的产学知识共享动力模型研究 下一篇:我国现行税制存在的主要问题及改革建议