博弈论定义范文

时间：2023-10-19 21:16:52

博弈论定义篇1

关键词：博弈论；纳什均衡

一、引言

博弈论（张维迎，1996）是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，博弈论故此又称对策论。

谢识予教授认为，博弈即一些个人、对组织或者其他组织，面对一定的环境条件，在一定的规则下，同时或者先后，一次或多次，从各自允许选择的行为和策略中进行选择并加以实施，各自取得相应结果的过程。

二、博弈论的发展

一般认为，博弈论始于1944年冯·诺依曼和摩根斯坦恩合作的《博弈论和经济行为》一书的出版，这是第一次系统的将博弈论引入经济学。

到20世纪50年代，合作博弈发展到鼎盛期，同时非合作博弈也开始创立。纳什和夏普里分别于1950年和1953年提出的“讨价还价”模型，吉利斯和夏普里与1953年提出的关于合作博弈中“核”的概念以及其他一些人的贡献。纳什在1950年和1951年发表了两篇关于非合作博弈的重要文章，塔克于1950年定义了“囚徒困境”。他们两个人的著作基本上奠定了现代非合作博弈论的基石。

到20世纪60年代，泽尔腾第一次纳什均衡的概念引入了动态分析，提出了纳什均衡的第一个重要改进概念“子博弈精炼纳什均衡”和相应的求解方法“逆向归纳法”。海萨尼首次把不完全信息引入博弈分析，定义了“不完全信息静态博弈”的基本均衡概念“贝叶斯-纳什均衡”，构建了不完全信息静态博弈的基本理论。之后，不完全信息动态博弈得到迅速发展，弗得伯格和泰勒尔定义了它的基本均衡概念“精炼贝叶斯-纳什均衡”。20世纪70年代以后，博弈论形成了一个完整的体系，到20世纪80年代出现了几个比较有影响的人物，包括克瑞普斯和威尔逊，他们在1982年合作发表了关于动态不完全信息博弈的重要文章，博弈论逐渐成为主流经济学的一部分，甚至可以说成为微观经济学的基础。

三、博弈论核心理论

博弈论的基本概念包括：参与人、行动、信息、战略、支付函数、结果、均衡。博弈的划分可以从两个角度进行。一是参与人行动的先后顺序，分为静态博弈和动态博弈。二是参与人对有关其他参与人（对手）的特征、战略空间及支付函数的知识，分为完全信息博弈和不完全信息博弈。结合两个角度，我们得到四种不同类型的博弈：完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。与上述四种博弈相对应的是四个均衡概念，即纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。

第一，完全信息静态博弈——纳什均衡：纳什均衡指的是这样一种战略组合，这种战略组合由所有参与人的最优战略组成，给定别人战略的情况下，没有任何单个参与人有积极性选择其他策略，从而没有任何人有积极性打破这种均衡。

第二，完全信息动态博弈——子博弈精炼纳什均衡：泽尔腾于1965年通过对动态博弈的分析完善了纳什均衡的概念，定义了“子博弈精炼纳什均衡”，将纳什均衡中包含的不可置信的威胁战略剔除出去，要求参与人的决策在任何时点上都是最优的，决策者要“随机应变”，“向前看”，而不是固守旧略。

第三，不完全信息静态博弈——贝叶斯纳什均衡：海萨尼构建了不完全信息博弈的基本理论，提出了不完全信息静态博弈的基本均衡概念——贝叶斯纳什均衡，使得不完全信息静态博弈的分析可以在已经讨论过的完全信息动态博弈的分析框架下进行，而在海萨尼转换提出之前，人们是无法对不完全信息博弈进行分析的。

第四，不完全信息动态博弈——精炼贝叶斯纳什均衡：弗得伯格和泰勒尔定义了不完全信息动态博弈的基本均衡概念——精炼贝叶斯纳什均衡。不完全信息动态博弈是指在博弈中至少有一个局中人不知道其他局中人的支付函数；局中人的行动有先后之分，后行动者能观察到先行动者的行动。不完全信息动态博弈分析也是在豪尔绍尼转换的框架下进行的。

综上所述，经济博弈论的一系列均衡概念都是在纳什均衡的基础上发展起来的，其基本思路都是通过逐步剔除不合理均衡而得到更为精确和合理的均衡概念。

四、博弈论的应用和现实意义

博弈论定义篇2

【关键词】唯物辩证法经典博弈论演化博弈论经济学革命

一、博弈论与辩证法

1.辩证法要义

辩证法，源出希腊文，含义是进行谈话、进行论战。这一术语在哲学史上曾在各种不同的意义上被使用，其历史发展经历了古代的朴素辩证法、以黑格尔为代表的唯心辩证法、马克思主义的唯物辩证法等三个阶段。19世纪中叶，马克思和恩格斯在概括革命实践经验和自然科学新成果的基础上，批判地继承了黑格尔的唯心主义辩证法，创立了唯物主义辩证法，他们认为，世界“是一幅由种种联系和相互作用无穷无尽地交织起来的画面”，唯物辩证法就是对这一生动画面的概括和反映。从内容上看，唯物辩证法作为科学的理论体系包括对立统一（矛盾）、质量互变、否定之否定三大基本规律，以及本质与现象、内容与形式、原因和结果、必然性和偶然性、可能性和现实性五对基本范畴。总体上看，唯物辩证法是对客观物质世界普遍联系和永恒发展这一基本特征的揭示和反映，既是一种世界观又是一种方法论。

2.博弈论的内涵及其发展阶段

博弈论作为数学的一个分支，本身不涉及经济问题。这种理论是一种分析工具，它研究怎样以数学模型模拟决策者之间的冲突与合作。由于冲突与合作的结果依赖于所有人所作的选择，每个决策者都企图预测其他人可能的抉择，以确定自己的最佳决策。如何合理地进行这些相互依存的战略策划便是博弈论的主题。

博弈论的发展经历了以下三个阶段：

一是思想萌芽阶段。1838年古诺简单双寡头垄断博弈、1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断、2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽，其特点是零星的、片断的研究，带有很大的偶然性，很不系统。

二是经典博弈论形成阶段。1944年冯·诺依曼和摩根斯坦的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法，奠定了这门学科的理论基础；1950年和1951年纳时发表了《n人博弈的均衡点》和《非合作博弈》两篇关于非合作博弈的文章、1950年Tucker定义了“囚徒困境”；60年代，泽尔滕将纳什均衡的概念引入了动态分析，提出了“精炼纳什均衡”概念、海萨尼则把不完全信息引入了博弈论的研究；80年代，克瑞普斯和威尔逊研究了动态不完全信息博弈。总体来说，经典博弈论主要关注纳什均衡的形成，以及当纳什均衡存在多重性时，如何通过不断地精炼来寻找最终的结局。

三是博弈论在当前的发展阶段。20世纪90年代以来，演化博弈论、博弈学习理论、行为博弈等研究成为博弈论的最新发展，主要从博弈论的角度探索正式和非正式制度的形成与演变、通过实验来检验和修正有关经济人的行为理论等问题。

二、博弈论对西方经济学的改良

首先，传统西方经济学对寡头市场和垄断竞争市场和市场失灵问题的研究是苍白无力的，这使得传统西方经济学解释现实的能力并不像其宣扬的那样完美。博弈论作为工具在西方经济学中的应用正好弥补了传统西方经济学的这一缺陷。正如克雷普斯在《博弈论与经济模型》一书中所作的评价：“我认为博弈论最成功之处在于使一望而知的直觉认识规范化，从而使人们了解这类直觉认识怎样应用于新的形势，以及在较为复杂的形势下怎样获得这种直觉认识。”“博弈论提出的问题正是那些‘在理论上难以解释’的合乎情理的直观行为，非合作博弈理论只是应用数学理论提供了分析这类行为的简单工具。”

其次，“博弈论在经济学获得巨大成功的主要原因，是它提供了模拟和分析动态性竞争互动的技术手段。”互动结构是一种社会结构，长期以来，经济学家一直试图理解个人行为与社会结构之间的关系。美国经济学家H·培顿·扬在《个人策略与社会结构——制度的演化理论》一书中认为：“经济制度和行为模式可以被解释为很多个人决策的产物或者说结果……那么，有哪些特征能将‘演化’的观点与经济学中的古典观点区别开来呢？一个是符合均衡的状态，另一个是符合理性的状态。”H·培顿·扬是演化博弈论领域的领军人物，他的上述这段引文清楚地表明了新古典研究传统的两大缺陷：一是没有动态分析，尤其是没有关于复杂情况下的动态分析；二是脱离现实太远的强经济人假定。演化博弈论将经济运行理解为一个动态演化的过程，并认为经济人并不是强理性的，而是适应性理性的。在动态演化的过程中，经济人通过不断的学习来提高理性程度，进而实现最优决策，这无疑推动了西方经济学的发展。

上面我们从两个方面分析了博弈论给西方经济学带来的变化，但不能据此就认为博弈论给西方经济学带来了革命。第一，博弈论并没有从整个体系上改革西方经济学，只是对其进行修修补补，将西方经济学原本不能解决或解决不好的问题给予改良。第二，新兴起的演化博弈论虽然为西方经济学的动态演化分析提供了工具，但随着研究的深入也对西方经济学提出了挑战。“随着一组新的分析工具特别是博弈论和信息经济学的出现和越来越明显的经验证据表明，瓦尔拉斯模型存在缺陷，经济学教学和实践的方式正在发生改变。经济参与人不再单纯与自然或是其他环境参数打交道，而是有策略地与其他经济人交往。”经典博弈论（如非合作博弈论中的完全信息条件下的静动态博弈和不完全信息条件下的静动态博弈）为经济人的互动决策建立了模型，从而部分解决了上述问题。然而，非合作博弈论在基本模式上依然遵循均衡模式，只不过将范围从瓦尔拉斯的单个经济人拓展到相互影响的两个人或多人之间的均衡。经济社会运行是一个不断从均衡走向非均衡，又从非均衡走向均衡的动态演变过程。这与瓦尔拉斯传统所宣扬的一般均衡是不相容的。如果说以非合作博弈理论为代表的经典博弈论还能在某种程度上对西方经济学进行补充的话，当演化博弈论兴起以后，瓦尔拉斯传统就再也无法自圆其说了。但由于西方经济学本身固有的辩护性，它不会允许新理论去触动传统理论的核心，与上述引文出自同一本书的一段话清楚地表明了这一点，“在许多经济学家和其他学科学者贡献的基础上，本书提出了关于个人行为与经济制度如何相互作用产生总体效果，以及两者随着时间的推移如何变化的理论。”根据上面的分析，我们不难看出博弈论改良了西方经济学，但却没给其带来革命。一方面，博弈论本身体现着辩证思维，其与传统西方经济学形而上学的方法论相比，更符合真实世界的运行，因而能在一定意义上给西方经济学带来改变，使其科学性稍稍加强；但另一方面，博弈论又囿于西方经济学本身的辩护性，作为一个工具它的应用被限制在一定的范围内，无法给西方经济学带来革命。只有将马克思唯物辩证法与博弈论相结合，使其具有唯物辩证法所具有的革命性，才有可能为经济学带来一场革命。

三、改造博弈论的设想及借鉴意义

我们设想可以从以下几个方面对博弈论进行批判性的吸收和改造，以便为马克思经济学的发展所用。

1.“社会生活在本质上是实践的。凡是把理论导致神秘主义的神秘东西，都能在人的实践中以及对这个实践的理解中得到合理的解决。”演化博弈论之所以在当前蓬勃发展且应用前景广泛，其根本原因在于其突破了经济人的超理性假定，如果再向前走几步，其科学性会大大增强，指望西方经济学家来完成这项工作是不可能的，只有马克思和马克思经济学者有这样的革命性。从这个意义上说，演化博弈论中学习着的人正在向马克思实践的人靠近，也为马克思经济学的发展提供了新的工具。

2.将马克思生产力与生产关系辩证统一原理与演化博弈论关于经济社会动态演变的理论分析结合起来。马克思生产力与生产关系辩证统一原理是唯物辩证法在人类社会历史发展中的应用。马克思主义哲学认为，生产力与生产关系、经济基础与上层建筑之间的矛盾是社会基本矛盾，它们的运动形成社会发展的基本规律，同时也构成社会发展的根本动力，社会是在对立统一、否定之否定的螺旋式发展中上升的。这一原理体现在马克思经济学中就是资本主义制度自身的发展造就了替代自己的新的共产主义制度，同时，每一制度下的各种上层建筑又由构成其经济基础决定的。演化博弈论主张用从均衡到非均衡、再由非均衡到均衡动态演变方法来分析社会制度的形成、驻存和演变，这一点与马克思的分析有着相通之处，可以用马克思的思想对其进行改造。

3.利用西方社会科学正以博弈论为基本分析工具走向融合之路的契机，可以在改造后的博弈论框架下批判吸收西方相关社会科学发展的成果。近年来，西方社会科学各学科在大量地应用博弈论对本学科进行改写和发展，呈现出各社会科学统一的趋势，跨学科研究方兴未艾。如果能将博弈论这种分析工具融入马克思的分析中，那么将为马克思理论批判吸收西方社会科学的最新研究成果提供一个平台。

参考文献：

[1]马克思恩格斯选集（中文第二版）：733.

[2] [美]戴维·M．克雷普斯著，邓方译.博弈论与经济模型.商务印书馆，2006：94.

[3][美]戴维·M．克雷普斯著，邓方译.博弈论与经济模型.商务印书馆，2006：45.

[4][美] H·培顿·扬著，王勇译.个人策略与社会结构——制度的演化理论.上海三联书店、上海人民出版社，2004：4.

[5][美]萨缪·鲍尔斯著，江艇、洪福海、周业安译，微观经济学：行为，制度和演化.中国人民大学出版社，2006：6.

[6]马克思恩格斯选集（中文第二版）（第一卷）：58.

[7]马克思恩格斯选集（中文第二版）（第1—4卷）.北京：人民出版社，1995.

[8]梁树发.马克思主义哲学原理.北京：中国人民大学出版社，2003.

[9]李建平.《资本论》第一卷辩证法探索.北京：社会科学文献出版社，2006.

[10]李云峰.马克思学说中人的概念.北京：人民出版社，2007.

[11]杨耕，陈志良，马俊峰.马克思主义哲学研究.北京：中国人民大学出版社，2000.

[12] [瑞典]乔根·W．威布尔著，王永钦译.演化博弈论.上海：上海三联书店、上海人民出版社，2006.

博弈论定义篇3

〔关键词〕博弈论；博弈分析范式；博弈分析政治学研究

〔中图分类号〕D0；C3〔文献标识码〕A〔文章编号〕1000-4769（2013）04-0043-08

一、博弈分析范式与社会科学研究

（一）博弈论与博弈分析范式

博弈论（game theory）源起于人们对扑克牌游戏、国际象棋、市场竞争的数学研究，自1944年冯・诺伊曼（John Von Neumann）与摩根斯坦（O. Morgenstern）合著的《博弈论与经济行为》一书出版以后〔1〕，作为一门应用数学分支的现代博弈论（亦称对策论）正式形成并在经济学等社会科学研究领域得到应用。在一些博弈论教材中，博弈论多被习惯性地定义为一种形式化的数理分析工具。比如，迈尔森（R. Myerson）将博弈论定义为“对智能的理性决策者之间相互冲突与合作的数学模型的研究。”〔2〕奥斯本（M. Osborne）和鲁宾斯坦（A. Rubinstein）也认为：“博弈论是一个分析工具包，它被设计用来帮助我们理解所观察到的决策主体之间相互作用时的现象。”〔3〕然而，经过多年发展，博弈论已超越形式化数理分析工具的范畴而成为一个分析理性人乃至生物个体策略互动的一般框架，广泛应用于经济学、政治学、法学、社会学、伦理学、语言学、生物学等研究领域，引发了一场意义重大、影响深远的“博弈论革命”。

埃尔斯特（J. Elster）认为，有别于功能主义、结构主义、角色理论等社会科学分析范式，博弈论以分析意向人之间的意向性互动为旨归，属意向性解释和因果解释的范畴，能够同时处理人类互动过程所内涵的三类相互依赖性并为马克思主义社会理论提供微观行为基础。〔4〕利希巴赫（M. Lichbach）则从本体论、方法论的层面上对理性选择理论（实则博弈论）、历史主义和结构主义等分析范式做了细致的分析和比较，虽然对前者企图统一社会科学研究的野心不以为然，但并不讳言博弈论已成为一个带有扩张倾向的主流分析范式。〔5〕国内崔之元教授也认为：“博弈论不仅是一门应用数学，不仅是一种方法，而且是关于人类理性选择行为的实质性的理论。”〔6〕奥曼（R. Aumann）、宾默尔（K. Binmore）、金蒂斯（H. Gintis）等博弈论学者在对理性假设、共同知识（common knowledge）假设等隐身于各种精致优美的博弈论模型背后的理论预设进行反思时也将目光转向哲学领域，对博弈论的知识论基础加以探究。

（二）博弈分析范式应用于社会科学研究的比较优势

由于采取了上述理论预设，博弈分析范式使人们能够在一个更微观、更精细的层次上来解析个体与整体、行动与结构之间的互动关系，较好地回避了社会科学方法论个体主义与整体主义二分带来的紧张与对立，能够更好地理解和阐释各类社会政治现象。也正因为如此，一些学者将其对社会科学的意义与微积分对经典力学与物理学的意义相提并论。〔8〕迈尔森更大胆地宣称：“非合作博弈论实际上实现了社会科学研究的统一，纳什均衡概念的提出是20世纪可与DNA双螺旋结构的生物学发现相媲美的理论贡献。”〔9〕金蒂斯虽然十分清楚博弈分析范式的弱点，但还是禁不住雄心勃勃地试图以之为一般分析框架来统一整个行为科学，因为在他看来，“博弈论对于理解各种生命形式尤其是人类变化过程具有核心作用”，并且，“忽视博弈论对一个学科来说是一件糟糕的事情。”〔10〕

一旦人们将博弈分析范式应用于社会科学研究，就有可能产生如下几项比较优势：其一，由于它的理论预设具有相当大的一般性、包容性和广涵性，凡研究者认为是理性个体（人、生物、计算机）之间策略互动的现象都可以置于博弈分析范式的框架之内加以探究；其二，通过将微观个体行为与宏观社会实在置于互动的层面上加以理解和阐释，人们能够更好地化解个体与整体、行动与结构的二分与循环论证问题，在为组织、制度、历史、文化等宏观社会实在提供微观行为基础的同时也为理解后者赖以发生的各种约束和条件提供宏观的语境和背景；其三，通过对博弈情势进行数理建模，研究者可以对博弈各方所处物理环境、信息分布、主观信念、行动策略以及支付（收益）进行直观描述，从而对问题有更准确的把握；其四，由于大量使用数学语言，博弈分析范式为学术对话和交流提供了清晰、精确的形式化语言系统，为检验各种认识在逻辑上是否一致提供了一个基础，使研究者能够根据数学模型自结论回溯至假设，以便理解导致特定结论的假设条件。〔11〕其五，运用博弈分析范式进行研究，有助于研究者提出一系列量化的可检验的理论命题，以便人们根据经验事实对这些理论命题进行证实或证伪。

二、博弈分析政治学研究的发展阶段、代表人物与理论成果

（一）博弈分析政治学研究的涵义

我们知道，政治学研究始终具有海纳百川、包容并蓄的理论传统，十分注意借鉴、吸收、运用和发展其他学科的分析方法与理论成果。博弈分析范式也不例外，倘若政治学者接受它的理论预设，认为社会政治实在是有理性个人间策略互动的产物，就能够将其应用于政治学研究，使它的上述特点和优势在政治学研究领域得到充分体现。

需要说明的是，在国外学术话语体系中，人们通常将博弈论看成是理性选择理论的一个重要组成部分〔12〕，或者干脆等同于理性选择理论本身，并不严格区分理性选择理论与博弈论这两个概念，也很少使用博弈分析政治学研究的提法。然而，国外学者所说的理性选择理论绝大多数情况下实际指的就是以博弈论为核心组成部分或者说博弈论化了的“升级版”的理性选择理论。鉴于国内外学术话语体系的差异，对二者做一概念上的区分，将博弈分析政治学研究从理性选择政治学研究中抽取出来做一相对独立的系统梳理与评析，仍然不乏积极意义。这样，一则可以使我们更清晰地凸显出二者之间既相联系又相区别、既继承又发展的事实，二则也有助于我们更准确地把握国外政治学研究的发展趋势。更重要的还在于，博弈分析政治学研究的用语比理性选择政治学研究的用语能够更全面准确地传递出其作为一种主体间、理性主义与建构论式政治学研究的真实意涵和内在精神。

另一方面，随着政治学研究的“专业化、分化与杂化”和跨学科、跨子学科交叉与融合的日益发展〔13〕，政治学研究这一概念的涵义与指称也发生了较大变化，很难严格界定。宽泛地讲，博弈分析政治学研究的概念至少可以包含两层涵义：一是指政治学者所从事的博弈分析政治学研究；二是指具有其他学科背景的学者针对传统政治学理论议题所做的博弈分析。本文主要采用第一层涵义，即政治学者运用博弈分析范式的理论预设、研究方法、数理模型而进行的政治学研究。这样，一来可以将本文限定在一个相对有限的范围之内，二来也能够将公共物品供应、公共池塘资源治理、群体合作、自由平等、公平正义与道德习俗演化等跨学科研究议题纳入视野，以真实反映博弈分析政治学研究的问题意识和发展现状。

（二）三个发展阶段以及各阶段代表人物与理论成果

毋庸置疑，博弈分析范式的形成与发展及其在政治学研究领域的应用推动了博弈分析政治学研究的形成与发展。然而，这一过程并非是一个政治学研究从属于或单向接受博弈分析范式的过程，博弈分析政治学研究有其自身发展的脉络和逻辑，对博弈分析范式的丰富与完善也作出了许多有价值的理论贡献，因而有必要加以单独讨论。为了叙述方便，我们将这一过程大致划分为试探期、成型期和常规科学发展期三个阶段并侧重对各个阶段的发展水平、代表人物与理论成果进行扼要评析。

1.试探期

《博弈论与经济行为》一书出版以后，著名政治学者多伊奇（K. Deutsch）敏锐地注意到了这一理论动向，对其应用于政治学研究领域的可能性予以肯定：“在一定范围内，该方法与一些政治学理论问题的相关性是显而易见的。”〔14〕经济学家赫维茨（L. Hurwicz）也认为：“两位作者用以处理经济问题的方法具有充分的一般性，因而适用于政治学、社会学甚至军事战略学。”〔15〕他们的乐观预测很快得到验证。进入二十世纪六七十年代，里克尔（W. Riker）、谢林（T. Schelling）、罗尔斯（J. Rawls）、诺齐克（R. Nozick）、谢普斯尔（K. Shepsle）、奥德舒克（P. Ordeshook）、奥唐耐（G. O’Donnell）等人开始试探性地应用博弈论的概念、方法和模型对政治联盟、组织行为、策略投票、议会过程、国际谈判、军控与核扩散、自由平等、公平正义、政治发展与民主转型等理论议题展开研究，取得了不少有价值的研究成果，博弈分析政治学研究也随之崭露头角。

里克尔1962年出版的《政治联盟理论》被公认为经典之作。〔16〕里克尔在书中提出了“社会法则是建立在博弈论基础上的”这样一个在当时还显得比较大胆和超前的命题〔17〕，并运用“核”（core）这一合作博弈论的重要概念提出了著名的最小获胜联盟理论，在政治联盟、组织行为、议会过程等研究领域产生了重要影响。国际政治理论家谢林不但首开先河将博弈论应用于国际谈判、军事冲突、军控与核扩散等问题的研究，还提出了“聚点”（focal point）均衡和“可信承诺”（credible commitment）的重要思想，对博弈论的发展做出了突出贡献并因此荣膺诺贝尔经济学奖。〔18〕比较政治学者奥唐耐通过分析阿根廷各党派之间的联盟与博弈对该国政治发展的影响而将博弈论引入比较政治发展研究〔19〕，带动了后续民主转型研究的分析范式转型。

博弈论对罗尔斯、诺齐克等人的政治哲学研究也产生了直接而有力的影响。在构建公平正义学说时，最大最小法则（maximin rule）这一严格竞争博弈（零和博弈）的纳什均衡决策法则是罗尔斯推演差别原则的关键，也是人们批评差别原则的一个重要切入点。〔20〕此外，我们看到，罗尔斯从卢斯和雷法合著的《博弈与决策》以及冯・诺伊曼和摩根斯坦在《博弈论与经济行为》一书中加以明晰化的冯・诺伊曼―摩根斯坦期望效用理论中获益匪浅。〔21〕罗尔斯本人也承认：“正义论也许是理性选择理论最重要的部分之一”。〔22〕诺齐克对博弈论的运用就更为明显和彻底。在论证最小国家理论时，诺齐克依据的正是囚徒困境这一经典博弈模型。〔23〕有意思的是，罗尔斯等人对理性选择和博弈论的运用将传统的社会契约论改造为精致的道德几何学论证体系，引发了大量的后续研究，形成一个庞大的所谓的“罗尔斯产业”〔24〕，从而有力地推动了当代政治哲学研究的复兴与繁荣。

总体上看，由于博弈分析范式自身还不十分成熟以及政治学者对其还普遍比较陌生，因此从人数、成果数量和理论影响等几个方面看，该阶段还属于少数政治学者试探性地从事博弈分析政治学研究的早期发展阶段。

2.成型期

上世纪七十年代初，生物学家史密斯（J. Smith）将经典博弈论应用于生物演化建模并提出演化稳定策略（evolutionary stable strategy， ESS）的概念，演化博弈论得以形成并快速发展。在演化博弈论的影响下，演化博弈论对均衡策略的产生、变化与收敛给出了进化论式的解释，赋予其模仿、学习、突变等新的来源，从而使博弈论分析框架更加灵活、全面，理论解释力也有了进一步的提升。

（二）五个主要的分析路线

得益于政治学分析范式多元化的理论传统，博弈分析政治学研究者在理解“社会实在由理性个体间的策略互动建构形成”这一博弈分析范式理论预设上存在着旨趣、视角和侧重点上的微妙差异，在“策略”是源自审慎推理、遗传演化、模仿学习抑或突变创新以及个体微观行动受到组织、制度、历史、文化等宏观的结构性变量多大程度的影响等一系列问题上存在着观点分歧，分化出里克尔、谢普斯尔、奥德舒克、温格斯特（B. Weingast）等代表的理性选择、阿克谢罗德代表的演化分析、奥斯特罗姆代表的经验主义、贝茨、格雷夫（A. Greif）、温格斯特等代表的分析叙事以及埃尔斯特、罗默等代表的博弈分析马克思主义等几个主要的分析路线。

需要注意的是，一方面，这些分析路线之间的家族相似性常常多于其差异性，它们之间在学术渊源上亦存在着千丝万缕的紧密联系或亲缘关系。另一方面，同一学者在不同时期的分析路线也会发生变化，即使在某一分析路线内部，其观点也不尽完全相同。而且，随着博弈分析政治学研究的深入，各分析路线之间也存在着相互吸收、借鉴、融合的发展趋势。因此，上述提法只是为了使我们对博弈分析政治学研究内部存在着多个分析线路这一事实有所了解并方便我们对它们之间的异同进行比较分析而提出的，不应把它们当作标签而固化下来。

（三）理性选择与分析叙事两个分析路线的基本特征

限于篇幅，本文只对理性选择与分析叙事两个分析路线的主要特征进行扼要介绍与评析，其他几个分析路线留待将来再做介绍与评析。

1.理性选择分析路线

唐斯（A. Downs）、布坎南（J. Buchanan）、奥尔森（M. Olson）等经济学家对民主投票行为、民主的公共选择过程、利益集团与集体行动的组织困境等问题的研究是理性选择分析路线的直接理论来源，其代表人物有前面提到的里克尔、谢普斯尔、奥德舒克、温格斯特等人。理性选择分析路线保留了较多的理性选择理论的元素，与其他分析路线相比，具有理论假设最少、研究结论最为一般、适用范围最广等主要特征，但也导致产生诸如对人们的理性能力要求过高、难以深度解释一些经验事实或历史个案以及对价值和规范问题关注不够等一些弱点和不足。不过，对这些弱点和不足进行修复的努力却直接间接地刺激了后续其他分析路线的发展。因此，我们可以说，理性选择分析路线在博弈分析政治学研究的发展过程中起到了一种类似于母体和催化剂的作用。

80年代初以来，温格斯特开始成为理性选择分析路线中一个十分活跃的学者，发表了一系列颇有影响的文章，提出了一系列重要的理论观点，成为这一时期的主要代表人物之一。温格斯特对理性选择分析路线的基本思路和研究程序做了很好的归纳，有助于认识其基本特征，我们将其转述如下：

理性选择途径是从一组具有明确偏好的个人开始的。在明确背景下的个人策略互动是这一途径的特点。制度影响着每个个体的有效行为，影响着这些行为的次序，影响对每一个决策者都有用的信息结构，而这些影响又使制度模型化。〔31〕

需要说明的是，温格斯特这里所说的理性选择途径虽未明确使用博弈论、博弈分析范式一类的术语，但实际上意指的就是以经典理性选择理论的“理性人假设”为基础对“个人策略互动”进行博弈分析的理性选择分析路线。我们认为，上述这段话十分准确、贴切地描述了理性选择分析路线的基本思路和研究程序，有助于认识其基本特征。当然，后期理性选择分析路线也做出一些积极的改变，“理性人假设”有所放松，较为注意借鉴、吸收其他各派的理论要素和长处，等等。温格斯特本人就是一个很好的例子，他在90年代后期与贝茨、格雷夫等人一起提出和倡导分析叙事的分析路线，理性选择的色彩有所淡化。

2.分析叙事（analytic narrative）分析路线

该分析路线的核心主张由贝茨、格雷夫、利维（M. Levi）、罗森瑟（Jean-Laurent Rosenthal）和温格斯特五人在90年代末正式提出，是博弈分析政治学研究各分析路线中出现较晚但引起广泛关注且影响力不容忽视的一支。

分析叙事的一个主要特征就是追求理论与事件或者说演绎与归纳、普遍与特殊的有机统一。正如贝茨等人指出的那样：“我们的方式是叙事性质的，它与事件、报道和场景紧密相连。它又是分析的，诉诸明确和形式化的逻辑演绎，从而有助于探究与解释。”在此过程中，“对理性选择与博弈论的运用，使叙事转化为分析叙事。”〔32〕分析叙事的核心任务就是“如何在案例分析的基础上发展出系统化的理论解释。”〔33〕不难看出，同宏大叙事（metanarratives）相比，分析叙事的理论目标是中观的、具体的和有限的，满足于对历史上真实存在的具体制度、机制进行深度的案例分析，而同一些传统的历史制度主义理论传统相比，分析叙事又不限于叙述历史，而是力图对其进行深度解释。

分析叙事研究者通常首先要对档案、记录、文献等相关史料进行收集整理，对相关历史事件进行叙述还原，然后通过构造适当的博弈模型（通常为扩展型博弈模型）对这些史料加以形式化，使之理论再现为一个或一组简洁明了、清晰直观、逻辑一致且可检验的数理模型并据此对所研究的问题提出理论解释。因此，分析叙事理论模型弈的参与者不再是抽象的个人或组织（联盟），而是历史上真实的个人或组织（联盟），他们的策略集合、互动过程以及博弈结果也是根据史料加以分析总结的。因此，一方面，分析叙事力图从当事人的偏好、策略与行动的微观视角出发去理解制度、机制现象；另一方面，当事人的偏好、策略、互动过程以及最后形成的制度、机制又是从其所处的历史场景之中加以理解和把握的。

在博弈分析政治学各分析路线之中，分析叙事尤为重视从历史制度主义这一古老的政治学理论传统之中汲取理论养分并将其与博弈分析模型有机地结合起来，较好地弥补了此前研究普遍存在的历史维度的弱点。因此，甫一提出便引起了学界的高度关注与积极反响。不过，人们对这种将博弈分析模型与历史事件结合起来以解释复杂历史过程的做法也存有不少疑问。埃尔斯特便认为分析叙事没有取得预料中的成功，与上述五位学者还就此有过一番认真的对话与争论。〔34〕然而，无论如何，作为在新的理论发展水平上恢复政治学理论传统的一项积极探索，分析叙事的理论价值是值得肯定的。

上述两个分析路线并非截然对立，而是各具特色，各有所长。简而言之，分析叙事试图将历史过程对当事人策略选择与均衡精炼的影响模型化，适合分析中长期的、将时间维度考虑在内的、真实的策略互动过程；理性选择分析路线则试图将策略互动过程一般化，适合分析将历史等结构性约束视为事先给定的、将时间维度排除在外的、抽象的策略互动过程。它们之间也存在着一定的联系，我们可以把分析叙事看成是在理性选择分析路线的基础上纳入历史制度主义的理论要素的产物，即所谓的“理性选择制度主义”（rational choice institutionalism）。〔35〕对研究者来说，这种多元分析路线和谐共存、良性互动的局面，为人们根据自己的学术立场和偏好各取所需提供了有利条件。

四、结语

本文从理论预设、发展阶段、代表人物、理论成就、研究议题、分析路线等几个方面展开，尝试对博弈分析政治学研究做了一个较为系统的梳理、提炼和评析。当然，相关文献卷帙浩繁，我们的梳理和评述还相对有限。即便如此，我们还是不难看出，在一大批学者多年来持续的努力下，博弈分析政治学研究已成长为政治学研究的一个主流分析范式和重要的知识生长点，有力地推动了政治学研究的范式转变与理论创新，丰富了对社会政治生活的理解。如果说实证主义与行为主义促使研究者将政治学研究关注的目光转向人们的行为及其后果，那么，博弈分析政治学研究则将这一关注的目光进一步转向人们行为背后的动机、意向性以及互动过程及其后果。诚如库恩所言，“范式一改变，这世界本身也随之改变了”。〔36〕正是在范式转变的层次上，博弈分析政治学研究深刻地改变了我们观察、理解、解释社会政治现象的思维方式、理论视界、分析工具和话语体系并因此而带动了整个政治学研究的蓬勃发展，也再一次验证了分析范式与研究方法的创新是政治学研究理论创新的一个重要推动力量这一事实。

归纳起来，博弈分析政治学研究的理论贡献大致体现在三个方面：其一，作为一个社会科学元分析范式，它提供了一个统一政治学分析范式的可能方案以及整合跨学科、跨子学科交叉研究的共同的方法论基础，推动了政治学研究问题意识的更新和理论边界的扩展；其二，由于更强调人类行为的主体间性、意向性和策略性，博弈分析政治学研究使我们能够跨越微观与宏观、个体与整体、行动与结构之间的鸿沟，拥有了一个理解、解释社会政治现象的更为精巧灵敏的强有力的理论工具；其三，在涉及政治发展、群体合作、自由平等、公平正义等一系列重大理论问题上，博弈分析政治学研究取得了大量有价值的研究成果，对人们探求优良的政治生活发挥了积极的理论指导作用。

就笔者所知，崔之元教授大概最早对博弈论应用于政治学研究取得的早期理论成果进行了绍述，此后国内陆续有文献跟踪介绍相关进展或尝试运用一些博弈模型进行政治学、行政管理学研究。〔37〕不过同其重要性相比，国内政治学对博弈分析政治学的关注还十分不够，已有的研究不但数量偏少且不够深入，影响也相对有限，与国内经济学、管理学、社会学的同类研究相比都还仍显薄弱。但是，正如前文所述，作为一个实质性的社会科学分析范式，博弈论为人们提供了一个从范式层面上突破建构论与功能论、行动与结构、个体主义与整体主义二分窠臼的理论工具，可以有力地增进我们对社会政治现象的理解力和解释力。而随着中国社会转型与政治发展的深入、利益格局的日益多元与分化以及各利益主体之间博弈的日趋活跃，博弈分析政治学研究不难从中找到落地生根、枝繁叶茂的肥沃土壤。我们也相信，会有越来越多的中国政治学者熟悉、了解、掌握这一强大的分析工具并将其应用于中国社会转型与政治发展的理论研究。

〔参考文献〕

〔1〕John Von Neumann， Oskar Morgenstern. Theory of Games and Economic Behavior. Princeton University Press， 1944.

〔2〕罗杰・迈尔森.博弈论：矛盾冲突分析〔M〕. 北京：中国经济出版社，2001.1.

〔3〕马丁・奥斯本，阿里尔・鲁宾斯坦.博弈论教程〔M〕. 北京：中国社会科学出版社，2000.1.

〔4〕〔12〕Jon Elster. Marxism， Functionalism， and Game Theory： The Case for Methodological Individualism.Theory and Society， 1982，4，pp.453-482.

〔5〕Mark Lichbach. Is Rational Choice Theory All of Social Science？The University of Michigan Press， 2003.

〔6〕崔之元.博弈论与社会科学〔M〕. 杭州：浙江人民出版社， 1988.1.

〔7〕〔28〕〔36〕托马斯・库恩.科学革命的结构〔M〕. 北京：北京大学出版社， 2003.5，65，101.

〔8〕Steven Brams.Game Theory and Politics.Free Press， 1975.p.6.

〔9〕Roger Myerson. Nash Equilibrium and the History of Economic Theory.Journal of Economic Literature， 1999， 37（3）.

〔10〕Herbert Gintis. The Bounds of Reason： Game Theory and the Unification of the Behavioral Sciences.Princeton： Princeton University Press， 2009，p.8.

〔11〕戴维・克雷普斯.博弈论与经济模型〔M〕. 北京：商务印书馆， 2006.8.

〔13〕马泰・多甘.政治科学与其他社会科学〔A〕. 罗伯特・古丁，汉斯-迪特尔・克林格曼编.政治科学新手册（上册）〔C〕. 北京：生活・读书・新知三联书店， 2006.141.

〔14〕Karl Deutsch. Game Theory and Politics： Some Problems of Application.The Canadian Journal of Economics and Political Science，1954， 20（1）：pp.76-83.

〔15〕Leonid Hurwicz. The Theory of Economic Behavior. American Economic Review， 1945， 35（5）.

〔16〕William Riker. The Theory of Political Coalitions.Yale University Press， 1962.

〔17〕科拉・斯特拉姆.联盟理论中的规模原则：最小化获胜联盟法则〔A〕. 斯坦因・拉尔森编.政治学理论与方法〔C〕. 上海：上海人民出版社， 2006.77.

〔18〕托马斯・谢林.冲突的战略〔M〕. 北京：华夏出版社， 2006.

〔19〕Guillermo ODonnell.Modernization and Bureaucratic-Authoritarianism： Studies in South American Politics.Institute of International Studies， University of California， 1973.

〔20〕John Harsanyi. Can the Maximin Principle Serve as a Basis for Morality？ A Critique of John Rawlss Theory. The American Political Science Review， 1995， 69（2），pp.594-606；赵汀阳.冲突、合作与和谐的博弈哲学〔J〕. 世界经济与政治， 2007，（6）；江绪林.解释和严密化：作为理性选择模型的罗尔斯契约论证〔J〕. 中国社会科学， 2009，（5）.

〔21〕〔22〕John Rawls. A Theory of Justice.Harvard University Press， 1971， pp.150-161，p.16.

〔23〕Robert Nozick.Anarchy， State， and Utopia.Basic Books， 1974，pp.120-125.

〔24〕何包钢.罗尔斯的规范方法论：契约、无知之幕和反思的平衡〔EB/OL〕. http：// chinaelections. org/ newsinfo.asp？ newsid=31950， 2003-06-17.

〔25〕Robert Axelrod， William D. Hamilton. The Evolution of Cooperation.Science， New Series， 1981， 211（4489）.

〔26〕Elinor Ostrom. Understanding Institutional Diversity.Princeton University Press， 2005；柴盈，曾云敏.奥斯特罗姆对经济理论与方法论的贡献〔J〕. 经济学动态， 2009，（12）.

〔27〕Peter Ordeshook.Game Theory and Political Theory： an Introduction.Cambridge University Press， 1986；James Morrow. Game Theory for Political Scientists.Princeton University Press， 1994；Nolan McCarty， Adam Meirowitz. Political Game Theory： an Introduction？Cambridge University Press， 2007.

〔29〕Mark Lichbach. Is Rational Choice Theory All of Social Science？The University of Michigan Press， 2003， xiii.

〔30〕肯・宾莫尔.博弈论与社会契约（第1卷）：公平博弈〔M〕. 上海：上海财经大学出版社， 2003.1.

〔31〕巴里・温格斯特.政治制度：理性选择的视角〔A〕. 罗伯特・古丁，汉斯-迪特尔・克林格曼编.政治科学新手册（上册）〔C〕.248.

〔32〕Robert Bates et al.Analytic Narratives. Princeton University Press， 1998，p.10，p.12.

〔33〕Robert Bates et al. The Analytic Narrative Project. The American Political Science Review， 2000， 94（3）.

〔34〕Jon Elster. Rational Choice History： A Case of Excessive Ambition. The American Political Science Review， 2000， 94（3）.

〔35〕Kathleen Thelen. Historical Institutionalism in Comparative Politics.Annual Rreview of Political Science， 1999，（2）.

博弈论定义篇4

关键词：认知；演化；制度分析

中图分类号：F011　文献标识码：A　文章编号：1004－0544(2012)08－0136－05

一、引言

经济活动的实质是对自然和社会范围内稀缺资源的获取和配置。在获取和配置资源的过程中，人类构建出各种形式的制度加诸经济活动之上。形成了蔚为壮观的经济社会现象。随着新制度经济学逐渐融入主流经济学(其领军人物先后获得诺贝尔奖)，制度，这一一向被视为经济活动的约束条件的外生变量也开始内部化，成为决定经济绩效、解释经济演化的重要内生变量。然而，如何认识和理解制度的本质特征。并进而理解制度的均衡和演化现象，当下占据主流的博弈论制度分析并未取得共识。更为重要的是，基于博弈论的分析范式还存在着较强的局限性。因此，能否跳出博弈论制度分析的框架，选择一个更加适当的切入点对制度进行剖析是制度理论发展的一个新方向。

从系统论的角度看，制度是一个复杂的高维系统，包含成千上万个变量和参量，它们之间相互联系、相互作用，构成了一幅非线性的图像。要对这样多的变量和参量进行分析和计算，不仅在实际上行不通，而且其计算结果也难以检验，所以一个好的经济理论或模型通常是将实际的经济社会制度投影到一个恰当的子空间上去。这个子空间具有较低的维数，但反映了所讨论的制度问题的本质特征。近年来，从个体认知这一制度现象的子空间出发来探讨制度发育及演化的文献大量涌现，诺斯(North)等学者也承继哈耶克的理论思路，从信念、学习等角度重新诠释制度内涵。展现出制度分析新的发展方向。本文的立意即在于拓展这一方向的理论进路，以个体认知调整和共同知识演化为基点，讨论制度的发育、均衡及演化问题，以对相关理论上的争论作出回应。

二、几类典型的博弈制度观

由于博弈论分析工具的引入，近30年来，以个体策略互动为核心的博弈论制度分析取得了极大的进展。大量文献运用重复博弈理论和演化博弈理论对诸如声誉机制、交易制度、自组织体系等自发扩展制度进行建模分析，取得了一大批富有洞见的研究成果。归纳相关文献的理论脉络，博弈论制度分析分别将自发扩展制度看做是博弈的参与人、博弈规则和博弈过程中参与人的均衡策略。纳尔逊(Nelson)明确将自发扩展制度等同于博弈的特定参与人，他声称诸如“行业协会、技术协会、大学、法庭、政府机构、司法等等”都是经济社会制度的组成部分。这一观点与人们日常生活中对制度的看法相似，但问题在于，将制度等同于组织忽略了二者之间的重要差异，以致无法对自发扩展制度展开真正有效的分析。诺斯早期将制度定义为正式或非正式的博弈规则，认为，制度是“人类设计的制约人们相互行为的约束条件”。赫尔维茨(Hurwicz)对这一定义做了更为技术性的处理，从博弈的三要素(参与者、策略空间、支付函数)出发对制度的博弈规则观进行细化。这一定义抓住了自发扩展制度的表象，但仍未触及制度的本质内涵。容易理解，经济博弈中正式规则的确立必须先于博弈过程，而这立刻面临两个问题：谁有激励来制定博弈规则，而谁又有激励来监督规则的实施?因此，仅仅将制度视为博弈规则是无法对经济社会系统中大量的自发秩序作出有效解释的。第三种观点是将自发扩展制度视为博弈均衡。肖特是这一观点的始作俑者，随后诸多学者从两个方向拓展了制度的博弈均衡观。萨金(Sugden)、扬(Young)和鲍尔斯(Bowles)从演化博弈论的角度讨论制度的发育和变迁，他们认为，个体的行为习惯可以自我形成，不需要第三方实施或人为设计。当惯例演化时，个体在进化选择的压力下，倾向于发现某些适应性更强的特征(如认知、偏好、技能等)。这样，习俗惯例与个体特征将共同演化。格雷夫(Greif)、米尔格罗姆(Milgrom)、诺斯和温加斯特(Weingast)则从重复博弈论的角度来讨论制度，把制度看作是重复性囚徒困境博弈下的子博弈精炼均衡。作为子博弈精炼均衡的制度为每个博弈参与人界定了一种行为策略，该策略是在所有可能的博弈状态下行动决策的完备计划，简单地说，制度为个体提供了场景条件下的行动“脚本”。

演化博弈的制度观明显赞成制度乃自组织系统。但是它没有进一步说明该自组织系统得以建立及运作的根源，而是仅仅停留在对它的描述上。重复博弈的制度观假定个体具有完备的演绎推理能力。然而个体如何能够在多重均衡的情况下联合选择相互一致的策略?重复博弈又如何解释制度演化历时结构的多样性?正如青木所指出的，“子博弈精炼均衡理论根本无法解释某种制度出现在此地而非别的地方的原因”。因此，尽管博弈论制度分析接近一般均衡理论，但正是这一看似优点之处也是它在制度分析上的软肋。

如果把自发扩展的制度视为众多参与个体通过行为互动而达成的一个能够自我实施的激励相容的博弈均衡的话，那么关键的问题就是，参与人相互之间如何形成关于博弈的共同认知，并且参与人关于博弈的共同认知与其基于这些共同认知做出选择所导致的实际后果之间的一致性究竟是怎样建立的呢?若这种一致性被打破，制度的变迁方向和演化路径又将如何?这些问题乍看起来像是一个常规的系统均衡的稳定性问题，但其实这些问题比系统均衡的稳定性更为根本，不能简单对待。回答这些问题，将对制度的内涵本质、制度的路径依赖性及突变有更深入的理解，也将对传统的制度博弈均衡观做出重大修正。而这些需要提出一个新的切入点来解剖制度的内涵及其演化机制。

三、认知制度主义

博弈论定义篇5

引言

一、两个简单的例子

1.1 老鹰（Hawk）与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发，以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用，在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处，并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词：沉默互动；社会互动；进化稳定策略；模仿者动态；均衡分析法；局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用？为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现？为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率？诸如此类的问题，新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人（仅研究单个生产者或消费者的行为），不能把其所考察的问题放在一定的环境中去，该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响，单纯考察某个条件与结果之间的一一对应关系。因而，无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中，但依然没能跳出新古典均衡分析法的基本框架，并且由于其对理性赋予更强的假定，使得该理论更加脱离现实。进化博弈理论则一反常规，从一种全新的视角来考察经济及社会问题，它所提供的局部动态研究方法是从更现实的社会人出发，把其所考察的问题都置于一定的环境中进行更全面的分析，因而，其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论，该理论从其理论框架建立到现在仅仅只有近三十年的历史，但其在经济学、社会学、生态学等领域却得到了广泛的应用，近年来已经成为主流经济的研究方法之一。在我国由于历史原因，对经济学的研究起步较晚，特别对进化博弈这样的前沿理论更是知者甚少，本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用，让读者对该理论有一个全面的了解。

本文的结构如下：第一部分给出进化博弈理论的两个典型的例子；第二部分对进化博弈理论的产生及其发展进行阐述；第三部分对进化博弈理论的基本内容进行简要的介绍；第四部分概述进化博弈理论的有关应用；第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性；第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便，本文先给出进化博弈理论中两个具有代表性的例子，在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰（Hawk）与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物，它们为了生存需要争夺有限的资源（如食物或生存空间等）而竞争。老鹰一般比较凶悍，必要时在斗争中直到重伤。鸽子一般比较温驯，竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代，重伤者则不利于其后代生长，即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源，那么老鹰就会轻而易举地获得全部资源，而鸽子由于害怕强敌退出争夺，从而不能获得任何资源（当然不会受伤）；如果群体中两个鸽子相遇并竞争生存资源，由于它们均胆小怕事不愿意战斗，结果平分资源；如果群体中两个老鹰相遇并竞争有限的生存资源，由于它们都非常勇猛而相互残杀，直到双方受到重伤而精疲力竭，结果虽然双方都获得部分生存资源但损失惨重，入不敷出。假定竞争中得到全部资源为50个单位（该数字也可以表示为生物的适应度、繁殖成活率或后代数量）；得不到资源则表示其适应度为零；双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述，博弈的支付矩阵如下：

操作依赖于该群体的初始状态。如果初始时，该宿舍有多于4人使用操作系统，那么该宿舍所有学生最终都会使用该操作系统；否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新，该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架，它结合了生态学、社会学、心理学及经济学的最新发展成果，从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问，是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少，他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版，标志着新古典经济学的成形，马歇尔之后，新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与，也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题，强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的，为了更好地从微观个体行为来解释资源配置问题，新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而，理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力，当代伟大的哲学家康德在其著作《纯理性批判》一书中指出，人类理性即认知能力并不是万能的，而是有限的。经济学中的理性则是指一种行为方式，具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息，并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的，人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后，就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题，传统经济学家们从偏好，信念及理性三个方面来界定经济主体的特征，其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念，个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象，经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观，认为经济系统常常处于均衡状态，非均衡只是一种暂时的现象，当受到外生因素扰动而使系统偏离均衡状态时，系统会以线性的方式回归均衡，这种机械式线性反应的均衡观来源于牛顿力学，由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观，认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的，认为时间是可逆的，即经济变量与物理学的变量一样，只要条件相同系统的均衡也就相同，市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上，传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响，或者当一个因素的影响消除之后，下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的，各种因素之间不可能相互独立，系统中任何一个因素的变动都会引起其他因素的变动，这些因素之间相互作用的时间可能很短也可能很长，各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体，企图通过比较不同均衡来找出系统达到均衡的条件，因此得不出符合现实的结论，其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入，特别近来实验经济学的迅速发展，主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法，其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上，斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始，一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响，心理分析在经济学中的地位慢慢地被降低了；另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始，许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象，宏观经济学也把经验法则和适应性预期纳入到其模型之中，正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而，1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分，经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮，心理的研究方法在经济学界几乎无立足之地，严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期，随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章，如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases，1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk，慢慢消除了经济学界中存在的对心理学分析方法的偏见，此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中，心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s，随着经典博弈理论、生态理论及心理学理论研究的深入发展，特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖，极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动，并形成分散的非同质的知识，其中“感知秩序”是指人的理解力、知识和人类行动之间的关系；其次表现为个体通过学习所达到的理性程度的有限性，组织学习个体学习行为的整合而形成的多层次“理性结构”，个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用，在这个过程中，个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的，因为人类认知能力有着心理的临界极限，人类进行推理活动需要消耗大量的能量，推理也是一种相对稀缺的资源，另外决策者决策时需要大量的信息，而这些信息是不可能免费获得的，获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力，经济主体的决策行为并非总是最大化的结果，其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下，由于参与人无法免费获得决策所需要的全部信息，并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此，参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响，不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果，即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年，他与有着深厚数学及哲学背景的心理学家特韦尔斯基（Tversky）提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学，使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定，更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”，经济学直面现实。如何从有限理性出发来研究参与人的行为，许多经济学家对之进行了广泛而深入的研究并提出了许多理论，在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释，1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现，动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而，博弈论是研究完全理性的人类互动行为时提出来的，为什么能够解释根本无理性可言的动植物的进化现象呢？我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论，生态演化的结果却能够利用博弈理论来给予合理的解释，这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外，1960年代生态学理论研究取得突破性的进展，非合作博弈理论研究成果也不断涌现并日趋成熟，进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议，争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的，而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为，因此，借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出，越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功，利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此，利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件，那么参与人是如何作出决策的呢？进化博弈理论在处理有限理性参与人决策问题时，常常假定参与人遵循某种比贝叶斯法则更简单的行为规则，这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择，这样参与人只要知道什么会发生，而不必知道为什么会发生。

1970年代，生态学家Maynard Smith and Price（1973）结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略（Evolutionarily stable stragegy ESS），目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后，生态学家Taylor and Jonker（1978）在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态（Replicator Dynamics）。至此，进化博弈理论有了明确的研究目标。

1980年代以后，随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识，有限理性概念得到了学术界的普遍认可，加之进化博弈理论在解释生态现象时获得的巨大成功，特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议，正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展，并使之逐渐转化为描述经济行为的理论。目前，进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此，它仍然处于不断发展和完善的阶段，但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法，从而得到了越来越多的经济学家、社会学家、生态学家的重视，我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果，并以有限理性的参与人群体为研究对象，利用动态分析方法把影响参与人行为的各种因素纳入其模型之中，并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史，初看起来使人觉得奇怪，因为博弈论常常假定参与人是完全理性的，而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略，那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一，但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈，他们没有特定的博弈对手 ④。在这种情况下，参与人既可以通过自己的经验直接获得决策信息，也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息，还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说，观察群体行为的历史即估算群体分布是非常重要的，首先，群体分布包含了对手如何选择策略的信息。其次，通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰，模仿是学习过程中的一个重要组成部分，成功的行为不仅以说教的形式传递下来，而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的（Naive），其决策不是通过迅速的最优化计算得到，而是需要经历一个适应性的调整过程，在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此，系统均衡是达到均衡过程的函数，要更准确地描述参与人行为就必须考察经济系统的动态调整过程，动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究，在研究生态现象时，生态学家常常把同一个生态环境中所有种群看作一个大群体，由于生物的行为是由其基因唯一确定的，因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后，整个群体就相当于一个选择不同纯策略（纯策略集的数目就相当于群体中的种群数）的个体。群体中随机抽取的个体两两进行的都是对称博弈，有些文献中称这类模型为对称模型（Symmetry model）。严格地说，单群体时个体进行的并不是真正意义上的博弈，博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈，该生态环境中有两个种群老鹰与鸽子，它们代表两个不同的纯策略，用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略，此时的博弈并不是在随机抽取的两个个体之间进行，而是每个个体都观察群体状态（选择老鹰策略与鸽子策略个体数在群体中所占的比例），给定此状态它就可以计算自己选择不同策略所得的期望支付（严格地说这并不是期望支付，但为了说明的方便本文仍然借用该概念）进而确定选择哪一个策略不选择哪一个策略，对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的，他在传统单群体生态进化模型中通过引入角色限制行为（Role Conditioned Behavior）而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分，此时可以从大群体中区分出不同的小群体，群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈，有时又称之为非对称模型（Asymmetry model）。如果我们把系统选择博弈中的宿舍变成学校（整个学校相当于一个大群体）而把十个人变成十个班（每一个班看成是一个小群体，且同一班的同学无角色区分即与单群体情形一样），每个班的学生都有多种选择，此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进，由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论，这就说明在多群体博弈中，传统的进化稳定均衡概念就显示出其局限性了。同时，在模仿者动态下，同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的，进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势，因而，理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响，一般比较复杂，但该类模型却能够更准确地描述系统的行为，近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price（1973）及Maynard Smith(1974)在研究生态演化问题时提出来的，其直观思想是：如果一个群体（原群体）的行为模式能够消除任何小的突变群体，那么这种行为模式一定能够获得比突变群体高的支付，随着时间的演化突变者群体最后会从原群体中消失，原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态，此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price（1973）对进化稳定策略的定义（此后本文称之为原初定义），用符号表示如下：

说是进化稳定策略，如果，存在一个<，不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵；y表示突变策略；是一个与突变策略y有关的常数，称之为侵入边界（Invasion Barriers）；表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径，也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质，而落于吸引域范围之外是不考虑的，所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中，当该生态环境中只有老鹰（或只有鸽子）时，这时系统已经处于均衡状态，但它们都是不稳定的均衡，因为这两个均衡都可以被突变者侵入。开始时，假定该生态环境处于老鹰均衡，如果由于某种原因而进入鸽子时，那么随着时间的演化，整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态，即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为，当系统处于纯策略所表示的状态时，只要存在突变者系统就会离开这种状态，所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样，即当系统处于一半是老鹰一半是鸽子时，如果由于某种因素使得系统偏离该状态，那么系统会自动恢复到原来状态。另外，在系统选择博弈中突变者、侵入边界就更为明显，所谓突变者即是指选择进化稳定策略以外的策略者，且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡（），前一个均衡所对应的侵入边界就是，也就是说如果选择操作系统的学生数占群体总数的比例大于（即学生数大于4），那么选择操作系统的突变者就不可能侵入到该群体中，如果选择操作系统的学生数占群体总的比例小于（即学生数小于4），那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制，如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用，随着学术界对进化博弈理论研究的深入，许多理论家们从不同的角度对最初定义进行了拓展，如Selten 1980首次给出了适应于描述多群体均衡的定义；Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义；Foster and Young（1990）首次给出了适应于描述连续随机系统的均衡定义等等（有关对进化稳定策略进行拓展的讨论见文献[5]）。最初定义是在解释生态现象时提出来的，如果进行经济分析，时需要进行相应的改变。在分析生态现象时，把每一个种群的行为都程式化为一个策略，因此进化的结果将会是突变种群的消失（消失的原因在于生物的行为是由其遗传基因唯一确定的）。如果用于经济分析，那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略（因为人类可以通过学习、模仿等来改变自己所选择的策略）。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合，在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念，不能描述系统的动态性质，用数学语言来说它是动态系统的不动点，纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略，它是纳什均衡的精练，文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中，按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡，但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件，在某种程度上，较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究，该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制：选择机制(Selection Mechanism)和突变机制（Mutation mechanism）。选择机制是指本期中能够获得较高支付的策略，在下期被更多参与者选择；突变是指参与者以随机（无目的性）的方式选择策略，因此突变策略可能获得较高支付也可能获得较低支付，突变一般很少发生。新的突变也必须经过选择，并且只有获得较高支付的策略才能生存（Survive）下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究，由于他们考虑问题的角度不同，对群体行为调整过程的研究重点也就不同，因而提出了不同的动态模型，如Weibull(1995) 提出的模仿动态（Imitation Dynamics）模型，认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为；Börgers and Sarin(1995，1997)等提出并应用强化动态（Reinforcement Dynamics）来研究现实中参与人的学习过程；Skyrms (1986) 引入了意向动态（Deliberational Dynamics）模型对哲学中的理性问题进行了讨论；Swinkels(1993)提出了近似调整动态（Myopic Adjustment Dynamics）；Borgers and Sarin(1995)提出了刺激—反应动态（Stimulus-Response Dynamics）等等。到目前为止，在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态（Replicator Dynamics）。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker（1978）提出的模仿者动态的微分形式：

化的而且因素之间的互动作用也是需要时间的。因此，均衡只是一种暂时现象或者在多数情况下，系统根本不可能达到的现象，要更准确地考察参与人的行为就必须运用系统论的观点，把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中，经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国，对人类互动行为的研究至少可以追溯到三国时期田赛马的故事，但作为一种正式理论提出来，一般认为是始于冯·诺意曼和摩根斯藤（Von Neumann and O. Morgenstern, 1944）出版的《博弈论与经济行为》一书，直到纳什（Nash 1950）在研究非合作博弈的基础上提出著名的纳什均衡（Nash Equilibrium）概念才使得博弈论成为一门完整的理论。经过近五十年的发展，终于在1994年，三位杰出的博弈论大师：纳什（John F. Nash）、泽尔藤（Rechard Selten）和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖，在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角，使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具，其应用相当广泛。在信息经济学中得到了充分的应用，1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下，每一个人单独偏离均衡都不会变得比不偏离好，显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中，并认为现实中参与人不是孤立地作出自己的决策，每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息，而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先，博弈论中的互动是一种“沉默互动⑨ ”，这种互动不允许参与人之间存在任何形式的交流，即假定参与人都是一个个只会理性计算的孤立经济人而非社会人，一旦引入社会互动，许多博弈都无法进行分析，也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次，博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的，并且理性是共同知识，博弈时如果某一方选择了非理，那么博弈就无法进行下去。特别地该理论在利用后向归纳法（Backward Induction）对纳什均衡进行精练时，不但要求参与人完全理性，而且还要求参与人的行为满足序贯理性（Sequential Rationality）要求。这一比理性更强的要求使得博弈论更加远离现实人。再次，在处理参与人所面临的不确定性时，不仅要求各参与人知道世界的各种状态，而且要求参与人知道每一种状态所出现的概率，并且给定一个先念信念，当出现任何新信息时，每个参与人都能够应用贝叶斯法则修正自己的先念信念，也就是说参与人不但具有很强的计算、推理能力，而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下，参与人并不都具有这种计算、推理能力。最后，博弈论碰到了其最棘手的问题就是多重均衡的处理，当博弈出现多重均衡特别是多重严格纳什均衡时，尽管许多理论家提出了一些方法（Selten（1965）提出的子博弈精炼纳什均衡概念，Selten（1975）提出的颤抖手精练纳什均衡，Kerps—wilson(1982)提出的序贯均衡，Schelling（1960）提出的聚点均衡等）来处理多重均衡问题，但始终没能获得一致认可的结论。

与新古典经济学相比，经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系，但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架，这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素，依然认为影响因素与决策结果是一一对应的关系，依然没能把参与人所处社会环境等因素纳入到其模型之中，因而不能准确地描述现实中人的决策行为，其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果，从西蒙提出有限理性（Bounded Rationality）的参与人群体出发，通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟，实现了经济学研究方法革命性的突破。与传统均衡分析法相比，进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应，因而，经济系统是常常处于均衡状态的，分析参与人的行为只需要研究均衡结果，并以此来预测经济人的行为，通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响，使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定，直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中，认为经济系统达到均衡需要一个长期的渐进过程，均衡结果依赖于达到均衡的过程，也就是说任何一个结果都是路径依赖的，它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的，所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中，强调系统达到均衡的过程，并认为经济系统由于受到各种互动行为及互动因素的影响，有些系统达到均衡可能只需要很短的时间，有些系统达到均衡可能需要很长的时间，有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义，如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素，如果不考虑时间因素有些政策可能很有效率，但纳入时间因素，一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径，这样有利于决策者控制经济系统使之朝向既定的目标前进，也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素，使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡，然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件，即比较静态法，最后结合条件找出希望达到的均衡，因此，该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题，在老鹰与鸽子博弈中，尽管全是老鹰（全是鸽子）都是均衡的，但这两个均衡都极不稳定即都不是进化稳定均衡，一旦有鸽子（老鹰）突变者进入该系统就会使系统偏离，随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰（该均衡是一个全局吸引子）；在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡，局部动态法引入了突变因素就能够很好地解决了均衡选择问题，即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时，系统就会对其他的突变策略具有一定程度（即在突变边界内）的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为，并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难，因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈，在该博弈中两个囚徒都从个体理性出发，但得到了集体非理性均衡的结论。也就是说，均衡分析法根本无法实现从个体行为向集体行为的过渡，在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发，利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点，在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系，很巧妙地避开由个体行为向集体行为转化问题，因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论，它来源于对生态现象的研究，虽然该理论应用于经济分析的时间不长，但它为经济学研究提供了一个全新的分析方法，较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且，应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果，能够更加现实地解释经济现象，因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释： ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖，这样假定的意思就是说后代继承其母体的策略，并且永远不改变，当然用于研究人类的行为时，需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样，只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象，并且，在重复动态博弈中，后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念，然后，在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下，每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上，这与Selten提出的颤抖手均衡概念具有相似性，所谓颤抖手均衡是指一个战略组合，只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡，其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义，但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换，可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出，募捐者要求每一个人都自愿捐款，最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者，为了使得博弈能够分析下去，募捐者要求自愿捐款时每个人都不得与其他人讨论，否则该博弈就无法进行下去，因此，本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性，即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯（1999）：《博弈论平话》，中国经济出版社。

[2] 张维迎（1999）：《博弈论与信息经济学》，上海三联出版社。

[3] 张良桥，冯从文（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。

[4] 张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。

[5] 张良桥（2003）：《论进化稳定策略》，《经济评论》，2，70-74。

[6] 张良桥，郭立国（2003）：《论模仿者动态》，《中山大学学报自然科学版》，3。

[7] 杨小凯（2000）：《新兴古典经济学和超边际分析》，中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

[41] Young, H. P. (1998a): “Individual Learning and Social Rationality”, European Economic Review, (52): 651-663.

博弈论定义篇6

[关键词]自由贸易政策保护贸易政策博弈论囚徒困境重复博弈

一、国际贸易政策概论

国际贸易政策是各国在一定时期内对进口和出口贸易所实行的政策,是各国政府为了某种目的而制定的对外贸易活动进行管理的方针和原则。纵观世界各国的对外贸易政策,基本上有两种类型:一是自由贸易政策,二是保护贸易政策。自由贸易政策是一种既不限制进口,也不控制出口的贸易政策。其主要内容是国家取消对进出口贸易的限制和障碍,取消对本国进出口商品的各种特权和优惠,使商品自由进出口,在国内外市场上自由竞争。保护贸易政策则是一种限制进口,同时鼓励出口的贸易政策。其主要内容是国家广泛利用各种限制进口的措施,以保护本国市场免受外国商品的竞争,并对本国出口商品给予优惠和补贴以提高其国际竞争力,使出口贸易不断扩大。

自由贸易政策主要流行于资本主义自由竞争时期,而英国是最早实行该政策的国家,它最先完成产业革命,是19世纪最强大的工业国家,其为当时的世界工厂,商品销向全世界,原料、食品购自全世界。这就决定英国必须冲破国内保护贸易的限制,积极推行自由贸易政策。自由贸易政策为经济实力强制国家所采用,为国内成长产业集团所推动,它们是主要受益者。对经济实力薄弱的国家及幼稚产业,却意味着市场被外国占领,它们是主要受害者。因而自由贸易被认为是“强者”的政策。从世界范围来看,1860~1880年这20年间,是自由贸易的黄金时代,它是与资本主义自由竞争时代相适应的。随着自由竞争向垄断的过渡,自由贸易又逐渐为保护贸易所代替。从19世纪80年代到第二次世界大战前的60年间,是自由贸易衰亡时期。内维尔•张伯伦曾说:只有《进口关税法》这样的政策才能够救帝国。甚至连保守党领袖斯坦利•鲍德温都说,自由放任已经走到尽头,就如同奴隶贸易一样。

70年代中期以后,资本主义国家的经济发展开始出现“滞胀”局面,尤其是美国贸易逆差的迅速攀升,使得美国率先采取了保护贸易政策,这种贸易保护主义以非关税壁垒为主要工具、以陷入结构性危机和具有尖端技术的产业部门为保护重点、以“公平贸易”为旗号,为与传统的贸易保护相区别,故称之新贸易保护主义。至此,保护贸易政策蔓延全球。

从世界经济的大角度来看,保护贸易政策和自由贸易政策像孪生兄弟在不同国家、一国之内不同发展时期,同时存在并交叉地使用着,两者又似乎不可调和。自由贸易有益于整个世界和各国的福利增加,保护贸易不利于各国经济和世界经济的发展,因而各国应当积极采取自由贸易政策。但是,从各国的局部利益来看,由于世界各国的政治、经济发展不平衡,自由贸易给各国带来的利弊、得失显然是有较大差异的,发达的国家越是自由贸易,获益越多;而发展中国家在国际分工中处于不利地位,因此如果实行完全的自由贸易,将给它们带来种种损害或损失。由此可见,任何一个国家都不可完全依赖实行某个贸易政策,自由贸易政策和保护贸易政策的综合运用才是当今国际贸易发展的有效途径。

二、国际贸易政策中的非合作博弈

博弈论,亦名“对策论”、“赛局理论”,属应用数学的一个分支,目前在很多学科都有广泛的应用。主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。具有竞争或对抗性质的行为称为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。

一般认为,博弈主要可以分为合作博弈和非合作博弈,目前经济学家们现在所谈的博弈论一般是指非合作博弈。非合作博弈是指一种参与者不可能达成具有约束力的协议的博弈类型,这是一种具有互不相容味道的情形。非合作博弈研究人们在利益相互影响的局势中如何选择决策使自己的收益最大,即策略选择问题。各国的贸易政策是策略互动的,具有鲜明的博弈特征。

周娈娈在《从博弈的角度看国际贸易政策》中曾论述道:“在国与国之间的国际贸易中,对于一个追求国民福利最大化的国家来说,在任何情况下都不会选择单方面的自由贸易措施。”两国的贸易需要在博弈中保持“合作”策略,双方加强互信与合作,从博弈中达成利益均衡,以实现双赢。

经济的互补性和经贸合作的互利性国际贸易的基础,两国在长期的贸易博弈中保持有利于双方的博弈赢得、有利于稳定和促进中美经贸关系、有利于共同的经济发展。尽管在这个重复博弈中的某一个阶段博弈中,还是要重视非合作博弈中的策略分析和选择,但更重要的是要看到中美双方在贸易博弈中由非合作博弈向合作博弈的转化是有很大必要性的。

三、国际贸易政策中的合作博弈

重复博弈是一种特殊的博弈,在博弈中,相同结构的博弈重复多次,甚至无限次。其中,每次博弈称为“阶段博弈”。在重复博弈中,每个参与人可以使自己在每个阶段选择的策略依赖于其他参与人过去的行为。也就是,如果重复博弈无限次,双方就可能从不合作逐渐走向合作,从而获得合作收益。

囚徒困境是博弈论的非零和博弈中具代表性的例子,在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。背叛的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。两国贸易时,都会下意识地摆脱囚徒困境,而谋求一种相对稳定的长期合作关系,使得双方的福利都达到最大化,也由此从非合作博弈转化到合作博弈。例如,双方会通过缔结贸易协定,相互削减关税及其他贸易壁垒来促成国际贸易的长期开展,同时,也由协议来约束双方的贸易行为。

参考文献:

[1]冯宗宪.国际贸易理论和政策[M].西安:西安交通大学,2009.

[2]陈善步,林杰.保护贸易政策的演变及成因分析[J].全国商情•经济理论研究,2008,(8).

[3]周娈娈.从博弈的角度看国际贸易政策[J].北方经济,2007,(18).

博弈论定义篇7

博弈论研究的是各博弈方之间的对抗、竞争或面对一种局面的对策选择行为。会计准则作为一种公共选择的公共契约与博弈论有着广泛的联系，准则的制定是一个博弈的过程，形成是博弈的均衡。而准则是否有效率，要看博弈是否充分，是否遵循一贯性，即：制定最优和执行最优的统一。本文拟就会计准则制定的博弈过程对我国会计准则的启示作一探讨。

一、博弈论与会计准则

博弈论追求的理想境界是达到帕累托最优的纳什均衡，然而其理论体系又就不同情形作了深入细分，并分别讲述它们各自的均衡，使得这一研究更为精确。会计准则追求的是哪一种理想的博弈均衡？博弈论按博弈各方面是否达成一个有约束力的协议可以划分为合作博弈和非合作博弈。就此而言，会计准则似乎是合作博弈，因为准则通过政府颁布，具有强制执行的约束力。但如果准则没有得到很好地执行，特别是像我国目前会计信息严重失真、违反准则司空见惯，人们就会对其合作性表示怀疑；按博弈各方行动的先后顺序可以划分为静态博弈和动态博弈。前者是指各博弈方同时选择行动或虽非同时但后行动者并不知道前行动者采取了什么行动，相反则为动态博弈。WWw.133229.CoM由于会计信息本身具有完全透明性，因此从这个意义上讲，会计准则制定是动态博弈。从博弈各方对对手的特征、战略空间和支付函数的知识，博弈可分为完全信息博弈和不完全信息博弈，信息越完全，越有利于准则制定的充分博弈，其效果越好。会计准则制定的发展过程就是由不完全信息博弈向完全信息博弈发展的过程，博弈各方信息不对称，必然引起会计信息使用者之间的冲突和对抗，从而产生了博弈，直到信息对称达到均衡为止。综上所述，会计准则的理想模式是完全信息动态的合作博弈形成的“子博弈精炼纳什均衡”下的合作博弈。在这种均衡战略的组合下，就理性人而言，打破这种均衡的成本大于其收益，没有任何人有积极性打破这种均衡，因而达到帕累托最优，社会效益最大化。当然理想的模式是难以实现的，会计准则制定过程应积极创造有利于博弈充分的条件去接近这种理想模式。

二、西方会计准则制定的博弈过程

研究西方会计准则制定的博弈过程是为了认清博弈的动因，熟悉其博弈机制，了解其博弈的演进过程。作为促进我国会计准则的建设的借鉴。

1.从会计准则的属性看博弈的动因。有关会计准则的属性目前形成了三种不同的观点，分别是：技术手段论、具有经济后果的行为规范论和政治化程序论。三种观点的形成可以说是从三个不同的角度说明了会计准则的属性，也是会计的艺术多样性的表现。正是由于会计准则具有不同的属性才使得会计准则制定表现为一个具有多种势力、因素的博弈过程。

首先就其技术手段属性而言。我们知道会计是具有技术性的经济活动，其确认、计量和报告有许多方法和技术问题。准则的制定要看其技术是否可行，会计环境是否允许，是否与客观经济条件和实务处理相符。会计准则的技术属性是其博弈动因的基础，在会计准则制定的博弈过程中，技术性是首先必须考虑的因素。其次就其具有经济后果的行为规范属性而言，不同会计准则约束会计系统生成的会计信息并不是抽象的，这些数字代表了不同的经济意义，它将影响企业、政府、工会、投资人和债权人的决策行为及相关方的利益。显然，会计准则不再是一种纯粹的技术手段，不同的准则将生成不同会计信息影响到不同会计主体利益。会计准则制定过程成为博弈各方为实现自身经济利益最大化的博弈过程。以股东和债权人的博弈关系为例，我们深入讨论其博弈过程。股东总是希望公司的财富更多地从债权人转移到股东手中，提高其对企业的净资产要求权，其采取的方法有：（1）提高股利发放水平；（2）将所贷资金投资于高风险资产；（3）再借入具有优先偿还权或者是提前入款项。对此，债权人为保护自身的利益，也会采取一定的策略防范股东的上述行为，最终双方博弈达到均衡-即制定符合双方利益的合约，在会计准则中规定：（1）限制股利发放水平；（2）限制企业的一些生产性投资，尤其是避免高风险项目投资；（3）对企业有关融资政策加以规定，不得任意借人具有优惠条件的款项；（4）要求企业定期向债权人提供财务报表等有关信息，用以评价企业的财务状况。再分析会计准则制定的政治化程序属性。在西方社会中，经济和政治是一组很难区分的概念。经济人为了实现自利的目的往往会利用政治手段，从这一意义上讲，会计准则制定过程中政治行为是经济后果的直接延伸。会计准则的政治属性强调准则的“强权博弈”，准则往往被认为是一种能实现政府既定目的的手段，政府及其它权力机构往往会干预准则的制定过程，通过权力强制某一准则的通过与执行。因此准则制定的政治化程序属性表现为政府及其它权力与机构为实现政治目的而釆用的博弈手段。例如，1962年美国会计原则委员会通过了第2号意见书，要求对投资贷项按“递延法”进行处理。投资贷项就是公司在进行固定资产投资时，政府给予的税收减免，这是美国国会为了刺激当时处于低谷的美国经济，增强美国企业在国际上的竞争力而采取的一项措施。采用递延法自然较为“系统、合理”，也与权责发生制等原则“内在一致”，但这使得美国政府的减税政策，在企业财务报表上得不到充分体现，政策刺激经济发展的效果就受影响。为此，美国国会通过证券交易委员会施加压力，迫使会计原则委员会了第4号意见书，允许企业在“递延法”和“流尽法”中选用。

总之，会计准则的三种属性为准则制定的博弈过程提供了内在动因。技术属性是博弈的基础，经济后果属性是博弈的目的，政治化程序属性表现为一种为实现政治目的的博弈手段。

2.从会计准则制定的模式看博弈机制。会计准则的制定机构、制定人员、制定程序等制定要素的相互结合和方式称为会计准则的制定模式，准则的制定模式为准则的制定的充分博弈提供了机制保障。下面从准则制定模式的几个要素来看西方会计准则制定的博弈机制。就会计准则的制定机构而言，有民间组织如美国、英国，半官方组织如日本，官方组织三种。通常情况下民间组织具有超然中立的特点，半官方组织次之，而官方组织则难以具有超然中立特点。民间组织更容易沟通政府与民间的关系，协调各方利益，吸收相当数量具有较高素质的专家，遵循科学的制定程序，这样更有利于准则的制定的充分博弈。就制定人员而言，准则的制定人员是准则制定的核心，制定人员是准则制定博弈过程直接参与者，其代表的广泛性和层次的多样性是准则制定博弈充分的保障，不同国家、地区、组织的会计准则制定人员的构成、层次诸多方面既有类似之处，也存在着较大的差异。人员代表广泛性最为典型的是国际会计准则的制定，国际会计准则委员会理事会负责批准国际会计准则和征求意见稿，它由13个国家的会计专业团体的代表组成。国际会计准则委员会筹划小组成员来自财务会计和财务报告方面的专家。每一届筹划小组主席都由委员会的代表出任，除主席外小组通常包括至少3个其他国家会计机构的代表，还包括其他组织如咨询小组的代表。筹划小组的职责是：协助国际会计准则委员会复核、分析和起草国际会计准则。就制定程序而言，科学的制定程序是会计准则制定充分博弈和高效率的重要保证，具体准则的制定程序一般包括计划阶段、研究阶段、起草阶段和征求意见四个阶段，然而不同国家会计准则制定程序不尽相同，并没有一个统一的程序，但必须遵循基本原则。即：会计准则制定程序应该规范化；会计准则制定程序应与制定机构、制定人员配合协调；会计准则制定程序中必须有严格的表决、批准程序。

3.从以美国为代表的西方会计准则制定的博弈演进，看准则制定的博弈发展过程。美国会计准则（规则）制定的历史演进可以划分为三阶段：1906年以前为经营者独享会计规则制定权时期。由于当时缺乏相应的制度安排，众多的企业股东与人数很少的经营者就会计规则的制定进行谈判的交易成本太高，为了获得合作剩余，博弈的结果是：股东们只好放弃参与会计规则的制定权，让经营者独享之。但由于经营者滥用会计规则的制定权，典型的是铁路公司经营者对会计规则制定权的滥用，将资本直接转化为剩余方式发放“自杀性”巨额股利，而股东却将此资本回收作为资本报酬，于是股票上扬，公司又筹集到更多的资本。但这个循环最终被打破，给进行长期投资股东带来了巨大损失，这样引起了长期投资者的愤怒，同时，对收费率管制的呼声触发了会计准则制定博弈变迁，于是形成了第二个阶段，即1906～1933年政府与经营者共享会计准则制定时期。1909年美国开征了公司所得税，进一步促使美国政府介入会计准则的制定。1917年美国联邦储备委员会了一份叫做“统一会计”的文件来规范企业向银行贷款时的财务报表的编制，它标志统一会计准则的形成。第三阶段是从1933年至今。政府享有一般会计准则的最终表决权，准则的制定表现为多种势力博弈的结果。如果说在上述第二阶段的会计准则制定中的政府还是“犹抱琵琶半遮面”的话，那么，1929年由于会计信息严重失真助长了纽约股票市场的崩溃及随后长达数年之久的大萧条的来临，使得美国政府走上了会计准则制定的前台。现在我们来具体审查美国会计准则博弈的演进。1933年《证券法》授权联邦贸易委员会制定统一会计准则，1934年《证券交易法》授权成立证券交易委员会这一新机构取代联邦贸易委员会制定会计准则，证券交易委员会成立后就是否由其自己来制定会计准则展开了激烈的论争，最终于1938年作出决定把制定权转授给注册会计师职业界，后又转授给美国财务会计准则委员会（fasb）。fasb由四个委员会组成，具有广泛的代表性，准则制定要经过系列的博弈程序充分的博弈。但证券交易委员会保留了监督权和最终否决权。

从以上美国会计准则制定演进过程可以发现，尽管其历史演进是曲折的，但其总趋势是由私人非经博弈的安排演变为公共契约充分博弈的合约安排，是基于现代企业发展而织的一张庞大无比的社会经济关系网博弈的必然结果。现在这张网伴随着国际经济一体化已经并在继续跨越国界，由区域而全球化。欧盟已在协调活动，国际会计准则委员会（iasc）及其制定的国际会计准则影响力增大，并有少数国家或地区已直接用它作为本国（地区）的会计准则。且现在该委员会又与“国际证券委员会组织（iosco）”这一管理国际资本市场的官方组织携手合作。但另一方面保护主义和国家民族主义的声音也从未停歇过……这一切似乎都在暗示：会计准则的制定、演进是多种势力博弈暂时均衡的结果。但我们现在唯一能确知的是根据历史发展趋势，会计准则制定的博弈将会朝国际协调化方向演进。

4.借鉴与启示。从会计准则的属性而言，既然会计准则有较强的技术性，因此准则制定应尽可能有序、系统、内在一致，要通过准则的实施有效地促进完善会计实务。由于会计准则具有经济后果，因此，最完美的会计准则，并不一定代表了最公允的经济后果。事实上，由于经济人的自利行为和一些强有力利益集团的存在，现实生活中被采纳的往往也不是具有最公正经济后果的经济行为。强调会计准则的政治化意义必然将会计准则纳入政府的宏观管理制度中去，这样一来，准则在一定意义上就会成为政府的法规、制度的一部分，成为实现宏观政治目的一种手段。从会计准则的制定模式而言，机构上要具有独立性和权威性；人员上要有广泛性和多层次性；程序上要具有科学规范性以保障准则制定充分博弈。从会计准则制定的博弈演进过程而言，其博弈过程是逐渐演进的，是由不充分博弈发展到更充分博弈，直至更接近纳什均衡条件，博弈次数越多，完善程度越高，局中人之间的关系便越接近“纳什均衡条件”。

三、从会计准则制定的博弈过程看我国会计准则

我国会计准则是在相当困难的条件下，在借鉴和创新的基础上形成的，它体现了中国特色和与国际惯例接轨相结合的思想，本着高起点、快速度、低费用、重质量的态势，作出了国外同行们需要几十年时间才能完成的事情。由于我们起步晚，准则形成会计环境和社会环境尚不健全，准则制定尚有许多弊端，重新修订与完善势在必行，笔者就此谈几点看法。

1.博弈的动因不强烈。从准则的技术属性而言，从事实务工作的会计人员普遍技术水平不高，缺乏充分博弈的能力，缺乏参与博弈的意识。从经济后果属性而言，由于国有股大股东缺位，关联方利用内幕信息获得暴利，法人治理结构不完善，公司内部缺乏制约机制，会计信息失真盛行，违反准则司空见惯，使得会计准则本身的经济后果属性大打折扣。从政治化程序的属性而言，我国准则体现政府的目的更多，“强权博弈”表现突出，所以从一定意义上说我国现形准则是政府的一种制度安排，是一种未经博弈的选择。这样大大约束了准则制定的充分博弈，不利于准则的健康发展。

2.博弈的机制不健全。（1）准则的制定者-博弈人员代表性不足。会计准则是会计理论通往会计实务的桥梁，这就决定了准则的制定既要有理论界的代表又要有实务界的代表参与。会计准则既有许多方法、程序和技术性的评价与选择问题，又有各种利益的协调问题，为了协调各方的利益，准则的制定人员应是各种利益群体代表。我国准则制定人员代表性的缺乏，主要体现在其所代表的利益主体的单一性，因为会计实务人员是结合在组织的利益主体之中的。从目前来看，无论是起草小组还是核心小组的成员，几乎全是技术型的政府官员，他们仅仅是政府机构以及基于国有企业的国有资本所有者的利益代表。然而我国社会主义市场经济体制是一种国有经济起主导作用，多元经济利益并存的经济，目前已存在大量的外资企业、中外合资企业、民营企业，这部门集团的利益必须得到相应肯定。另外就股份制企业而言，作为投资者，国有资本所有者仅是企业利益相关者之一，且与企业的其他投资者及债权人等处于平等的地位。还有随着公司制改造的深入和证券市场的发展，股权的社会化程度得到提高，出现了数量可观的公众持股人，这些人的利益同样需要法律和法规给予均等的重视和保护。如果他们的利益要求在准则中不能得到足够的重视和考虑，那么企业就有可能通过违法的方式去实现它们的利益目的。近年来出现的较严重的会计信息失真问题，在某种程度上可以说是准则制定中的代表性不足的必然结果。（2）会计准则的制定机构-博弈机制缺乏独立性。在我国，会计准则制定机构为财政部会计司，准则制定人员先是会计司会计准则组成员，后来扩大到会计司专业技术人员。虽然制定机构不是问题的关键，但一定形式是内容的保证。准则制定机构的这种官方身份可能产生对各方利益顾及不周全等弊端。事实上，现在我国准则表现的这种官方安排未经博弈的结果，很难说与这种博弈机制无关，在这种博弈机制下，准则的博弈程序流于形式，征求意见往往难以得到重视，即使得到重视也难在准则中有体现。这种模式下节约了谈判成本和交易成本，却极大地提高了运行成本和监督成本。

3.约束力不够，准则表现的合作博弈性受到质疑。会计准则作为一种公共契约，也作为政府宏观制度的一部分，具有约束力，表现为合作博弈。但由于我国法制尚不健全，会计环境尚未完善，也由于准则制定的强权博弈官方安排，许多利益集团的利益没有得到反映，导致有意歪曲反映会计信息，甚至成为一种数字游戏，其可信度和利用价值大大降低，反过来又产生了道德风险，形成“有则不依，执则不严，违则不纠，纠而无力”的现象。

四、结束语

一方面，会计准则制定过程是一种由多方利益集团参与的博弈过程，要使其博弈充分，需要有强烈的博弈动因，完善的博弈机制来表现制定过程的决策民主主体；另一方面，会计准则的演进又是多次博弈的结果。一轮博弈结束后，会计准则便达到了暂时的纳什均衡状态，但随着社会经济环境的发展和变迁，旧的准则规范又不能涵盖新的会计业务或发现漏洞，会再次引起政府和市场主体之间的博弈，其结果是达到新的纳什均衡，这样经过多次博弈之后，会计准则就不断得到发展和完善，社会公认程度日益提高，纳什均衡点逐步由低层次向高层次递进，最终趋向于帕累托最优的状态。因此我们认为，会计准则的选择过程是一个社会博弈过程，是一个能够促进社会福利最大化的帕累托优化过程。

我国会计准则尚处于博弈的初级阶段，离“纳什均衡”还有一定距离。为此，需要加快现代企业制度建设，进一步明晰产权；提高注册会计师的公正化程度，加强法制，增强准则制定人员的代表性，改善准则制定机构，健全准则制定程序；要让政府、投资者与企业通过多次博弈使各自的利益得到更好的兼顾。只有这样，才能使我国会计准则博弈真正做到公平、公开、公正，从而达到一个理想的“子博弈精炼纳什均衡”状态。

参考文献：

[11张维迎。博弈论与信息经济学[m].上海：三联出版社，1996.

[2]谢识予。经济博弈论[m].上海：复旦大学出版社，1997.

[3]刘　峰。会计准则研究[m].大连：东北财经大学出版社，1996.

[4]阎达五，耿建新。我国会计准则述评[j].会计研究，1997，（1）。

博弈论定义篇8

关键词：学校制度；演进机制；内生博弈分析

中图分类号：G47

文献标识码：A 文章编号：1672-4038（2013）08-0050-06

内生博弈分析方法是美国斯坦福大学教授青木昌彦引入比较制度研究中的。他把博弈分析当做“一种解释制度的博弈论的分析方法”，把由一组参与人组成的交易领域作为制度理论的基本分析单位。他认为，制度“既是博弈规则，也是博弈均衡”。博弈规则“是在一个相关的领域内参与人通过互动而内生的，因此它们是自我实施的”。行动选择规则均衡呈现出点状形态。行动选择规则的均衡就是制度的本质特征。他还构建了解释制度变迁的博弈结构模型（COSE）。这些探索富有启发性，得到了学术界的高度肯定。近几年来，我国学界以新制度经济学为视角研究学校制度的成果并不鲜见，但运用博弈论分析学校制度的成果则不多见，应该指出，内生博弈分析方法是适用于学校制度分析的，因为从新制度经济学，特别是从交易成本经济学的观点看，学校和企业都是作为市场的延伸和替代而出现的，都是由一组参与人组成的交易领域。不同的是学校用教育服务进行交易，而企业用物品和服务进行交易。

学校制度演进的内生博弈分析，是指以办学领域为基本分析单位，以办学领域参与人有限理性为假设，运用博弈论揭示学校制度的内涵、本质特征和演进机制的一种科学方法。办学参与人的行为选择是一种博弈。任何博弈都是有限理性的博弈。假设办学领域每个参与人没有关于由技术决定的行为选择规则的全部知识，他们对办学环境和其他参与人的行为选择都不可能做出完美的推断，他们依据自己的推断来选择有利于实现自身收益最大化的行为。在支持对学校制度演进展开内生博弈分析的因素中，特别值得关注的有以下几点：（1）学校制度作为办学领域参与人行为博弈的规则具有内生性：（2）学校制度是办学领域参与人行为博弈均衡的本质特征，这种均衡不是渐进式的，而是点状型的：（3）外生博弈分析关注学校制度演进的环境，而内生博弈分析关注学校制度演进的机制。

一、办学领域参与人行为博弈的内生规则

办学领域外的政治环境、经济环境、文化环境和社会环境等，是学校制度演进的外生变量：办学领域的参与人集合、参与人行为选择规则集合和参与人行为选择集合，是学校制度演进的内生变量。假定每个时期每个参与人都对自己参与办学的行为作出选择，并试图使其收益最大化，那么，各参与人之间的行为选择就是一种内生博弈。这种博弈的实质是基于效率提高的利益再分配，是行为选择整体福利的增加。参与人是指参与办学的组织和个人。其中包括：组织之间的博弈，包括学校与政府之间的博弈、学校与企业之间的博弈和学校与学校之间的博弈等：组织与个人之间的博弈，包括学校与教师之间的博弈和学校与学生之间的博弈等；个人之间的博弈。包括各教师之间的博弈、教师与学生之间的博弈和各学生之间的博弈等。一定时期参与人行为选择的集合，反映了与所有参与人利益组合相关的行为选择环境。这种利益组合，包括教育资源在各学校之间的最终配置、公共教育产品的配置水平和最终分配、教育产品（公共的和私人的）在受教育者之间的最终分配、教师的福利待遇、教育投资的回报等。每个参与人的最佳行为选择，取决于他对当前办学环境和其他参与人行为选择预期的推断的合理性。

当参与人行为选择的环境处于稳定状态时，一些行为选择的盛行规则就会被所有参与人所采用。假定参与人行为选择的重复博弈，最终演化出一个参与人行为选择的稳定状态，那么，每个参与人就会根据行为选择的盛行规则，对其他人参与人的行为选择，作出有限理性的推断，并选择自己的行为。当一些参与人行为选择规则持续稳定地得到所有参与人认可，并得到持续稳定地自我实施时。这些规则就在参与人行为选择过程中内生出来的。所以，参与人行为博弈的内生规则，是对学校制度的微观规定。一定时期该参与人行为博弈出的所有内生规则，构成了其内生规则集合。这种集合就是学校制度的内涵。

当参与人行为选择的整体状态处于不稳定时，一些参与人发现自己的行为选择未能达到预期目的，他们会尝试新规则，于是，原先那些盛行的规则集合就会被打破。当采用新规则所达到的更好结果被越来越多的参与人观测到时，那些还没有采用新规则的参与人，会改变他们对其他参与人行为选择的预期。也会加入到尝试新规则的行列中。当新规则在博弈中被越来越多的参与人所采用并达到了行为选择预期时，它就会成为参与人自我实施的新规则，于是，旧规则集合被打破，新规则集合得以建立。这就是学校制度的演进过程。

与内生博弈分析不同的是，外生博弈分析通常在办学领域之外寻找学校制度演进的原因，通常把学校制度简单当做立法者、政治家、教育学家、经济学家等人制定的结果。如果一种办学规则是立法者、政治家、教育学家、经济学家等人有意识安排的，那么，当参与人的稳定行为模式与这种外生行为选择规则不一致时。这种外生行为选择规则就不能被当做学校制度的组成部分，因为这个外生行为选择规则不是参与人自我实施的规则。例如：政府可以通过制定“就近入学”规则来禁止义务教育阶段学生择校，但学生家长可通过权力、关系和金钱而规避这种规则，“就近入学”规则某种程度就形同虚设，无法被当做一种自我实施的学校制度。如果学校制度不是自我实施的，那么就得有对实施方面的监督。谁来监督？如何保证监督不偏离学校制度所要达到的目标？监督者是否也要有人监督？这势必导致循环论证问题。

承认参与人行为博弈的内生规则是学校制定的本质规定，当然不是否定学校制度存在“人为设计”的一面。一个特定参与人的行为博弈往往存在多重均衡。如果这种博弈只存在一个均衡解，那么该均衡就不是学校制度，而是博弈背后隐藏的办学技术条件。所以，学校制度的“人为设计”是找出那个与办学环境相适应的均衡解。这意味着，参与人行为博弈的内生规则一旦产生出来，就反过来规制着参与人的行为博弈，而这种规制在一定时期内，通常又具有持续性和稳定性特征，它反映了学校制度是参与人行为博弈均衡的本质特征。

二、办学领域参与人行为博弈的点状均衡

参与人行为博弈总要面对不断变化的办学环境，但无论办学环境发生怎样的变化，只要参与人行为博弈的各个内生规则被当做自我实施的规则，它们就处于自我实施的持续稳定状态。一定时期内，一种内生规则的持续稳定状态，呈现出点均衡特征，全部内生规则的持续稳定状态，呈现出点集合均衡特征，即学校制度的本质特征。这里所说的点状均衡的含义与生物学家高德和艾尔乔奇所提出的生物进化点平衡的概念基本一致的。高德和艾尔乔奇认为，点变化主宰生命的历史，大多数物种进化，在地质时间上表现出长期静态停滞和无明显方向的轻度波动，他们被地质瞬间变化的物种形态所打破，从而形成新的点平衡。尽管学校制度演进与物种进化有所不同，但借鉴物种点平衡的概念来描述学校制度的博弈均衡，是十分贴切的。

如图1所示，若用圆I和Ⅱ分别表示两个时期的办学环境，且办学环境I和Ⅱ内含点状均衡集合sI和SⅡ，分别包括：学校与教师之间博弈内生规则的均衡点a和A；学校与学生之间博弈内生规则的均衡点b和B；各教师之间博弈内生规则的均衡点c和c；教师与学生之间博弈内生规则的均衡点d和D；各学生之间博弈内生规则的均衡点e和E；各学校之间博弈内生规则的均衡点f和F；学校与政府之间博弈内生规则的均衡点g和G；学校与企业之间博弈内生规则的均衡点h和H。那么，这两个集合就是对这两个时期的不同学校制度的点状均衡的描述。在办学环境I中，各均衡点发生的时间顺序，是以学校制度演进的初始状态为依据的。各均衡点实际发生的时间顺序，也许是多种多样的。如：现代学校制度的演进更多是从学校与政府之间博弈的内生规则开始的，但是，无论各均衡点发生的时间顺序是怎样的，都不会改变办参与人行为博弈内生规则的点状均衡特征。

在一定办学环境下，参与人行为博弈内生出代表行为选择规则的均衡点a、b、c、d、e、f、g、h，这些规则一旦被所有参与人所采纳，它们就会成为参与人共同遵守的规则，参与人的行为博弈就会趋向纳什均衡：“n个参与人的一组策略选择，在其他人策略不变的情况下。任何人都不能通过改变策略来使其期望支付到改善。”在办学环境I下，每个参与人都不能通过改变行为规则来改善其预期，他们会按当前办学环境下参与人所共同遵守的规则，来选择自己的行为，使得这些规则对所有参与人的行为选择，具有持续性稳定性的约束，使得均衡点a、b、c、d、e、f、g、h，发生平移直线运动，使得参与人行为博弈，在办学环境I的限制下有点状均衡集合SI。随着办学环境从I向Ⅱ转移，参与人所共同遵守的规则集合。被地质瞬间变化的行为选择规则所打破。这也许是自发尝试的新规则，在某月或某天（地质瞬间）被广泛采用；也许是政府设计的新规则，在某月或某天被付诸实施。于是，参与人所共同遵守的规则，就在地质瞬间从均衡点a、b、c、d、e、f、g、h的平移线上，分别快速移向均衡点A、B、C、D、E、F、G、H的平移线上，新规则集合得以形成。尽管办学环境是不断变化的，但只有当为适应办学环境变化而采用新规则的参与人数，达到其博弈均衡点转移的某种临界点时，博弈内生规则的均衡点才会快速发生转移。所以，这些均衡点的转移不是渐进式的，而是跳跃式的；当均衡点集合从sI转移到sⅡ，旧学校制度就被新学校制度所取代。一个新规则取代一个旧规则，从而表明学校制度发生了部分演进。旧规则全部被新规则所取代，从而表明学校制度发生了整体演进。这种演进的实质，是学校制度的效率提高和整体福利增加。

如果说办学环境变化是参与人行为博弈均衡点发生移动的诱因，那么，参与人的行为博弈是不是他们应对办学环境变化的理性反映呢？如果是，那么学校制度演进就是由办学环境变化单独决定的。这就需要满足如下条件：每个参与人有关于由技术决定的行为选择规则的全部知识，每个参与人对办学环境和其他参与人的行为选择都能做出完美的推断。事实上，这些条件是难以满足的。如果不是，那么参与人的行为博弈又是怎样理性应对办学环境变化的呢？博弈又是如何随办学环境的变化，而从一种内生规则集合向另一种内生规则集合转移的呢？它又是如何从一种点状均衡向另一种点状均衡转移的呢？也就是说，学校制度是如何演进的呢？

三、办学领域参与人行为博弈的演进机制

任何行为博弈都是内容与形式的统一。因此，考察办学领域参与人行为博弈的演进机制，必须与博弈内容联系起来。

参与人的行为博弈，是围绕办学外部环境、内部环境以及参与人个体行为博弈的若干主观条件三大要素而展开行为博弈的。这些要素构成了该行为博弈的内容。办学外部环境包括办学的技术条件、国情和世情、办学的资源禀赋和办学领域外的其他制度等。办学内部环境包括参与人集合、参与人行为选择规则集合和参与人行为选择集合。办学外部环境和办学内部环境，是参与人个体无法控制的。由它们组成的博弈结构，是参与人的客观博弈结构。参与人个体行为博弈的若干主观条件，包括参与人个体对办学环境、办学内部环境和其他参与人行为选择的推断，以及自己的行为选择预期、自己采用的行为选择规则和自己从事的行为选择等。参与人个体行为博弈的各个主观条件，是参与人个体可控制的。由它们组成的博弈结构，是参与人个体的主观博弈结构。当参与人客观博弈结构发生变化时，即使所有参与人的行为都按纳什均衡原则行事，其行为博弈也客观上定义了一个新的更好地与参与人客观博弈结构相适应的规则及其集合。一些参与人可能察觉到这种变化，他们可能积极行动起来，通过采用新规则来寻求其行为选择收益的最大化。

事实上，在一定的学校制度下，一个参与人可以重复地使用某一规则，来对办学环境变化条件下的其他参与人的行为选择预期、规则以及选择行为进行推断，并调整自身的行为选择。这也是一种参与人个体主观博弈结构适应参与人客观博弈结构的调整，不过，这种调整只是参与人个体主观博弈结构的再现。而不是参与人个体主观博弈结构质的变化。只有当参与人个体采用新规则从事行为选择时，其个体主观博弈结构才会发生质的变化。当采用新规则从事行为选择的参与人数量，增加到引起主观博弈结构集合质变的临界点时，参与人个体主观博弈结构的集合就会发生质的变化。这种质变意味着，参与人行为博弈从一种连续性稳定性规财和点状均衡向另一种连续性稳定性规则和点状均衡转移。

然而，从博弈内容上对参与人行为博弈演进机制的这种考察，只是问题的一个方面，问题的另一个方面是该演进机制的形式是如何表现的，因为任何内容都要由形式来表现。如果说，参与人行为博弈的演进机制，在博弈内容上可定义为参与人个体主观博弈结构适应参与人客观博弈结构变化的演进机制，那么，这种演进机制在形式上又是什么呢？

办学领域参与人的行为博弈通常呈现出两种形式：市场寻找和政府设计。前者导致拉坦所说的由需求主导的诱致性制度变迁，后者导致林毅夫所说的由供给主导的强制性制度变迁。市场寻找的内生规则和点状均衡的演进。是办学市场的参与人在给定的行为选择规则集合中，自发尝试新规则，从而演进出行为选择收益最大化的新规则，并通过其他参与人采用这种新规则的扩散，而推动行为博弈从一种点状均衡向另一种点状均衡转移。政府设计的内生规则和点状均衡的演进，是参与办学的政府，依据某种法律或依据，自己参与办学的行为选择集合，有目的地设计有关行为选择的新规则或新规则集合。当这种设计在实践中与更多参与人的收益预期相一致时，就易于融入参与人个体博弈结构中，就易于得到实施，从而推动行为选择的旧规则集合向新规则集合转移，推动一个旧的点状均衡向一个新的点状均衡转移。

尽管市场寻找的学校制度演进与政府设计的学校制度演进有所不同，但两种博弈形式都必须满足的条件是：参与人普遍把学校制度演进作为适应客观博弈结构变化的理性反映，而将其纳入自己的主观博弈结构中。无论政府设计新规则及其集合，所依据的法律和自己参与办学的行为选择集合，是如何发生变化的，政府设计的预期目的能否达到，总是取决于参与人个体是否依据这种设计，来重新界定自己的主观博弈结构。面对不断变化的办学环境，一种可能是，参与人在现存规则集合中寻找他未曾采用过的规则子集，从而再现自己的主观博弈结构，使得现存学校制度得以维持；另一种可能是，参与人通过对客观博弈结构变化的推断而尝试新规则，从而重新界定自己的主观博弈结构，促使现存学校制度向新学校制度演进。

如图2所示，就每一个办学参与人而言，无论参与人客观博弈结构是否发生了变化，抑或参与人个体对采用现存规则的收益与预期的差异，是否准确作出了判断，只要他是在现存规则集合的限制下选择行为，只要他未采用客观博弈结构变化所定义好的新规则，那就只是他适应客观博弈结构变化而再现自己的主观博弈结构，旧学校制度也就在再现他的主观博弈结构中得以维持。学校制度的演进在于打破旧学校制度，而旧学校制度被打破的触发条件，是教育技术进步、国情和世情的变化、与发达国家比较存在办学效率和质量低下的问题、相关制度变革、政策变化等。这些触发条件使得客观博弈结构变化所定义好的采用新规则的预期收益的可观测特征，逐步显露出来，并逐步被参与人所发现，进而逐步被融入已被参与人客观博弈结构变化所定义好的参与人个体主观博弈结构中。这种融入是参与人重新界定自己的主观博弈结构，而这种重新界定的触发条件是他从新行为选择的反馈中，对办学失效或失范等问题的危害性有了更明确的认识。当市场寻找和政府设计所产生的新规则及其集合，被参与人融入自己的主观博弈结构中，并通过新行为选择的优化反馈而得到加强时，新规则及其集合就会在行为选择的博弈中内生出来，并进入自我实施阶段，参与人行为博弈的点状均衡集合，就会在采用新规则及其集合的行为选择集合中产生出来，新学校制度就出现了。这就是学校制度演进的机制。

如图1所示，在办学环境I下，参与人都不能通过改变行为规则来改善其预期，他们依据当前办学环境下参与人所共同遵守的规则a、b、c、d、e、f、g、h，来选择自己的行为，使得这些规则对所有参与人的行为选择都有持续性稳定性的约束作用，使得参与人行为博弈，在办学外部环境和内部环境的共同限制下，有了点状均衡集合sI；随着参与人博弈客观结构变化所定义好的个体主观博弈结构的重新界定，以及采用现存规则的收益与预期之间的差异，通过其可观测特征的参数而为参与人所发现。新规则就以市场寻找或政府制定的形式建立起来。采用新规则使其预期得以改善，说明新规则是对博弈客观结构变化所定义好的新规则及其集合的合理反映，从而使得参与人重新界定自己的主观博弈结构，使得新规则在行为选择中被广泛采用。于是，参与人所共同遵守的规则，就在某月或某天（地质瞬间）从均衡点a、b、c、d、e、f、g、h的平移线上，分别移到均衡点A、B、C、D、E、F、G、H的平移线上，办学参与人行为博弈，就在某月或某天从点状均衡集合SI移到点状均衡集合SⅡ。学校制度的演进就是这样发生的。由于博弈的内生规则是与行为选择的效率提高和整体福利增加相关的，所以，集合SI向集合SⅡ的转移，是一个低效的学校制度向一个高效的学校制度的演进。

博弈论定义范文

博弈论定义篇1

博弈论定义篇2

博弈论定义篇3

博弈论定义篇4

博弈论定义篇5

博弈论定义篇6

博弈论定义篇7

博弈论定义篇8

热门文章更多>

热门推荐更多>

精品范文更多>

博弈论定义范文

博弈论定义篇1

博弈论定义篇2

博弈论定义篇3

博弈论定义篇4

博弈论定义篇5

博弈论定义篇6

博弈论定义篇7

博弈论定义篇8

热门文章 更多>

热门推荐 更多>

精品范文更多>

热门文章更多>

热门推荐更多>