博弈论的局限性范文

时间：2023-10-10 13:10:43

博弈论的局限性篇1

博弈论又称为“对策论”，一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象，因此很多领域都能应用博弈论，例如军事领域、经济领域、政治外交，解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。

博弈论的研究开始于本世纪，1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成，随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖，使博弈论在经济领域中的地位和作用得到权威性的肯定。

2．博弈论的基本原理和方法

文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来，博弈论模型可以用五个方面来描述

G={P， A， S， I， U}

P：为局中人，博弈的参与者，也称为“博弈方”，局中人是能够独立决策，独立承担责任的个人或组织，局中人以最终实现自身利益最大化为目标。

A：为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限，可分为有限博弈和无限博弈，后者表现为连续对策，重复博弈和微分对策等。

S：博弈的进程，也是博弈进行的次序。局中人同时行动的一次性决策的博弈，成为静态博弈，如齐威王和田忌赛马；局中人行动有先后次序，称为动态博弈，如下棋。

I：博弈信息，能够影响最后博弈结局的所有局中人的情报，如效用函数，响应函数，策略空间等。打仗强调“知己知彼，百战不殆”，可见信息在博弈中占重要的地位，博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息，如果博弈各方对各种局势下所有局中人的得益状况完全清楚，称之为完全信息博弈（game with complete information），例如齐威王和田忌赛马，各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈（game with incomplete information），例如投标拍卖，博弈各方均不清楚对方的估价。在动态博弈中还有一类信息：轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈（game with perfect information），例如下棋，双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”（game with imperfect information）。由于信息不完美，博弈的结果只能是概率期望，而不能象完美信息博弈那样有确定的结果。

U：为局中人获得利益，也是博弈各方追求的最终目标。根据各方得益的不同情况，分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系，争取双赢的局面。

还有另一类型博弈称为多人合作博弈，例如安理会投票表决，OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上，它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域，特征函数表示各个联盟的得益（N是局中人的数目），它的分配解必须符合一定的合理性和稳定性，它的解的概念也发展成多种多样，包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要，针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。

不管博弈各方是合作、竞争、威胁还是暂时让步，博弈论模型的求解目标就是使自身最终的利益最大化，这种解建立在对方也采取各自“最好策略”为前提，各方最终达到一个力量均衡，也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。

3、博弈论与电力市场

博弈论是研究市场经济的重要工具。电力作为特殊的商品，它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中，遇到很多前所未有的新课题，运用博弈论来分析解决其中一些问题是一个研究方向。用博弈论模拟电力市场，模拟的结果可能更加接近实际，为市场模式设计提供依据。另外，电厂或用电用户作为市场的参与者，可以用博弈论来分析市场，研究如何报价获利最大。

正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如：力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法；而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题：如何识别合作伙伴，结盟利益如何在联盟内分配。电力市场环境下，电网输电作为一项服务，它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解：稳定集，核心，核仁，Shapely值等，如何合理选择或创造最接近实际的解的概念也是面临的课题。

博弈的结果是依赖于拥有的信息，采用什么样的信息披露政策是设计电力市场模式的一个方面。例如：电厂竞价上网，一个成功的报价不仅取决于自己的实力，还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息，因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来，博弈的实验结果也为电力市场披露怎样的信息提供依据。

博弈论和电力市场理论都是很年轻的科学，两者都有广阔的发展天地，两者的结合可以互相促进。

4、博弈论在电力市场中的应用

4.1自备电厂与公用电网之间的交易

开放发电市场的进程中，拥有自备电厂的用户是一类特殊的市场参与者，它既是用电用户，也可以是电力的供应者。随着电力市场深入发展和工业的进步，自备电厂将成长为一支生力军。

文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户（NCP）对定价的影响作用。NCP既可以从公用电网购电，也可以自己发电来满足自身需求。为解决两者的冲突，作者提出了三种博弈模型：非合作Nash博弈模型，合作博弈模型和超博弈模型。作者构造了三个局中人：公用电网，普通用户，带自备电厂的用户（NCP），并且假设它们的需求函数、边际成本、收益函数等均是线性的，通过数字模拟得出了一些有趣的结果：①NCP的加入促使公用电网降低出售给NCP的电价；②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进：①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况；②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场，如果公用电网规模很大，NCP数目很多但规模小，考虑Stackerlberg模型更符合两者实际；③该文假设公用电网的目标函数是整个社会利益最大化，而并非是自身利益最大化，这个假设不符合电力市场需要解除管制的发展方向。

文献[ 6]部分解决了以上问题，它重点放在自备电厂和公用电网相互作用的方式的选择：公用电网回购NCP多余电力（buy-back system）或者公用电网收取NCP运转电力的过网费（wheeling charges）。该文分析了在不同市场环境下，各方的得益情况，得出了一些可能只有用博弈论才能得出的结论。

4.2区域间输电交易分析

互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析，得出双方都可接受的交换功率和交易价格。在此基础上，文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策，采取合作型对策，应用 Nash谈判公理作为仲裁程序，决策出双方都可接受的交换功率和交易价格。应该指出，白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息，又应该如何分析处理呢？这个问题值得进一步深入探究。

4.3转运市场中电网的固定成本分摊问题

运转市场中一个难题是网络输电服务定价，这个定价能够给网络使用者一个信号，以达到全网最优化；并且能够补偿网络的投资者，网损、变动成本、固定成本等费用在网络使用者中合理分摊；同时能够正确激励网络增容。节点实时价格（nodal spot price）制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资，为了解决双边贸易中输电系统固定成本公正分摊问题，作者提出了基于多人合作博弈模型，可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点：①使用“核仁”而不用Shapely值，因为“核仁”处于核心，分配值更加稳定和易于被各方接受；②提供了一种激励，减轻线路过载。

4.4 基于Pool或PX模式的多边贸易市场

电力市场环境下的博弈具有行动策略随机性、信息隐蔽性，这些特点都给建模和计算造成困难，从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中，通常需要假设或者估计对方的信息，方法各有特色。

在文献[10]作者认为在完全竞争的市场环境下，市场参与者相对于市场规模都显得很小，市场影响力很小。在这种情况下，优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场，单个市场参与者对市场是有影响力的，其模型本质上属于不完全信息的非合作博弈。例如：每个参与者只知道自己的成本信息，而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题：在无法完全了解对方的信息情况下，参与者如何投标（选择高价投标还是低价投标）才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类，并对每一类的可能性进行概率估计，形成一个概率意义上的期望收益矩阵，用Nash平衡点的概念求解矩阵，得到问题的解。

文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时，都同时执行以下两个步骤：①对可能的合作对象按照一定的指标进行优先排序；②按照谈判优先顺序，逐一进行讨价还价，谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类，并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作，互相交换共享所拥有的信息，联合成博弈的一方，剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值，作为与B合作的优先指标。对每个局中人都进行一遍以上计算，得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序，各方同时进行合作谈判，谈判要解决如何合理分配或均衡比单干多出的利益。

该文关键的一点：正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息，并用这种反馈来更新自己的知识库，提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点：计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。

对于多边贸易模式的电力市场，文献[13]提出了多理论模型，解决贸易合作问题，文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段：①确定自身成本等信息；②与对方互相交换信息，互相寻求合作伙伴；③按照预先设定的准则和协议进行联合分组，形成一个谈判对象优先顺序表，这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表；④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行，直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况，但是模型仍偏于简单。

4.5用博弈论解释和实现算法

文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下，竞争各方均以实现自身利益最大化为目标，旋转备用的约束变得软起来，PX（power exchange）机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。

作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的，松弛旋转备用的乘子被看作是提供备用的价格信息，各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整（例如：为t时段负荷）。根据优化原理，如果拉格朗日函数存在鞍点，则鞍点是原问题的最优解。

鞍点的概念与博弈论中的Nash平衡点有非常相似之处，如以上公式所示。基于此想法，作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益，它控制的决策变量是p，u（p向量表示各机组分配的有功，u向量表示机组启停），目标是使整个系统成本最低。另一个局中人Q，是一个假想的发电商，它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价，最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论，作者设计了自适应的次梯度算法寻求平衡点，其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数该函数将映射到备用容量的两种水平之间（例如：5%Dt-%Dt，Dtt时段负荷），形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数，模型可细分为两种：Nash模型（不了解对方反应函数）和Stackelberg模型（Q了解P的反应函数），作者认为后一种模型掌握的信息较多，因此收敛的速度和优化的效果梢好于前一种模型。

用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学，不过它更具有人的逻辑思维的色彩，融合了一些用别的方法难以表达的信息。

5、结论

博弈论的局限性篇2

[关键词]自由贸易政策保护贸易政策博弈论囚徒困境重复博弈

一、国际贸易政策概论

国际贸易政策是各国在一定时期内对进口和出口贸易所实行的政策,是各国政府为了某种目的而制定的对外贸易活动进行管理的方针和原则。纵观世界各国的对外贸易政策,基本上有两种类型:一是自由贸易政策,二是保护贸易政策。自由贸易政策是一种既不限制进口,也不控制出口的贸易政策。其主要内容是国家取消对进出口贸易的限制和障碍,取消对本国进出口商品的各种特权和优惠,使商品自由进出口,在国内外市场上自由竞争。保护贸易政策则是一种限制进口,同时鼓励出口的贸易政策。其主要内容是国家广泛利用各种限制进口的措施,以保护本国市场免受外国商品的竞争,并对本国出口商品给予优惠和补贴以提高其国际竞争力,使出口贸易不断扩大。

自由贸易政策主要流行于资本主义自由竞争时期,而英国是最早实行该政策的国家,它最先完成产业革命,是19世纪最强大的工业国家,其为当时的世界工厂,商品销向全世界,原料、食品购自全世界。这就决定英国必须冲破国内保护贸易的限制,积极推行自由贸易政策。自由贸易政策为经济实力强制国家所采用,为国内成长产业集团所推动,它们是主要受益者。对经济实力薄弱的国家及幼稚产业,却意味着市场被外国占领,它们是主要受害者。因而自由贸易被认为是“强者”的政策。从世界范围来看,1860~1880年这20年间,是自由贸易的黄金时代,它是与资本主义自由竞争时代相适应的。随着自由竞争向垄断的过渡,自由贸易又逐渐为保护贸易所代替。从19世纪80年代到第二次世界大战前的60年间,是自由贸易衰亡时期。内维尔•张伯伦曾说:只有《进口关税法》这样的政策才能够救帝国。甚至连保守党领袖斯坦利•鲍德温都说,自由放任已经走到尽头,就如同奴隶贸易一样。

70年代中期以后,资本主义国家的经济发展开始出现“滞胀”局面,尤其是美国贸易逆差的迅速攀升,使得美国率先采取了保护贸易政策,这种贸易保护主义以非关税壁垒为主要工具、以陷入结构性危机和具有尖端技术的产业部门为保护重点、以“公平贸易”为旗号,为与传统的贸易保护相区别,故称之新贸易保护主义。至此,保护贸易政策蔓延全球。

从世界经济的大角度来看,保护贸易政策和自由贸易政策像孪生兄弟在不同国家、一国之内不同发展时期,同时存在并交叉地使用着,两者又似乎不可调和。自由贸易有益于整个世界和各国的福利增加,保护贸易不利于各国经济和世界经济的发展,因而各国应当积极采取自由贸易政策。但是,从各国的局部利益来看,由于世界各国的政治、经济发展不平衡,自由贸易给各国带来的利弊、得失显然是有较大差异的,发达的国家越是自由贸易,获益越多;而发展中国家在国际分工中处于不利地位,因此如果实行完全的自由贸易,将给它们带来种种损害或损失。由此可见,任何一个国家都不可完全依赖实行某个贸易政策,自由贸易政策和保护贸易政策的综合运用才是当今国际贸易发展的有效途径。

二、国际贸易政策中的非合作博弈

博弈论,亦名“对策论”、“赛局理论”,属应用数学的一个分支,目前在很多学科都有广泛的应用。主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。具有竞争或对抗性质的行为称为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。

一般认为,博弈主要可以分为合作博弈和非合作博弈,目前经济学家们现在所谈的博弈论一般是指非合作博弈。非合作博弈是指一种参与者不可能达成具有约束力的协议的博弈类型,这是一种具有互不相容味道的情形。非合作博弈研究人们在利益相互影响的局势中如何选择决策使自己的收益最大,即策略选择问题。各国的贸易政策是策略互动的,具有鲜明的博弈特征。

周娈娈在《从博弈的角度看国际贸易政策》中曾论述道:“在国与国之间的国际贸易中,对于一个追求国民福利最大化的国家来说,在任何情况下都不会选择单方面的自由贸易措施。”两国的贸易需要在博弈中保持“合作”策略,双方加强互信与合作,从博弈中达成利益均衡,以实现双赢。

经济的互补性和经贸合作的互利性国际贸易的基础,两国在长期的贸易博弈中保持有利于双方的博弈赢得、有利于稳定和促进中美经贸关系、有利于共同的经济发展。尽管在这个重复博弈中的某一个阶段博弈中,还是要重视非合作博弈中的策略分析和选择,但更重要的是要看到中美双方在贸易博弈中由非合作博弈向合作博弈的转化是有很大必要性的。

三、国际贸易政策中的合作博弈

重复博弈是一种特殊的博弈,在博弈中,相同结构的博弈重复多次,甚至无限次。其中,每次博弈称为“阶段博弈”。在重复博弈中,每个参与人可以使自己在每个阶段选择的策略依赖于其他参与人过去的行为。也就是,如果重复博弈无限次,双方就可能从不合作逐渐走向合作,从而获得合作收益。

囚徒困境是博弈论的非零和博弈中具代表性的例子,在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。背叛的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。两国贸易时,都会下意识地摆脱囚徒困境,而谋求一种相对稳定的长期合作关系,使得双方的福利都达到最大化,也由此从非合作博弈转化到合作博弈。例如,双方会通过缔结贸易协定,相互削减关税及其他贸易壁垒来促成国际贸易的长期开展,同时,也由协议来约束双方的贸易行为。

参考文献:

[1]冯宗宪.国际贸易理论和政策[M].西安:西安交通大学,2009.

[2]陈善步,林杰.保护贸易政策的演变及成因分析[J].全国商情•经济理论研究,2008,(8).

[3]周娈娈.从博弈的角度看国际贸易政策[J].北方经济,2007,(18).

博弈论的局限性篇3

【关键词】博弈论；纳什均衡；重复博弈

博弈论在现代经济学中占据着相当重要的位置，在微观经济学的本科教学环节中，如果将博弈论这一部分排除在外，那么教学内容是不完整的，并且和现代微观经济学的发展严重脱节。但是由于课时以及学生接受能力的限制，对博弈论的内容进行全面深入地讲解难以做到，因此，将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。在博弈论的基本概念当中，最重要的当属博弈均衡的概念，这些概念的掌握有助于学生把握博弈论的整体框架，并对博弈论的后续学习至关重要。因此，本文将主要的博弈均衡概念进行分类和表述，并对不同的博弈概念进行比较，以期对博弈论的教学有所助益。

一、博弈的主要类型

博弈构成的基本要素包括：1、参与人（1～N）；2、各个参与人各自可选择的行动集合Ai={ai}；3、参与人i的策略Si，给定信息集，该策略决定在博弈的每一阶段他选择的行动；4、参与人的收益Ui （S1，S2…SN）。依据不同的分类标准，博弈可以被划分为不同的类型。

1、静态博弈、动态博弈和重复博弈

博弈各方同时选择策略的博弈称为静态博弈，如猜硬币、投标等，静态博弈一般可以用支付矩阵来表达。动态博弈是指博弈各方按照一定的先后次序进行策略的选择，典型的例子如对弈，动态博弈一般可以用“博弈树”来表达。Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表和对弈的简称而来。重复博弈是指同一个博弈（静态或动态）反复进行所构成的博弈过程，如体育比赛中的多局赛制等。

2、完全信息和不完全信息博弈

完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈，不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。

3、完美信息和不完美信息博弈

在动态博弈中，一参与人完全了解在自己行为之前的博弈进程，则称此参与人为有完美信息的参与人，如果博弈中所有的参与人都具有完美信息，则称此动态博弈为完美信息的动态博弈。反之，如果在存在具有不完美信息的参与人（参与人不完全了解自己行为之前的博弈进程），则称此动态博弈为不完美信息动态博弈。

4、合作博弈与非合作博弈

合作博弈允许参与人之间自愿签订有约束力的协议，而非合作博弈的参与人则完全按照个人理性做出策略的选择。在囚徒困境博弈中，非合作博弈得到的结果是双方均坦白，而在合作博弈的情况下则可能得到双方均不坦白的更好的结果。

5、完全理性和有限理性博弈

由具备完全理性的参与各方所进行的博弈称为完全理性博弈。存在有限理性博弈方的博弈称为有限理性博弈。

将上述不同的博弈类型进行组合，可以得到更多类型的博弈，如不完全、完全信息博弈和静、动态博弈可以组合为不完全信息静态博弈、不完全信息动态博弈，完美完全信息博弈、完美不完全信息博弈、不完美不完全信息博弈等。

二、博弈论主要的均衡概念

1、上策均衡

如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策，那么该策略组合称为一个上策均衡。

2、纳什均衡

（1）纯策略纳什均衡

在博弈G={S1……Sn；u1……un}中，如果由各个博弈方的各一个策略组成的某个策略组合（s1*，……sn*）中，任一博弈方的策略si*，都是对其余博弈方策略组合s-i*的最佳策略，即：

ui（si*， s-i*）≥ui（si， s-i*）对于任一（（1～N））都成立，则称（s1*，……sn*）为一个“纯策略纳什均衡” 。

（2）混合策略纳什均衡

混合策略：在博弈G={S1……Sn；u1……un}中，博弈方i的策略空间为Si=（si1……sik），则博弈方i以概率分布（pi1……pik）在其策略空间中进行选择，由此形成的策略称为“混合策略”。其中0≤ pij≤1，且。

将纯策略拓展到混合策略，相应的纳什均衡称为混合策略纳什均衡。事实上，纯策略纳什均衡是混合策略纳什均衡的一个特例。根据纳什定理我们知道，每一个有限博弈（参与人和策略空间均为有限）均存在至少一个混合策略的纳什均衡。

3、防共谋均衡

如果一个博弈的某个策略组合满足以下要求：1、没有任何单个博弈方的偏离了会改变博弈的结果；2、给定选择偏离的博弈方有再次偏离的自由时，没有任何两个博弈方的串通会改变博弈的结果；3、以此类推，直到所有博弈方的串通都不会改变博弈的结果。满足上述要求的均衡策略组合称为“防共谋均衡”。

4、子博弈完美纳什均衡

如果在一个完美信息的动态博弈中，各博弈方的策略构成一个策略组合满足：在整个动态博弈及它所有子博弈中都构成纳什均衡，那么这个策略组合成为该动态博弈的一个“子博弈完美纳什均衡”。

5、颤抖手均衡

如果有限策略博弈的一个纳什均衡满足对每个博弈方i都存在一严格混合策略序列{}，使得（1），（2）对于任意正整数m，都是纳什均衡，那么，称为一个“颤抖手均衡”。这里的严格混合策略指的是每一个策略都有一个正的被选取的概率。

6、完美贝叶斯均衡

当博弈的一个策略组合及其相应的判断满足以下要求时，称为一个“完美贝叶斯均衡”：

（1）在各个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的判断，对非单节点信息集，一个判断就是博弈达到该信息集中各个节点的概率分布，对单节点而言，则可理解为判断达到该节点的概率为1。

（2）给定各博弈方的“判断”，他们的策略必须是“序列理性”的。所谓序列理性是指在各个信息集，给定轮到选择博弈方的判断和其他博弈方的后续策略，该博弈方的选择及其后续策略必须使自己的期望收益最大化。

（3）在均衡路径上的信息集初，判断由贝叶斯法则和各博弈方的均衡策略决定。

（4）在不处于均衡路径上的信息集处，判断由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。

7、贝叶斯纳什均衡

在静态贝叶斯博弈中G={A1，…，An；T1，…，Tn；p1， …，pn；u1， …un}中，如果对任意博弈方i和他的每一种可能的类型，Si*（ti）所选择的行动ai都能满足：

max

则称策略组合S*=（S1*，…，Sn*）为G的一个贝叶斯均衡。

8、分离均衡和混合均衡

在不完美信息博弈中，在不同情况下（如拥有商品的类型不同）的完美信息博弈方采取相同行为的市场均衡，称为混合均衡（pooling equilibrium）；反之，在不同情况下，完美信息博弈方采取完全不同行为的市场均衡称为分离均衡（seperating equilibrium）。

三、不同均衡概念的比较

上策均衡一般适用于静态博弈，虽然具有很好的稳定性，但是在对博弈进行分析的局限性较强，因为在很多博弈中，并不是所有的参与人都具有上策。在博弈论的各种均衡概念中，纳什均衡处于核心的位置。这是因为：1、纳什均衡是分析博弈的有力工具，可以对大量的博弈结果做出有效地判断，不论是静态还是动态博弈，比如运用纳什均衡可以预测古诺寡头市场上各个厂商的产量，也可以用纳什均衡预测动态的斯塔博格模型中的垄断厂商的产量；2、纳什定理表明了纳什均衡的普遍存在性，这说明了在博弈环境下纳什均衡概念本质上的合理性；3、其他的均衡概念基本上都是由纳什均衡衍生而来，如子博弈完美纳什均衡是将纳什均衡扩展到了每个子博弈上面，贝叶斯纳什均衡则是将纳什均衡延伸到了不完全信息博弈当中。纳什均衡的主要问题首先，一个博弈往往存在多个纳什均衡，而运用纳什均衡概念本身无法再对这些均衡进一步分析；其次纳什均衡不能排除博弈策略中所包含的不可信的行为设定，不能解决动态博弈的相机抉择所引起的可信性问题，这导致了纳什均衡的内在不稳定性。

利用逆推归纳法，子博弈完美均衡有效地排除了纳什均衡中不可信的行为设定，从而提高了纳什均衡的稳定性，但是逆推归纳法也有严重的弱点。首先，逆推归纳法只能分析明确设定的博弈问题，要求博弈的结构，包括次序、规则、和收益情况都非常清楚，并且各个博弈方了解博弈结构，并相互指导对方了解博弈结构，而现实问题往往与这些要求相去甚远；其次对于阶段比较多，比较复杂的动态博弈，比如对弈，运用逆向归纳法的工作量则变得极为庞大，以至于借助计算机也无法完成；如果遇到两条收益相同的路径，逆推归纳法则无法继续进行下去。逆推归纳法更大的问题是对博弈方的理性要求太高，不仅要求所有博弈方都有高度的理性，不允许博弈方犯任何错误，而且要求所有博弈方了解和信任对方的理性，形成“理性的共同知识”，这些条件在现实中同样难以得到满足。

颤抖手均衡的概念在一定程度上解决了子博弈完美均衡和逆推归纳法所遇到的问题。颤抖手均衡考虑到参与人难免会犯一些错误而舍去了由于参与人小概率的偏移而导致整个策略组合不可行的均衡路径，因而具有更高的稳定性。但是颤抖手均衡本身并没有解决博弈方犯错误的问题，因而也不能保证它的预测就是实际博弈的结果。

贝叶斯纳什均衡和完美贝叶斯均衡是针对不完全和不完美信息博弈问题提出的。造成不完全和不完美信息博弈问题的根本原因是参与各方的信息不对称，而这在现实的经济活动中是普遍存在的，如在保险市场、信贷市场、劳动力市场、柠檬市场、拍卖市场上的情形。分析和解决信息不对称问题对经济活动造成的影响是现代信息经济学的核心问题，因而博弈论成为信息经济学研究的有力工具，现代信息经济学取得的迅猛发展和博弈论广泛运用分不开的。完美贝叶斯均衡是针对不完美信息博弈提出的均衡概念，而贝叶斯纳什均衡是针对不完全信息博弈提出的均衡概念。海萨尼通过引入一个虚拟的自然博弈方将原来的不完全信息博弈问题转换为完全但不完美信息博弈问题，使得动态贝叶斯博弈分析就可以利用完美贝叶斯均衡、分离均衡、混合均衡等概念和方法进行分析。

四、结束语

本文对博弈论中主要的均衡概念进行了描述和比较分析。上策均衡是最直观的博弈均衡概念，但适用范围非常有限。纳什均衡是博弈论的理论基石，从本质上刻画了处于博弈环境（即每个参与人的收益受到整个博弈策略组合的影响）的均衡状态。子博弈完美均衡解决了纳什均衡中不可置信威胁的问题，颤抖手均衡将博弈方犯错误的可能性考虑了进来；而贝叶斯纳什均衡和完美贝叶斯均衡则可以用来处理信息不完美和不完全问题。当然，本文所涉及的博弈均衡概念基本上都是关于非合作和完全理性下博弈（颤抖手均衡虽然考虑了博弈方可能会犯错误的可能性，但这并不意味这博弈方的有限理性）。关于合作博弈和有限理性博弈也发展出了一些均衡概念，如纳什谈判解、夏普利值、进化稳定策略等，另外关于非合作博弈也有一些均衡概念本文没有涉及。随着博弈论理论的不断发展和实际运用的日趋广泛，博弈均衡的概念将会得到不断地精炼和更新。

参考文献：

[1]谢识予，经济博弈论（第三版）[M]，复旦大学出版社，2006。

[2]朱.弗登伯格，让.梯若尔，博弈论[M]，中国人民大学出版社，2002。

作者简介：

博弈论的局限性篇4

本文以进化博弈理论的基本均衡概念----进化稳定策略的提出、发展及不断完善为主线，在指出原初概念缺陷的基础上，文章从非对称博弈、有限群体、随机因素及动态过程四个方面分别介绍了博弈论理论家们对该概念的拓展。

关键词：进化稳定策略；渐近稳定性；严格N群体ESS；随机稳定集；群体稳定集

引言

进化博弈理论来自于达尔文的生物进化论，至少自雷威丁(Lewontin 1960）用于解释生态现象 ②就已经产生了。但直到1973年梅纳德·史密斯和普莱斯（Maynard Smith and Price）、梅纳德·史密斯（1974）提出了该理论的基本均衡概念----进化稳定策略[3]（evolutionary stable strategy, ESS）及泰勒和乔克（Taylor and Jonker）提出该理论的基本动态概念---模拟者动态以后，进化博弈理论得到了理论界的普遍关注。特别是1992年关于进化博弈理论发展的国际学术会议在康奈尔大学的召开，正式确定了进化博弈理论在经济学上的学术地位，此后，该理论在经济学便上获得了迅速的发展及广泛的应用。越来越多的经济学家运用进化博弈理论来分析诸如社会制度变迁[阿克赛尔罗德和米尔顿(Axelrod and Hamilton 1981)；阿克赛尔罗德（1984)]、行业发展趋势[波特Porter 1980)]、股市发展方向［康利斯克（Conlisk 1980）；利奈尔和罗尔（Cornell and Roll 1981)］、消费者对品牌的选择[凯思和史培罗（Katz and Shapiro 1985）]、社会学习过程[弗登博格（Fudenberg 1995）]及社会习俗形成[彼特·杨，（H. Peyton Young 1993，1998）等领域的相关问题。进化稳定策略是进化博弈理论最基本的均衡概念，它具有广泛的应用并在发展中得到了不断完善。本文以进化稳定策略概念的发展为主线来介绍博弈论理论家们对它在不同条件下的拓展。

一、原初ESS定义及其缺陷

在梅纳德·史密斯和普莱斯(1973）；梅纳德·史密斯(1974）提出进化稳定策略概念以前，进化博弈理论的发展还仅仅处于萌芽阶段。在这一时期生态学家们主要应用纯数学理论如极限环、分岔、奇异吸引子（罗森，Rosen 1970）等概念来描述生态演化系统并用于解释生态现象，同时把生物之间的互动行为纳入到进化模型之中(威尔·艾德瓦兹，Wynne-Edwards 1962)，他们处理问题的方法已经蕴含了进化博弈理论的基本思想。

在七十年代，生态学理论和博弈理论在各自领域中都获得了迅速的发展，同时实验经济学作为一门学科也获得了经济学界的一致认同，这些条件为进化论与博弈论的结合提供了理论和现实基础。生态学家梅纳德·史密斯和普莱斯(1973）在总结以前理论的基础上，提出进化博弈理论的基本均衡概念----进化稳定策略③ ，该均衡概念的提出使得进化博弈理论的研究有了明确的方向，为进化博弈理论的进一步发展奠定了坚实的基础。

所谓进化稳定策略就是指：如果占群体绝大多数的个体选择进化稳定策略，那么小的突变者群体就不可能侵入到这个群体。或者说，在自然选择压力下，突变者要么改变策略而选择进化稳定策略，要么退出系统而在进化过程中消失。下面我们给出梅纳德·史密斯和普莱斯(1973）所定义的进化稳定策略（文献[3]对此有详细的介绍）：

说是进化稳定策略，如果，存在一个④，不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵；y表示突变策略；是一个与突变策略y有关的常数，称之为侵入界限（Invasion Barriers）；表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。从定义可以看出，当系统处于进化稳定状态时（群体选择进化稳定策略时所处的状态就是进化稳定状态），除非有来自外部强大的冲击，否则系统就不会偏离进化稳定状态，即系统会“锁定”（Lock in）于该状态。定义的直观意思就是，当一个系统处于进化稳定均衡的吸引域范围之内时，它就能够抵抗来自外部的小冲击。显然，进化稳定策略是一个静态概念，但它却可以描述出系统的局部即吸引域内的动态性质。

原初进化稳定策略定义为以后的研究者提供了理论基础，但它是建立在许多理想化的假定之上，存在着许多不够完善的地方：第一，梅纳德·史密斯等是在研究生态现象时提出的进化稳定策略概念的，由于动植物的行为完全是由其基因决定的。因而，每个种群体都被程式化为一个纯策略，整个生态环境的所有种群也被看作一个大群体。然而，同一种群的个体由于其性别不同、需要不同、能力不同、基因突变或基因遗传⑤ 等因素都会影响到它们的行为，把每一个种群行为程式化一个纯策略是没有太强说服力的，把一个生态环境中所有种群看作一个大群体也存在不妥之处；第二，从梅纳德·史密斯等提出的进化稳定策略定义可以看出，它仅适应于互不重叠且相互独立的突变因素的影响，其吸引域半径只与单个突变因素y有关，也就是说只有等到一个突变因素对群体的影响消失之后，才能出现另一个突变因素，现实中出现这种现象是非常偶然的；第三，梅纳德·史密斯等为了技术上处理的方便及更好地利用数学工具和博弈论来描述生态演化过程而假定群体规模无限大 ⑥，即隐含地假定博弈的支付⑦ 空间是一个连通、闭集，这个假定不符合现实；第四，从原初的进化稳定策略定义可以看出，它是一个静态概念，只能描述系统的局部动态性质，没有涉及到动态系统整体的调整过程，而现实中许多系统的均衡依赖于系统的整体动态性质。

从生态意义上说，进化稳定策略把种群之间的互动行为纳入到模型之中，推广了达尔文的优胜劣汰理论，然而与纳什均衡概念相比，进化稳定策略并不能解释群体如何达到稳定的。它只能回答一旦达到了这种稳定状态，原群体就对突变者群体者具有较强的抵抗力。也就是说，它只能回答当系统处于某一个均衡点的吸引域时，在一定条件下，随着时间的演化,该系统就会趋于这个均衡点，而当系统有多重均衡或者多个吸引域时，原初的定义就显得无能为力了。事实上梅纳德·史密斯和帕克（Maynard Smith and Parker 1976）、梅纳德·史密斯（1978；1979）已经识到原初定义的某些缺陷，梅纳德·史密斯（1982）给予了一定程度的修进并提出了修进的ESS（Modified ESS）概念。下面我们从四个方面来介绍理论家对进化稳定均衡所作的拓展。

二、非对称群体中的ESS概念

梅纳德·史密斯早在1979年就已经意识到，原初的进化稳定策略在处理多群体非对称博弈时遇到了困难。他发现，在现实中，如生态学、经济学和其他社会科学中的许多策略互动行为可能发生于两个或多个群体的个体之间，个体之间进行的是非对称博弈，单用原初定义不能很好解释现实中的这些现象。如何把静态的单群体进化稳定标准拓展到多群体情形呢？在单群体中，所有的个体都被程式化了一个纯策略（梅纳德·史密斯假定只有纯策略是可以遗传的），个体之间进行的是两两重复匿名博弈；并且在单群体中，规模很少的突变因素对群体所产生的影响是可以忽略的，因此，非严格纳什均衡策略不可能侵入到最优反应的严格纳什均衡策略群体。在多群体中，突变因素可能来自于各个群体，突变策略者的互动行为会对群体行为产生不可忽略的影响。因此，原初的进化稳定标准仅仅限于严格纳什均衡之间的选择就不能运用于解释多群体情形。Selten(1980)认为，把均衡概念由单群体拓展到多群体不是一个简单的过渡，而是涉及到系统的动态调整过程及动态稳定性等一系列的变化。哈曼斯顿（Hammerstein 1981）认为，在非对称博弈中，个体更加倾向于应用稳定策略来选择行为并决定竞争结果，而这些稳定策略与进化稳定策略相比，可能会有更少的“吸引域”。因此，由进化稳定策略定义所得的结论就显得有点似是而非了，但他没有作出进一步解释。

泽尔腾(Selten (1980))首次深入地研究了非对称博弈动态稳定性并利用两群体博弈情形证明 “在非对称博弈原初进化稳定策略必定是严格纳什均衡”。后来，Van Damme（1987）在更一般的情形下证明了这个命题⑧ 。我们知道，严格纳什均衡本来就显示出很好的性质，如果一个理论把其主要的注意力集中于研究严格纳什均衡，那么它就没有任何理论价值；更重要的是许多非对称博弈根本就不存在严格纳什均衡，因而也就无法研究动态系统的稳定性；在非对称博弈中，渐近稳定性（Asymptotic Stability）实质上也蕴含了严格纳什均衡，因此，渐近稳定性在非对称博弈中也不是一个合适概念；进化稳定策略是一个静态概念，虽然能够描述系统的局部动态性质，但在非对称博弈中，原初的进化稳定均衡与动态演化过程极限结果之间的对应关系却不明显（即出现了局部与全局的矛盾）。因此，要研究非对称博弈的动态稳定性就必须通过考察系统的动态演化过程来寻求能够适应于对称博弈与非对称博弈的稳定性概念。为了能够更精确地描述非对称博弈，泽尔腾（1983,1988）通过对引入角色限制行为（Role Conditioned Behavior）而提出了适应于非对称博弈的ESS概念。

他的定义如下：在有角色限制的博弈G中，一个行为策略称为进化稳定策略，

如果（ⅰ）对任意的，满足

（ⅱ）如果那么对任意的有。

然而，泽尔滕的ESS概念尽管适应于描述两群体非对称博弈的情形，但它只能描述系统的局部动态性质，而且该定义并不能够显示出均衡概念与动态演化过程极限结果之间的关系。因此，要更好地描述非对称博弈均衡，就必须正确处理好均衡概念与动态演化过程均衡结果之间的关系。于是，弗里德曼（Friedman 1991）考察了非对称博弈的更一般的单调调整过程并得出了四个基本结论：（1）每一个纳什均衡都是动态系统的静止点（rest point）⑨ ；（2）渐近稳定结果必定是纳什均衡；（3）在对称和非对称博弈中，对所有单调调整过程而言ESS不一定是渐近稳定的；（4）对某些单调调整过程而言，正规ESS是渐近稳定的。在此基础上，他得出了“渐近稳定结果必定是纳什均衡”结论。莱瑞·萨谬尔森和张建波（Larry Samuelson and Jianbo Zhang 1992）在弗里德曼（1991）的基础上进一步考察了非对称博弈的累积单调选择动态（Aggregate Monotonic Selection Dynamic）并得出：在非对称博弈中，单调调整过程能够剔除所有严格劣的纯策略,并且能够确保均衡结果必定是纳什均衡。同时，他们证明了“稳定点必定是纳什均衡”及“渐近稳定结果必定是严格纳什均衡”，进而强化了弗里德曼（1991）的“渐近稳定结果必定是纳什均衡”的结论。

Swinkels(1992)认为，进化稳定标准不对突变策略组合给予适当限制是说不过去的。特别地，在处理某些经济问题时，突变策略可能来自于参与人或者企业的创新、试验等活动，这些突变策略组合本身可能会影响系统的稳定性。因此，考察相对于后进入突变群体最优反应策略组合的稳定性可能会更合理，并且这些稳定性概念很容易由单群体情形推广到多群体N-人非对称博弈。于是他定义了适应于非对称博弈的策略稳健性概念。

定义：称之为相对于均衡进入者的稳健策略（Robust against Equilibrium Entrants REE），如果存在对所有的策略组合及满足：。其中表示突变策略；表示选择突变策略者在群体中所占的比例；表示混合群体；表示突变策略相对于策略x的最优反应策略，他并且证明了REE是ESS的一个子集。然后，他又把REE概念推广到了N-人非对称博弈的情形而提出了均衡进化稳定（Equilibrium Evolutionarily Stable EES）概念：

定义：称集合是均衡进化稳定的（EES），如果它是相对于下面性质的最小集： X是纳什均衡策略集合一个非空闭子集，存在，如果及，那么。

换句话说，EES集是纳什均衡策略集的最小闭集，它能够保证任何小规模的均衡进入突变者不可能使得群体离开进化稳定均衡的吸引域。

三、有限群体上的ESS概念

梅纳德·史密斯等提出的ESS概念另一个缺陷就是，他们为了在技术上处理的方便而认为群体规模无限大，这个假定与现实尤其应用于解决经济问题时并不相符。为了使理论与现实更接近，许多博弈论理论家对有限群体的均衡问题进行了深入的研究。沙弗尔（Schaffer 1988)首次放开群体规模无限大的假定，考察了有限规模群体的进化稳定性并提出了有限群体ESS（Finite Population Ess）概念。他证明“在一般情况下，有限群体ESS并不是纳什均衡策略”。汉森和萨谬尔森（Hansen and Samuelson 1988）分析了经济博弈的演化过程，并把有限群体ESS称之为“普遍生存策略”（universal survival strategy）。他们认为，在现实世界竞争中，未来的利润和可供选择的策略具有不确定性，这就会阻碍企业选择最优化策略，企业必须通过不断的试验、学习过程来寻求有利可图的满意策略 ⑩（不一定是最优策略）。沙弗尔(1989)应用“普遍生存策略”来研究寡头企业之间的竞争并得出结论：通过经济自然选择过程 ⑾而得以生存下来的策略是相对的而不是绝对的利润最大化策略。泰尼克（Tanaka 2000）利用模拟者动态，考察了差别产品对称寡头企业竞争的情形并定义了“全局生存策略”（Globally Surviving Strategy GSS）。他得出结论的是：在价格与数量竞争的寡头模型中，GSS都是随机稳定的并且在两种情况下它们是等价的。

以上所得到的均衡概念基本上是适应于单群体有限个体情形，并不适应于有限个体多群体博弈。哈佛保尔和西格蒙德（Hofbauer and Sigmund 1988）证明了“两群体对称博弈中不存在混合策略ESS”。泽尔腾(1988)在考察了大量的两人对称博弈的基础上也得出了类似的结论。克瑞斯曼（Cressman 1992）定义了有限两群体非对称博弈的进化稳定策略，1996年对他所定义的概念作了进一步说明。他认为，在模拟者动态下，至少一个群体的突变者所得到的平均支付少于选择稳定策略者所获得的支付，才能保证静止点的渐近稳定性。Garay and Varga(2000)认为，定义有限数目多群体的均衡概念应该满足如下三点：其一是突变者不能侵入他自己的群体；其二是现有群体对来自外部的随机冲击具有较强的抵抗力；其三是多群体ESS定义应该与非对称博弈理论的基本结论一致。众所周知，纯策略模拟者动态的渐近稳定集并不一定是ESS。那么，哪一种动态稳定概念等价于ESS呢？克瑞斯曼(1990)指出，在单群体条件下强稳定性等价于ESS，那么多群体的ESS定义也应该满足多群体稳定性概念等价于多群体ESS。根据这个标准，Garay and Varga(2000)定义了严格N群体ESS概念。其定义如下：

定义：策略组合称之为N-群体进化稳定策略，如果对每一个，存在，对所有的都有：

框架。

四、随机因素影响下ESS概念

梅纳德·史密斯等提出的ESS概念第三个缺陷是要求突变因素是不连续且不重叠的。原初ESS定义由于仅仅考虑单个因素对系统的影响，所以任何偏离均衡状态的行为都会随着时间的演化自动回复到原来的进化稳定状态。帕克和菲尔德曼（Peck and Feldman 1988）认为，由于群体规模和后代数目很大，因而随机因素对动态系统的影响是可以忽略不计的。现实并不是这样，经济演化系统常常会受到来自突变和其他偶然事件的冲击，这些因素可能会对系统产生不可忽略的影响。福斯特和杨（Foster and Young 1990)认为，首先，ESS概念把影响系统的因素都看成是一个个孤立的事件，而在现实中系统常常会受到连续的随机冲击。如果假定有一个因素的影响消失以后，再考虑另一个因素对系统的影响，那么，系统当然就不会远离原来的均衡状态；其次，现实中出现上述情况纯属偶然现象，一个只能处理偶然现象的理论是没有任何存在价值。现实中，尽管单个随机因素对动态系统的影响较少，但它们却可能对系统产生累积作用而定量地改变系统的稳定性，使得系统离开进化稳定状态，系统什么时候回复到当初的进化稳定状态，依赖于动态过程的全局结构，而ESS定义是一个局部概念，因此在考虑随机冲击时就不能作为判断系统稳定性的标准；再次，由于系统的极限行为依赖于初始条件，同时在吸引子集合中只有一部分状态是随机稳定的，且随机稳定状态的选择还依赖于随机过程特定的结构，因此，ESS和一般意义上的吸引子（Attractors）由于没有充分地考虑到随机因素对进化系统的影响，在描述随机系统的稳定性时也很不理想。于是，他们首次把影响系统的随机因素纳入到进化模型之中并提出了一个既不同于传统ESS也不同于吸引子（Attractor）概念的随机稳定性（Stochastic Stability）概念。他们的定义如下：

定义：群体向量是随机稳定的，如果随着随机影响，极限密度对的每一个小邻域都赋有正概率；更精确地说，其中。其中是当时，的极限分布，表示随机因素对系统所产生的影响。

粗略地说，一个状态P是一个随机稳定的，如果在长期中，随着随机冲击因素影响的不断变少，系统几乎一定（nearly certain）不会离开P的任意少的邻域。随机稳定的群体向量总是存在的，它有如下性质：随着及，它是一个最小闭集。接着，他们又提出了更一般的概念----随机稳定集（Stochastic Stable Set）。随机稳定集是一个满足如下条件的状态集合，即从长期来看，随着随机冲击的不断变少，系统几乎一定处于包含于S的任何一个开邻域中。随机稳定集概念的提出把传统确定性动态模型中的ESS拓展到随机性动态系统中，并且它是一个比进化稳定策略集更精练的概念，是进化稳定集的子集。随机稳定集已经成为描述随机动态系统的基本均衡概念。

五、ESS与动态的结合

从ESS的定义可以看出，它只能描述系统的局部动态性质而与系统的全局动态过程无关，然而，要更准确地描述一个系统的动态性质就必须对仔细考察整个系统的动态调整过程。泰勒和乔克(Taylor and Jonker 1978）首次把传统的ESS定义用模拟者动态模型表示出来，他们证明在一个多群体的模型中，进化稳定策略是渐近稳定的充分但非必要条件。但他们没有作出进一步的研究。鉴于此，吉尔博和马特休(Gilboa and Matsui （1991）)在考察群体行动态调整过程的基础上，提出了“循环稳定集”（Cyclically Stable Set）又一均衡概念。“循环稳定集”直接来源于群体行为的调整过程，其基本思想是“可接近性”（Accessibility）。一个策略分布f称为可以从另一个策略分布g接近是指，如果存在一条从f到g的道路，且在该道路方向上任何一点都是相对于该点的最优反应。“循环稳定集”是指在满足“可接近性”条件下是封闭的策略分布集合（在该集合中任何两个分布之间都是接近的）。与一般均衡理论不同，仅当参与人按照均衡策略而作出选择时才有效，CSS并不要求群体保持这种决策状态。CSS的直观意义是，在一个很短的时间间隔内，只有少部分人离开或者死亡并且由一些新来的人（新生的孩子）代替，这些新来者从他们的母体那里继承一些行为模式，并且在现行预期（也就是说他们并不关心行为模式未来的变化）条件下作出最优的反应，一旦新来者选择了某一行动，他就会一直坚持下去（转换成本的存在是他坚持这个行动的一个重要原因）。马特休（Matsui 1992）给出了一个“稳定”策略的静态表述，在存在对原群体中各策略的初始分布冲击的情况下该策略能够保持这种分布。斯温克斯（1992）在马特休的基础上提出了“群体稳定策略”（Socially Stable Strategy SSS）。相对于均衡的进入者而言，所谓“群体稳定策略”是指如果存在一个突变群体（或者进入者群体，譬如说群体A），其支付高于原群体的支付，那么必定存在另外一个群体（如群体B），在这个包含大部分原群体个体而有一少部分群体A的个体的群体中，群体B将获得高于群体A的支付。这个概念也称为“稳健策略组合”。当然在某些情况下，“群体稳定策略”可能并不存在，但不是这个概念本身的缺点，出现这种情况与我们所研究的动态过程本身是分不开的。然而，我们可能会问，实际的行为模式又是怎么样呢？如果这个过程并不是稳定状态，那么稳定状态又是什么呢？在对这个问题作出回答时，马特休利用了吉尔博和马特休（1991）所提出的集值解的概念（Set-valued Solution），同时他也证明了循环稳定集的存在性。Binmore and Samuelson(1993)把参与人的学习过程纳入到了进化模型中并提出了自我强化均衡[10]（Self-confirming Equilibrium）。他们认为，每个参与人都会通过自己的经验来推断对手可能选择的策略而作出最优反应，这个学习过程可能使得系统在不同自我强化均衡的吸引域之间漂移而不会停留在某一个均衡，由于在非均衡路径上的推断不一定正确，所以自我强化均衡可能不一定是纳什均衡。

结束语

进化博弈理论从发展到现在虽然只有二十几年的历史，但它却受到社会学、经济学、生态学们的普遍关注。特别是该理论的基本均衡概念----进化稳定均衡提出以后，理论界已经从不同的方面对它进行了拓展，并取得了令人瞩目的成果，使进化博弈理论体系得到了在发展中不断完善。进化博弈理论具有较强的实用性和广阔的发展前景 ⑿，相信它会引起更多经济学家的兴趣，必将成为主流经济学的一部分。

注释： ①张良桥：中山大学岭南学院经济学系数量经济学硕士研究生，广东省顺德职业技术学院经济管理系教师（邮政编码：528300；联系电话：0765-2338029；13825507060，值此文发表之际谨向他们致以深深的谢意，同时要感谢经济管理系的仇颖老师对此文中英文名字进行了认真的翻译。 ②生物学家在研究生态现象时发现，利用纳什均衡可以很好地解释生物进化结果。然而，生物是没有思维的更谈不上理性要求了，它们的行为却可以趋于纳什均衡，因此，理性要求并不是纳什均衡的必要条件。这样，生物进化论与博弈论的结合便成为可能，为进化博弈理论的产生奠定了基础。进化博弈理论以群体（Population）为研究对象，主要处理群体中近视且幼稚的(Navie)个体进行重复、匿名博弈的动态调整过程。其基本思想为：给定群体所处的状态，随着时间的演化更合适的策略会被更多参与者采用，其目的是为预测群体最终行为提供一个理论依据。 ③此后本文称之为原初定义 ④实际上相当于吸引域的半径，也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质，而落于吸引域范围之外是不考虑的，所以说它只能够描述系统的局部动态性质。 ⑤如长颈鹿进化的过程。 ⑥对群体模型为无限大的要求有两个原因：其一是机械式的，为了假想的“侵入界限”（Invasion Barriers）也就是突变者群体在大群体中所占的份额（Population Share），当突变群体模型超过1/n时，n是大群体的个体数，突变群体就有可能侵入到大群体，进化稳定策略的条件就有不满足了。其二是技术上的，群体模型足够大，就可以忽略掉现行群体个体的行为对其他突变者群体未来行为的影响，即不考虑学习过程。 ⑦其中的支付是生态学上的适应度（Fitness）或繁殖成活率。 ⑧下面我给出Van Damme1987的证明：首先设是进化稳定的，并且令所有参与人都选择不变的策略。令，对所有的。令，其中，那么对所有，满足及，因此，由进化稳定性可知。所以，而是任意的，所以。其次，设是一个严格纳什均衡策略，并且，那么至少存在一个满足，由的连续性可知，至少存在一个，对所有及，至少存在一个满足：，这就说明是进化稳定的。 ⑨静止点（Rest Point）就是当动态系统处于静止点时就不会离开该点。 ⑩Alchian(1950)指出，企业必须通过对所观察到的市场参与者的行动与结果之间的比较来得知什么是好的策略什么是不好的策略。 ⑾他考察了如下的选择过程，每一个企业所能够选择的策略不随环境的变化而变化。在每一个阶段结束时，如果企业1的利润大于企业2的利润，那么企业1在下一阶段生存下来的概率就大于企业2在下一阶段生存下来的概率。相应地可以把企业的生存规则看作为策略的幸存，成功策略在群体中所占的比例通过企业之间对策略的模仿而得以增长 ⑿杨小凯教授（1995）认为，博弈理论当前最有趣的研究成果及日后有可能获得诺贝尔奖的工作就是信息不对称的动态博弈模型，以及对策游戏规则演化模型（也就是进化博弈模型）。事实上1996年及2001年的诺奖都属于研究信息经济学的经济学家，这说明杨教授具有超前的预见性，进化博弈理论研究者虽然还没有获得诺贝尔经济学奖，但也可以说明杨教授非常看重对进化博弈理论的研究。

[参考文献]

[1] 王则柯（1999）：《博弈论平话》，中国经济出版社。

[2] 张维迎（1999）：《博弈论与信息经济学》，上海三联出版社。

[3] 张良桥（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。

[4] 张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。

[5] Binmore, K., G., and Larry Samuelson(1993): Musical Chaires: The Evolutionary Mechanica of Equilibrium Selection, Mimeo, (University College London and University of Wisconsin, Madison) .

[6] Cressman, P.,(1992): The Stability Concept of Evolutionary Game Theory (A Dynamical Approach), Lecture Notes in Biomathematics, Vol. 94, Springer Berlin.

[7) Cressman, P.,(1996): Frequency-dependent Stability for two-species interactions, Theoretical Population biology, 49, 189-210.

[8] Cressman, r.,(1990): Strong Stability and Density-dependent Evolutionarily Stable Strategies, Theoretical Population biology, 145, 319-330.

[9] Friedman, D.(1991): Evolutionary games in economics, Econometrica 59.

[10] Fudenberg, D. （1998）: Learning in Games, Cambridge MIT Press.

[11] Gilboa, I. and A. Matsui (1991): Social Stability and Equilibrium, Econometrica,59, 869-867.

[12] Hammerstein, P., (1981): The role of Asymmetries in Animal Contests, Anim. Behav. 29, 193-205.

[13] Hansen, R. G., and Samuelson, W., (1988): Evolution in Economic Games. Journal of Economic Behavior and Organization, 10, 315-338.

[14] Hofbauer, J., Sigmund, K.,(1988): The Theory of Evolution and Dynamical Systems, Cambridge University Press, Cambridge.

[15] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical Biology, 1, 382-403.

[16] Matsui, A.(1992): Best Response Dynamics and Socially Stable Strategies, Journal of Economic Theory, 67, 343-362.

[17] Maynard Smith(1974): The theory of Games and the Evolution of Animal Conflict, Journal of Theoretical Biology, 47, 09-221.

[18] Maynard Smith(1978): In defence of Models, Anim, Behav. 26, 632-633.

[19] Maynard Smith, J. And Price, B. R. (1973): The Logic of Animal Conflict, Nature, 246, 15-18.

[20] Peck, J. R., and Feldman (1988): Kin Selection and the evolution of Monogamy, Science, 240, 1672-1674.

[21] Rosen, R. (1970): “Dynamical System Theory in Biology,” Vols. 1 and 2, Wiley-Interscience, New York.

[22] Samuelson, Larry and Jianbo, Zhang(1992), Evolutionary Stability in Asymmetric Games, Journal of Economic Theory 57.363-391.

[23] Schaffer, M. E., (1988): Evolutionarily Stable Strategies for a Finite Population and a Variable Contest Size. Journal of Theoretical Biology, 132, 469-478.

[24] Selten, R.(1980), Evolutionary Stability in Extensive Two-person Games-Correction and Further Development, Mathematical. Social. Science, pp. 93-101.

[25] Selten, R.(1983), Evolutionary stability in extensive two-Person Games, Mathematical. Social. Science 5. 269-363.

[26] Selten, R.(1988), Evolutionary stability in extensive two-Person Games—Correction and further development, Mathematical. Social. Science 16 . 93-101.

[27] Swinkels, J. (1992): Evolution and Strategic Stability: From Maynard Smith to Kohlberg and Mertens, Journal of Economic Theory, 57, 333-342.

[28] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[29] Tanaka, Y., (2000): Stochastically Stable States in an oligopoly with Differentiated Goods: Equivalence of Price and Quantity Strategies, Journal of Mathematical Economics, 34, 235-253.

[30] Taylor, P. D., and Jonker, L. B. (1978): Evolutionarily Stable Strategies and Game Dynamics, Mathematical. Bioscience. 40, 145-156.

[31] Wynne-Edwards, V. C. (1962): “Animal Dispersion in Relation To Social Behavior,” Hofner, New York.

[32] Young, H. P. (1993): The Evolution of Conventions, Econometrica, 61, 57-84.

博弈论的局限性篇5

关键词: 房产交易; 演化博弈;演化稳定策略;复制者动态

中图分类号:F 224

文献标志码:A文章编号:1672-8513(2012)02-0115-04

Evolutionary Game Analysis of Real Estate Transactions

WEI Jianzhou1, MA Guoshun2,LI Yahong3

(1.College of Science, Gansu Agricultural University , Lanzhou 730070, China;2. College of Mathematics and Information Science, Northwest Normal University, Lanzhou 730070, China;3. Department of Science, College of Technology Engineering, Lanzhou University of Technology, Lanzhou 730050, China )

Abstract: This research adopted the Evolutionary Game Theory to analyze the dynamic game behavior of the transaction subjects and set up an evolutionary game model of real estate transaction based on asymmetric games. Through a study of the replicator dynamics, the research analyzed the evolutionary stable strategy in three situations. The results have showed that once the control policies for real estate play its due role, the real estate market will develop steadily and rationally.

Key words: real estate transaction; evolutionary game; evolutionary stable strategy; replicator dynamics

1998年国务院决定从1999年开始全面停止住房实物分配,完全实现货币化,从此中国房地产市场持续高速发展［1］.与此同时由于房地产投资的高回报性和房产开发商及购房者对未来房产价格的上涨预期,进而各自采取群体性投资行为,使得房地产价格脱离了市场基础所决定的基本价值而持续上涨.从目前看,我国房地产市场呈现出了过快、过热增长的局面.最近几年伴随着房地产业的迅速发展,楼市的调控政策也是如影随形,虽然政府对楼市的调控几乎每年都有新政策出台,但大多数城市的房价已是较调控之前翻了不止一番.在此情况下,最初的稳定房价的调控目标已经失去了意义,现今的调控目标已转为“抑制房价过快上涨”.从2009年下半年开始,各部委联合打击囤地,银监会对流动资金贷款加强监管,提高首套房贷利率,房屋限购令等一系列房产调控新政策频出,但面对一轮又一轮的调控,房价却依然坚挺.在调控逐步升级情况下,中国楼市何去何从,房产开发商是维持房价继续上涨,还是打折出售房屋;购房者应该当前购买,还是观望等待.针对上述问题本文用演化博弈论思想对开发商和购房者的决策进行了演化博弈分析.

演化博弈论是把博弈理论和动态演化过程分析结合起来的一种理论［2］.自从1973年Smith ［3-4］提出该理论的基本均衡概念――演化稳定策略ESS(Evolutionary Stable Strategy)及Taylor and Jonker提出该理论的基本动态概念――复制者动态(Replicator Dynamics)以来［5］,演化博弈论在社会学、生态学、经济学等领域得到了广泛应用,并且逐步发展成一个经济学的新领域［6］，应用中主要以博弈方的有限理性作为博弈分析的理论框架［7］.由于当前房地产市场存在信息的不完整性和不对称性,房产市场交易主体预期的非同质性以及大量投资者的盲目跟风投机行为,使得房地产交易主体不可能具有完全理性,而只具有有限理性的特点.本文将通过建立房产交易博弈模型来说明演化博弈论在房产交易行为中的应用,分析交易主体策略的自发演化过程及演化稳定策略.

1 房产交易演化博弈模型构建

假定在一个系统中存在许多参与者,每一轮博弈都是从参与者集合中随机抽样,由被选出来的参与者进行要素博弈,上述过程重复进行.演化博弈论就是研究在这样的过程中参与者是如何进行策略选择和调整的,这样的过程是否具有均衡点,以及如何解释这个均衡点［8］.其中演化稳定策略(ESS)是演化博弈的最为基础的均衡概念,其核心思想是:如果一个现存策略是ESS,那么必须存在一个正的入侵障碍,使得当变异策略的频率低于这个障碍时,现存的策略能够比变异策略获得更高的收益［9］.

1980年Selten［10］首次深入地研究了非对称博弈动态稳定性.为了能够更准确地描述非对称博弈, 随后Selten［11-12］又通过对角色限制行为而提出了适应于非对称博弈的ESS概念,其定义为在有角色限制的博弈中,一个行为策略s=(s1,s2)称为进化稳定策略,如果：

1) 对任意的s′∈S×S,有u(s,s)≥u(s′,s);

2) 如果u(s,s)=u(s′,s),那么对任意的s≠s′,有u(s′,s)≥u(s′,s′).

1991年Friedman［13］考察了非对称博弈的更一般的单调调整过程,从而得出“渐进稳定结果必是纳什均衡”,并指出演化博弈的基本模型是描述状态如何随时间演化的一个动态结构.之后, 他又研究了演化均衡与演化稳定策略、纳什均衡之间的关系［14］.

按照生物进化复制动态的思想,在演化博弈模型中将经典博弈中的支付函数转化为适应度函数,某种策略的适应度可以被简单理解为采用该策略人数在每期博弈后的增长率,即采用某种策略收益较低的博弈方会改变自己的策略,转向(模仿)有较高收益的策略.因此群体中采用不同策略成员的比例就会发生变化,特定策略比例的变化速度与其比重和其得益超过平均得益的幅度成正比［15］.用xt表示一个种群在t时刻采用策略s的比率;用u表示采用策略s的期望适应度,u表示种群的平均适应度,可以得到复制者动态方程为

现假设房产交易系统中有一群房产开发商(D)和购买者(B),在一个具有不确定性和有限理性的空间进行策略博弈.参加博弈的购买者都是对房子有刚性需求的购房人,双方的策略集分别为D(维持,松动)和B(购买,等待).如果开发商维持房价高位运行,购房者购买,开发商收益G(G>0),购房者支付－L(L>0);在房价高位运行时,购房者的观望等待

可能导致开发商资金难以回收,并引起开发商资金链断裂,此事件发生的概率为p.此时开发商支付－S(S>0),但购房者由于等待,房价继续升高后,购房者要多支付－C(C>0),例如,几年前3000元/m2的房子,现在可能到7000元/m2,购房者就要每平方多支付4000元;如果开发商打折出售房子,折扣为θ,在此情况下开发商资金链断裂的可能性就会减小到q(0

2 模型博弈分析

房地产市场情形复杂多变,市场信息不完整,对市场过度乐观预期等因素,使得房地产交易主体是一个理性层次较低,学习速度较慢的群体.完全可以利用生物进化的复制者动态分析房产交易的演化博弈.

2.1 房产交易主体的复制者动态

设x表示开发商群体中维持房价高位运行的开发商比例,y表示购房者群体中当前购买房子的购房者的比例.则由表1,开发商选择“维持”高房价策略的适应度为

uD1=yG－(1－y)pS.

采取“松动”策略的适应度为

uD2=θyG－(1－y)qS.

开发商的平均适应度为

uD=xuD1+(1－x)uD2=xyG－x(1－y)pS+θ(1－x)yG－(1－x)(1－y)qS.

假设开发商群体中选择“维持”策略的个体所占群体比例的增长率等于该策略的相对适应度,所采用的策略收益较低的博弈方会模仿有较高收益的策略,那么采用“维持”策略开发商的比例增长率为

1x•dxdt=uD1－uD,即dxdt=x(1－x)［((1－θ)G+(p－q)S)y+(q－p)S］ .(1)

同理,购房者采取“购买”策略的适应度为

uB1=－xL－θ(1－x)L .

采取“等待”策略的适应度为

uB2=－xC+(θ－1)(1－x)L .

购房者的平均适应度为

uB=yuB1+(1－y)uB2=－xyL－θ(1－x)yL－x(1－y)C+(θ－1)(1－x)(1－y)L .

采用“购买”策略购房者的比例增长率为

1y•dydt=uB1－uB,即dydt=y(1－y)(Cx－L).(2)

于是,由式(1)和式(2)所组成的动态微分方程系统可以描述房产交易的演化.

2.2 房产交易过程中的ESS

由复制者动态方程可以进一步讨论房产交易过程中的演化稳定策略.式(1)表明,当x=0,x=1或y=(p－q)S(1－θ)G+(p－q)S 时,开发商群体中选择“维持”策略的个体所占比例是稳定的. 式(2)表明,当y=0,y=1或x=LC时,购房者群体中选择“购买”策略的个体所占比例是稳定的.根据C和L的取值,分以下3种情况讨论ESS.

1) L

J=(1－2x)［((1－θ)G+(p－q)S)y+(q－p)S］［(1－θ)G+(p－q)S］x(1－x)Cy(1－y)(1－2y)(Cx－L)

根据局部稳定分析法对5个均衡点进行稳定性分析.可见(0,0)和(1,1)是稳定点; A(0,1)和C(1,0)是不稳定平衡点;BLC,(p－q)S(1－θ)G+(p－q)S是一个鞍点.开发商与购房者博弈的动态过程可由图1描述.这里L是与博弈起始时刻有关的量,C是与演化时间t长短有关的量,一般地, C是关于演化时间t的一个增函数.可以看到当演化开始越早,且演化时间越长, LC就越向0靠近;在当前来看,G也是关于演化时间t的一个增函数,同理,在θ、p、q、S不变的情况下, (p－q)S(1－θ)G+(p－q)S随时间的推移也向0靠近.总之,如果房产调控政策没有发挥作用,房价就会持续上涨,房产商收益就会持续增加,随着演化时间的推移,折线ABC右上方区域面积会大于左下方区域面积,即开发商趋向于采取“维持” 、购房者趋向于选择“购买”的概率要大于开发商采取“松动” 、购房者“等待”的概率.

2） L=C.如果y=(p－q)S(1－θ)G+(p－q)S,那么dxdt=0,即所有状态都稳定;如果y(p－q)S(1－θ)G+(p－q)S,x=1是稳定状态.同理,如果x=LC=1,dydt=0.所有状态都是稳定的;如果x≠LC,即x

但这种情况只是某个演化时刻的一种特殊情形,只要演化时间发生改变,L与C的关系也会随之改变.

3) L>C.此时系统有4个局部平衡点(0,0)、(0,1)、(1,0)、(1,1).根据局部稳定分析法可得: (0,1)、(1,0)是鞍点;(1,1)是不稳定点;只有(0,0)是稳定点,即开发商“松动”房价,购房者“等待”是ESS.相图3描述了此时系统的动态演化过程.可以看出,从任何初始状态出发,系统最终都会收敛到(0,0)点.

2.3 政府调控下的房产交易

针对飞速上涨的房价,各级政府已经出台了各种相应的调控政策来遏制房价过快上涨,在政府调控力度不断加大的背景下,上面所讨论的情形1)再难出现,换句话说,房价在一段时间内的增加额不会超过当前购买的价格.实现房价缓慢平稳上涨,在长期来看就是所讨论的情形3)发生,在政府调控措施到位情况下,房产市场趋于理性,投机现象减少,房产泡沫被挤出,从而实现房产市场的平稳、健康发展.

3 结语

本文将演化博弈论的思想应用到房产交易演化博弈模型中,研究了房产交易中开发商与购房者的动态演化过程,用复制者动态分析了3种情况下的演化稳定策略.分析显示在政府宏观调控措施起到作用的时候,房产市场将趋于平稳、理性发展.本文探讨了房产交易中开发商与购房者的演化博弈,实际上,在房产市场博弈中政府和商业银行也在发挥很大作用.今后还可以考虑将政府或商业银行作为博弈方的房产交易演化博弈模型.

参考文献:

［1］姜春海.中国房地产市场投机泡沫实证分析［J］.管理世界,2005（12）:71-84.

［2］高洁,盛昭瀚.演化博弈论及其在电力市场中的应用［J］.电力系统自动化,2003,27（18）：18-21.

［3］SMITH M J,PRICE G R.The Logic of animal conflict［J］.Nature,1973,5427:15-18.

［4］SMITH M J.The theory of games and the evolution of animal conflict［J］.Journal of Theoretical Biology,1974,47(1):209-221.

［5］TAYLOR P D,JONKER L B.Evolutionary stable strategies and game dynamics［J］.Mathematical Biosciences,1978,40(1/2):145-156.

［6］张良桥.论进化稳定策略［J］.经济评论,2003.28：70-74.

［7］WEIBULL J. Evolutionary game theory ［M］.Cambridge:MIT Press,1995.

［8］盛昭瀚,蒋德鹏.演化经济学［M］.上海：上海三联书店,2002.

［9］黄凯南.演化博弈与演化经济学［J］.经济研究,2009,2：132-145.

［10］SELTEN R. A note on evolutionarily stable strategies in asymmetric animal conflicts［J］. Journal of Theoretical Biology,1980,84(1):93-101.

［11］SELTEN R. Evolutionary stability in extensive twoperson games［J］. Mathematical Social Sciences,1983,5(3):269-363.

［12］SELTEN R. Evolutionary stability in extensive twoperson gamescorrection and further development［J］. Mathematical Social Sciences,1988,16(3):223-266.

［13］FRIEDMAN D. Evolutionary games in economics［J］.Econometrica,1991,59(3):637-666.

［14］FRIEDMAN D. On economic applications of evolutionary games theory［J］.Journal of Evolutionary Economics,1998,8:15-43.

博弈论的局限性篇6

一、我国移动通信业价格竞争结构

1994年中国联通的成立标志着中国电信独家垄断时代的结束，从此我国通信业发生了重大的变化，通信市场由垄断逐步走向竞争。1999年2月原中国电信被拆分为中国电信、中国移动和中国卫通，随后，政府又给网通公司、铁通公司和吉通公司颁发了牌照。2001年底中国电信被分割为南北两部分：南部保留原“中国电信集团公司”名称，北方与中国网通、中国吉通重组为“中国网络通信集团公司”。至此，我国的通信运营市场形成了多家企业共同竞争的局面，移动通信市场的双寡头垄断市场初步形成。其中，中国移动占有较大市场份额，即领导厂商。两家运营商之间的竞争常常表现为价格战，运营商之间的竞争也日趋激烈。国内外学者对我国移动通信市场进行了广泛而深入的调查研究，学者们一致认为，目前我国通信运营商已经陷入了价格竞争的“囚徒困境”，这一困境使得运营商们把降价作为其竞争的主要手段，虽然降价扩大了通信业的整体市场，但由于ARPU（用户每月平均消费值）的降低，运营商的总收入并没有上升。针对这一问题，我认为在“囚徒困境”的博弈中，价格竞争并不是一定非合作状态，在一定条件下，合作也是可能的。合作的结果显然胜过不合作的结果，运营商之间应该合作。

二、价格竞争的博弈模型分析

“囚徒困境”是博弈论的经典案例，反映了个人理性和集体理性的矛盾。下面我将以“囚徒困境”模型分析我国移动通信业的价格竞争。根据一般看法，市场份额高的领导厂商由于销量大，生产规模就大，平均生产成本可能更低，因此在竞争中会处于有利的、主动的地位，甚至可以以低价格将竞争者挤出市场。但中国移动通讯服务市场的价格战却与一般看法正好相反：处于弱势地位的中国联通往往主动降价，而中国移动则处于守势，价格战也因此呈现出“联通挑起，移动跟进”的特征。虽然随着移动通信市场的快速发展，中国移动和中国联通的用户数都呈快速增长的势头，但双方用户市场份额的差距却不断缩小。运用博弈论方法可以对中国移动通信双寡头垄断服务市场运营商之间存在的价格相互关联性和依存性进行研究。博弈论起源于应用数学，它主要研究人们的行为发生相互作用时的决策以及这种决策均衡问题，是一种关于决策和策略的理论。博弈论在商业领域中有着广泛的应用，商业运作是和平的另一中表象，商业中的和与战是合二为一的。单纯的竞争只会破坏市场，只有通过竞争与合作，才会实现双赢的效果。博弈论为双方提供了崭新的游戏策略。当人们的利益相互依赖时，博弈论就会通过系统的方式解决策略问题。策略和行为的博弈可以是不合作行为，也可以是合作行为。非合作型博弈行为表现为各自的独立行动，而合作行为的具体表现是形成价格合谋。

1、不合作竞争模型。图1支付矩阵中的数据是根据两公司的市场占有比例虚拟形成的。在此，我们采用划线法，可以得到，（降价，降价）是一个占优均衡，即对于中国移动和中国联通来说，无论对方采用什么策略，降价都是其最优选择。由于本博弈是一个非合作博弈问题，且两博弈方会按照个体行为理性原则决策，因此虽然双方采用降价策略的均衡对两个博弈方来说都不是理想的结果，但因为两博弈方都无法信任对方，都必须防备对方利用自己的信任谋取利益，所以双方都会是无法实现的。即使两寡头都完全清楚上述利害关系和响应的效率意义，也无法改变这种结局。中国移动和中国联通正如两个没有条件串供的囚徒一样，双方都清楚地明白，如果双方达成一致，形成协议定价，共同瓜分市场，在目前双寡头的市场形势下，必将获得最大的经济利益。但是，这种协议注定是脆弱的，即使能够达成，一旦有一家或几家分公司在做决策时出于自身利益最大化的考虑而破坏协议，就会形成连锁反应，“君子协议”必将荡然无存。

2、合作竞争模型。从支付矩阵可以看出，如果中国移动和中国联通能够合作，采用（不降价，不降价）策略，两个运营商的收益都比恶性的价格战高。其中，移动得到8000，联通得到4000，这样的结果应该是二者更好的选择，合作的结果明显优于不合作的结果，理性的企业应该选择合作。但是，在现实生活中，运营商之间恶意的价格战频频发生，在造成国有资产流失的同时，也阻碍了行业的健康发展。因此，我认为运营商应该正确认识竞争与合作的关系，意识到合作的必要性和重要性。但是，两者实现合作是否有可能呢？下面我们来探讨他们实现合作的可能性。

从理论上说，只要满足以下三个条件，“囚徒困境”的博弈就可以实现合作：第一，无限次重复博弈。在无穷多次博弈中，选择背叛者即使在第一次的投机行为中获得利益，他也将会在以后的博弈中受到对方的报复。第二，参与博弈的人数少而稳定，每个参与者所感觉的风险减少，并在不断的合作中将风险减少至最小。第三，有严格的外部约束机制，惩罚博弈中的违规者，如在“囚徒博弈”中，两名嫌疑犯均受到威胁，如果选择坦白，他们将会被判刑，那么两个囚徒就有选择合作的可能。

参与博弈的两大运营商选择合作能够从中获得极大的好处，反之，背叛将会招致打击报复，他们谁也没有勇气去脱离这种合作的关系，因此，在无限次重复博弈情况下，合作是有可能实现的。对于中国移动和中国联通的意义就在于，两者合作的可能性是存在的。第一，在可预见期内，中国移动和中国联通之间的竞争关系要一直维持下去，而且，这种竞争基本等同于无限次重复博弈。因此，从双方的长远利益考虑，他们更愿意在博弈中选择合作。第二，在移动通信业内只存在两家运营商，他们相互之间容易达成一致的协议。第三，政府可以干预或限制运营商之间的恶性价格竞争。

三、小结与启示

1、中国移动与中国联通之间强劲的较量和施展竞争策略给我国移动通信市场撒了一把催化剂，使得这个市场的火焰已经燃烧到白炽化的状态。价格战没有赢家，其最终后果往往是两败俱伤甚至伤害整个行业。无序的价格战除了会使运营商的利润下降和发展减缓外，还带来了畸形的市场发展和扭曲的竞争心态。

2、根据“无限次重复博弈可能产生合作行为”可知，只要“囚徒困境”重复的次数足够多，博弈双方有共同的利益基础，在一定条件下就可以选择合作来获取更大的利益。目前，我国的移动通信市场已经从数量型竞争向数量与质量并重的利润型竞争转化，市场已渐趋成熟，在这样的寡头垄断市场中，任何试图单方面对市场重新变价洗牌的行动都是不现实的。对市场份额的争夺是一种零和博弈，有一个成功者就会有一个失败者，而对利润的追求则是正和博弈，可以通过合作达到双赢。对我国的移动通信运营商来说，应该转变竞争战略，摆脱价格战的泥潭，在价值链的某些环节上创造显著的竞争优势。

3、对我国移动通信运营商来说，构造差异化经营方式，注重品牌向导，进行品牌竞争，在品牌竞争中取得先机，更为上策。中国移动推出“动感地带”、“全球通”、“神州行”三大品牌，进行品牌推广，把竞争从价格战的泥潭引领到品牌竞争的高层次，也为我国移动通信市场勾画了一个值得借鉴的模板：发展品牌，做移动通信专家。而中国联通也不甘示弱，大力推行“CDMA”、“新时空”等业务，创建属于自己的品牌业务。同时，中国联通开辟了电信企业聘请明星做代言人的先河，与姚明联姻，聘请他做联通“CDMA”的品牌代言人。

4、对待价格问题，既有实现合作的必要性，也有实现合作的可能性，从理性方面来说，合作应该是双方的最优决策。现实生活中，运营商之间的价格战时常发生，为什么实际情况与理论不相符合呢？我们认为最根本的原因在于，我们在得出运营商实现合作结论的隐含条件时，局中人都是“理性人”，以追求利润最大化为唯一目的。中国移动和中国联通虽然都已经在海外上市，但是其主体还是国有企业，在市场行为中就表现出很大的差异。

5、针对我国移动业状况，体制改革深化需要适度理性的竞争和互助的合作。运营商之间进行广泛合作，在竞争中合作，靠合作而竞争，不仅可以充分发挥通信网络的整体效能，提高双方通信网络资源的使用效率，而且有助于共同扩大市场份额，提高各自的规模经济效益，从而摆脱“囚徒困境”的困扰，实现双赢的良好愿景。

移动通信具有方便快捷的优势，它不受地域的限制，可以实现消费者的随地通话，是目前我国电信发展的主要热点。中国获得许可经营移动通信服务业务的只有两家运营商，即中国移动与中国联通。目前，我国移动通信服务行业已经形成了中国联通与中国移动两雄割据的局面，双寡头垄断竞争格局已经形成，尽管时间较短，但竞争逐渐激烈。

博弈论的局限性篇7

【关键词】博弈；会计信息；信息失真

引言

会计信息是指特定会计主体的财务状况、经营及其成果等方面的信息，是对会计主体经济业务活动中以货币计量反映的价值运动的一种客观表达。会计信息失真，是指会计信息不能真实地反映会计主体的财务状况、经营及其成果，是有目的、有计划的舞弊行为。

企业提供的会计信息质量高低不仅影响到与企业有利益关系的投资者、债权人等群体的经济利益，而且影响到整个国家的经济秩序和社会秩序。当前，虽然政府及有关机构为提高会计信息的质量采取了许多措施，但会计信息失真的现象仍然相当严重。造成会计信息失真的原因固然是多方面的，但从根本上讲，还是由于一些单位和个人在利益机制的驱动下，从个体利益为理性出发，在会计数据中有意弄虚作假造成的。本文拟用博弈论的方法对此进行分析并提出相应的解决措施。

一、博弈论的基本原理

博弈论又称对策论，起源于本世纪初，1994年冯・诺依曼和摩根斯坦恩合著的《博弈论和经济行为》奠定了博弈论的理论基础。20世纪50年代以来，纳什、泽尔腾、海萨尼等人使博弈论最终成熟并进入实用。近20年来，博弈论作为分析和解决冲突和合作的工具，在管理科学、国际政治、生态学等领域得到广泛的应用。

简单地说，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间决策的均衡。博弈论由3个基本要素组成：一是决策主体，又称为参与人或局中人；二是参与人可选择的策略和行动空间，又叫策略集；三是效用，是可以定义或量化的参与人的利益，也是所有参与人真正关心的东西，又称偏好或支付函数。参与人，策略集和效用构成了一个基本的博弈。

博弈论非常强调时间和信息的重要性，认为时间和信息是影响博弈均衡的主要因素。在博弈过程中，参与者之间的信息传递决定了其行动空间和最优战略的选择：同时，博弈过程中始终存在一个先后问题，参与人的行动次序对博弈最后的均衡有直接的影响。

二、会计博弈的产生

信息不对称是指交易双方对相关信息占有的不对称，即对信息掌握的程度不同，在效用最大化的目标驱使下，有信息优势的一方便会利用有利的信息使自己获利，而处于劣势的一方则会采取各种手段去获取更多的信息，以便做出更为科学、合理的“利己”决策。在这一信息搜集和利用的过程中，每个参与者（局中人）所采取的行动方案不仅要考虑到各种可能出现的情况，还要考虑到其他局中人可能采取的对策，这便是一个博弈过程。

虚假会计信息有市场，是因为它能给其购买者（需求者）带来巨大利益，而供给者提供虚假会计信息可从中获利。有买有卖，会计造假市场应运而生。

可见会计信息使用者的需求各不相同，而会计信息本身又是不完全透明的、不对称的，这必然会引起会计信息使用者与提供者之间产生一定的冲突与对抗，从而产生了博弈。

三、治理会计信息失真，使会计博弈达到“纳什均衡”状态的对策

为了正确面对以上的这些问题，保证会计信息既真实又公允，政府管理层及社会各界有必要采取各种有效措施，来完善会计环境，保证博弈双方的合法利益，使会计博弈真正作到公平、公正、公开，而达到一个理想的“纳什均衡”状态，并最终实现社会经济的繁荣、稳定发展。主要应当采取这样一些措施：

（一）规范经理人行为与激励机制，确保公司经营绩效的真实性

在经营者与所有者的博弈过程中，所有者可通过采取让经营者的报酬等于固定底限薪金、超额完成利润的一定百分比及公司的一定股份之和的对策，以达到“纳什均衡”。在社会上应当逐渐形成职业企业家阶层，进行声誉评价；并加大对经营者造假的处罚力度，降低经营者的预期风险收益。要使债权人与所有者的博弈达到均衡，可由前者制定符合双方利益的合约，限制股利发放水平的高低、限制企业的高风险项目投资：对企业有关融资政策加以规定，不得任意借入具有优惠条件的款项：要求企业定期向债权人提供财务报表等有关信息从而评价企业是否具有违约事项。

（二）加强社会监督，通过完善注册会计师制度和公司核算制度来促进会计信息真实

比如进一步完善会计委派制对经营者不失为一种有效的监督措施：对于公司而言，计量程序的可靠性、原始数据的科学分类和规范的会计科目又是提高会计信息质量的前提。这三个方面的有机结合将会大大提高会计信息质量。建议加快建立合伙制以无限提高注册会计师的造假成本。合伙制与其它组织形式相比有很多优势：有利于事务所建立完备的内部控制体系：有利于形成外部的约束机制：有利于会计师事务所更注重“人合”而非“资合”等。还需要建立相关的民事赔偿机制，需要对相关法律进行修改和补充。

（三）制定和完善提高会计信息质量的法律保障体系，强化政府对会计信息的监督职能

博弈论的局限性篇8

［关键词］自愿性会计政策寻租理论博弈分析

一、寻租理论

寻租是由美国经济学教授克鲁格在1974年提出的，寻租理论应用的领域很广，将它运用在会计中则称之为会计寻租，而在我国用寻租理论来解释会计问题始于2000年。会计寻租的定义为：在社会总财富水平和企业真实业绩（即经济收益）并未改变的前提下，通过改变会计信息（即财务报告收益数字）或者影响行业规范来进行财富的非公平性转移和资源的不恰当配置，从而对其他社会主体利益造成损害的一种非生产性寻求利益的活动。

会计天然地具有经济后果，会计变更就天然地具有寻租功能。即在信息不对称的条件下，通过改变会计的确认和计量的方法，就可以改变会计信息，进而改变相关利益关系人的决策结果。企业寻租通常是在会计准则制定过程中以两种途径来实现：一是通过各种手段干预会计准则的制定过程，引导或促进会计准则朝着有利于该企业的方向发展，在默认会计准则制定机构的既有权力的前提下，寻租者可能寻求的则是准则具体事项中有利于自己的规定；二是企业管理当局以经济人的身份，通过具体的会计政策的选择最大限度地降低或减缓新准则所可能带来的负面影响。而后者即被可以看作是自愿性会计政策变更的寻租行为。

会计活动与相关环境有着密不可分的关系。那么，从理论上讲，企业就有适应环境变化而重新选择会计政策的必要性，这也就是自愿性会计政策变更的本质要求。然而，在现实生活中，企业可以选择通过这种自愿性会计政策的变更改变其真实收益以取得不应得的资源或财富。

在信息不对称的前提下，企业自愿性会计政策变更的真正动因是否如准则中规定的能够提供更可靠、更相关的会计信息不得而知，但鉴于自愿性会计政策变更所具有的寻租功能，自愿性会计政策变更应是极易发生盈余管理的领域，企业管理者会通过变更会计政策改变财务报告收益来达到其寻租的目的，实现财富的非生产性转移。

二、博弈分析

在经济学上博弈论是个非常重要的理论概念。与传统经济理论研究的不同点在于博弈论中，个人的效用函数除了依赖于自己的选择，还依赖于他人的选择；个人的最优选择是其他人选择的函数。

1.自愿性会计政策变更博弈的前提

在不完全竞争市场条件下，人们之间的行为是相互影响的，一个人在决策时必须考虑对方的几种可能性的反应，此时所做出的决策可能比单独思考自己的需求更具有价值。在信息不对称的条件下，市场中买卖双方各自拥有不同的信息，双方为了追求效用最大化，就会采取不同的手段来为自己谋利，由此便产生了一系列的博弈过程。

2.自愿性会计政策变更博弈的要素

（1）博弈双方——政府作为博弈甲方，上市公司经营者作为博弈乙方。

（2）博弈规则——会计规范体系。

（3）裁判——注册会计师。裁判是一个中立的角色，他通过接受委托服务于博弈的一方，公正的做出评判。

3.博弈过程分析

对于上市公司而言，在其公开信息时，就要了解政府在此信息公开后会做出的反应及对策。而政府在做出决策时，也需要考虑上市公司通过机会主义会计政策变更实现歪曲披露会计信息的可能性。下面我们可以从以下博弈分析中更加清楚地了解这一过程：如表1的博弈矩阵：

其中：E——上市公司不采取机会主义会计政策变更

O——上市公司采取机会主义会计政策变更

A——政府采纳上市公司披露的会计信息

U——政府不采纳上市公司披露的会计信息

表中各组数据代表政府及上市公司分别在不同情况下所得的好处。那么首先我们分析AE（9，6），看它是不是均衡点。如果政府选择采纳（A）的策略，则上市公司通过比较（E）与（O）的好处就会选择（O）点，去获得最大的利益8，也就是会采取机会主义的会计政策变更，所以AE（9，6）显然不是均衡点。同样，我们对AO（4，8）及UE（4，3）进行分析，可以发现它们都不是均衡点。而在UO（5，4）的情况下，政府采纳（U）的策略，上市公司通过比较（E）与（O）的好处就会选择（O）点，去获得最大的利益4，也就是会采取机会主义的会计政策变更，歪曲披露会计信息；另一方面，当上市公司采纳（O）的策略，政府通过比较（A）与（U）的好处就会选择（U）点，去获得最大的利益5，就是会做出不采纳的决策，从而该博弈的均衡点为UO（5，4）。

这种双方都采取消极方式对待问题的僵局的出现，显然对于经济发展是不利的。我们要制定出相关的规章制度，要求上市公司适度公开会计政策变更情况，既要保证会计信息的真实性、可靠性、相关性，又要以不泄露企业商业秘密等不可公开的信息为限，这便是博弈的一个新的“均衡点”。这样上述博弈均衡点持续发展下去的唯一结局就是最终会导致上市公司采取机会主义会计政策变更下所得好处减少为零，我们重新得到一个新的均衡点AE（9，6），即上市公司采取效率型的会计政策，真实公开财务信息，而政府据此做出采纳的决定。如表2所示：

以上我们简单的探讨了上市公司自愿性会计政策变更中存在的博弈现象。其实如果想真正地运用好博弈论，就不仅仅是接受这一均衡的结果，而是通过了解这一均衡的形成过程来创造条件达到这一均衡。同时我们也要认识到这一理想的均衡状态不是一朝一夕就能实现的，是必须经过“多次博弈”才能达到的。就好比会计中各种准则、制度、契约就是在不同的博弈各方多次博弈之后逐步形成的。其具体表现为：政府颁布的会计准则若有了破绽和漏洞，市场主体就会利用机会谋取利益，政府一旦发现后便会完善旧准则或制定新准则加以堵截和防范，政府和市场主体随即便展开新一轮的社会博弈。一轮博弈结束后，会计准则便达到了一时的均衡状态，但随着社会整体经济环境的发展和变化，旧的准则规范又不能涵盖新的会计业务，就会再次引发政府和市场主体之间的博弈，其结果就是达到新的均衡。博弈次数越多，程度越完善，博弈各方之间的关系便越接近“纳什均衡状态”。在纳什均衡状态下，各种会计准则、制度、契约就会成为整个社会普遍接纳的“市场规则”，任何市场主体若为了暂时的收益而违反规则，必然会在其他方面付出更大的代价。

由于目前我国对于上市公司会计政策变更情况的公开还没有达到既能披露更多真实、可靠、相关的会计信息，同时又不泄露企业商业秘密等不可公开的信息的双重要求，说明我国的各种会计准则、制度、契约仍处于博弈的初级阶段，要想达到“纳什均衡”还需经过一段漫长的时间。在这长时间的博弈过程中我们要正视自愿性会计政策变更的机会主义问题，积极地创造条件使得政府、投资者与上市公司多次博弈的结果能够兼顾各方的利益，达到双赢的局面。也只有这样，我们才会最终达到一个理想的“纳什均衡”状态。

参考文献

[1] 杨久利.自愿性会计政策变更对企业价值及股东、经理人利益分配的影响[J]．财会月刊（理论），2008，（5）

[2] 杨丹.上市公司自发性会计政策变更的市场反应的实证研究[D]．硕士学位论文，2007，（7）转

博弈论的局限性范文

博弈论的局限性篇1

博弈论的局限性篇2

博弈论的局限性篇3

博弈论的局限性篇4

博弈论的局限性篇5

博弈论的局限性篇6

博弈论的局限性篇7

博弈论的局限性篇8

热门文章更多>

热门推荐更多>

精品范文更多>

博弈论的局限性范文

博弈论的局限性篇1

博弈论的局限性篇2

博弈论的局限性篇3

博弈论的局限性篇4

博弈论的局限性篇5

博弈论的局限性篇6

博弈论的局限性篇7

博弈论的局限性篇8

热门文章 更多>

热门推荐 更多>

精品范文更多>

热门文章更多>

热门推荐更多>