“囚徒困境”的经济学意义

时间:2022-10-27 04:09:16

“囚徒困境”的经济学意义

摘要:从1994年三位研究博弈论的经济学家获得诺贝尔奖之后,博弈论越来越受到大家的重视。其中“囚徒困境”模型是博弈论中的经典范例,人们常常用其来分析很多实际问题,特别是在经济世界里。

关键词:博弈论;囚徒困境;完全信息博弈;无限次重复博弈

中图分类号:F01 文献标识码:A 文章编号:1001-828X(2012)03-0-01

博弈论研究的是在存在相互外部经济条件下的个人选择的问题,是研究决策主题的行为发行直接相互作用时候的决策以及这种决策的均衡问题。其可以被分为合作博弈和非合作博弈,两者最主要的区分在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议。“囚徒困境”正是联系非合作博弈与合作博弈的桥梁,接下来我们会详细讨论到“囚徒困境”在完全信息静态博弈与完全信息动态博弈下的不同均衡结果,从而进一步研究“囚徒困境”中所包含的经济学意义。

一、完全信息静态博弈下的“囚徒困境”

这个博弈论中经典例子创造的本身就部分地奠定了非合作博弈的理论基础。这个例子主要讲的是两个嫌疑犯被警察抓住后,分别关起来受审。下面的这张表就是“囚徒困境”的标准形式表述。

在这个博弈中,参与人是两个歹徒,他们都有两种战略:坦白或者抵赖。每个表格中的一对数字代表对应战略组合下的两个歹徒的支付。在这个例子中,(坦白,坦白)就是纳什均衡。所以我们可以看到,无论B是选择抵赖还是坦白,A的最优选择一定是坦白。但是,如果他们都选择抵赖,每个人的最终受益是-1,从而使他们的总体境况变的更好。可以看出(抵赖,抵赖)才是帕累托有效率的策略组合――没有其他的策略选择能够使他们的境况变得更好――而最终的纳什均衡组合(坦白,坦白)则是帕累托低效率的策略组合。“囚徒困境”反映了一个很深刻的问题,这就是个人理性和集体理性的矛盾。大家都抵赖的这个帕累托改进是办不到的,因为它不构成纳什均衡,没有人愿意去遵守约定。

二、完全信息动态博弈下的“囚徒困境”

在完全信息动态博弈中,参与人的行动有先后顺序,且后行动者在自己行动之前可以观察到先行动者的行动。下面,我们就用博弈树来表示下“囚徒困境”这个经典的例子。

首先,我们来讨论一下有限次完全信息动态博弈下,“囚徒困境”的纳什均衡解会有什么变化。假设这种囚徒困境的情况进行二十次。在这种情况下,原来的均衡没有改变,任然(坦白,坦白)是最优选择。只有在“囚徒困境”的局数不确定的情况下,即不完全信息的情况下,才有可能建立起互信的关系,而这与我们接下来要讨论的完全信息动态情况下的无限次博弈相类似,这是均衡才会发生改变。

在无限次的博弈中,首先假设双方都会采取“触发策略”,即:1、开始选择抵赖;2、选择抵赖直到有一方选择了坦白,然后永远选择坦白。我们可以证实触发策略是构成该博弈的子博弈精炼纳什均衡,多次对局下,未来的收益应比现在的收益多一个折现率X,X越大,表示未来的收益越重要。在对持持续进行下去,且X比较大,即未来充分重要时,最优的策略是与别人采取的策略有关的。

三、“囚徒困境”的经济学意义

“囚徒困境”在经济学上有非常广泛的应用,也很好地解释了很多经济现象,具有非常重要的经济学意义。“囚徒困境”反映的是个人理性导致集体理性的缺失,但是由于集体性质未定,即集体利益的缺失对整个社会影响也是有积极和消极之分的。

当集体利益与社会利益相矛盾时且有损社会整体利益的,此时应该设计制度形成囚徒困境,设法让博弈的双方走进囚徒的困境,制止他们的合作,从而形成垄断,造成社会净福利的损失,很多行业间的价格与产量的竞争就属于这种情况。我们要让那些具有垄断力量的寡头走进囚徒困境,比如中石油与中石化,可口可乐与百事可乐,微软与苹果等等。而他们之间的非合作关系会更加有利于整个社会福利的提高,通过其竞争,不光产品的价格会接近竞争价格,而且也会促进其改进产品质量,提高产品差异化,满足更多人的需求,即提高整个社会福利水平的提高,从而达到帕累托改善,这才是此刻囚徒困境应该发生的作用。

而当集体利益和社会利益相一致时,就应该设法摆脱囚徒困境,从而形成合作,促进整个社会效率的提高。接下来我们将讨论下公共产品的供给这个问题。由于公共产品具有非竞争性和非排他性的特点。因此,在一个集团范围内,集团收益是公共性的,即集团中每一个成员都能共同且均等地分享它,不管他是否为之付出了成本。集团收益的这种性质使集团每个成员都想搭便车而坐享其成。除非一个集团中人数很少,或者除非存在强制或其他特殊手段以使个人按照他们的共同利益行事,有理性的、寻求自我利益的个人不会采取行动以实现他们共同的或集团的利益。

四、如何摆脱“囚徒困境”

对于那些非常不利的“囚徒困境”,我们需要摆脱它,即需要能够产生合作解,而并非在非合作情况下走到底。有七点非常好的建议:首先,要建立持久的关系;第二,要增强识别对方行动的能力;第三,要维持声誉;第四,能够分步完成的对局不要一次完成,以维持长久关系;第五,不要嫉妒人家的成功;第六,不要首先背叛,以免担上罪魁祸首的道德压力;第七,不仅对背叛要回报,对合作也要作出回报。

五、结论

从上述对“囚徒困境”的分析中得出一个重要结论:就是一种制度安排,要发生效力,必须是一种纳什均衡,否者这种制度安排便不能成立。在经济社会中,“囚徒困境”本身并没有好与坏之分,需要对“囚徒困境”弈双方所在的小集体与整个社会这个大集体进行比较,才能够评判是需要合作解还是需要非合作解。

参考文献:

[1]范里安.微观经济学:现代观点[M].上海三联出版社,2007.

[2]奥尔森.集体行动的逻辑[M].上海人民出版社,1995.

[3]孙鑫.囚徒的困境博弈及其应用浅析[J].产业与科技论坛,2009(08).

上一篇:基于自主合作型教学模式的《税法》课程改革与... 下一篇:广告设计及其未来的发展