生活中经济博弈无处不在

时间:2022-10-11 08:23:17

生活中经济博弈无处不在

摘 要:文章简述了博弈论的意义、基本构成、分析及其逻辑,以中学生“打水和买饭”合约的博弈分析为案例,说明生活中经济博弈无处不在。

关键词:博弈论 简述 案例 博弈分析

中图分类号:F202.2

文献标识码:A

文章编号:1004-4914(2016)12-267-03

一、引言

我是一名高三年级的学生。

高中学习阶段刚开始时,生活是“极度艰难”。此前,读初中时是吃住在家里,生活父母包办。进入高中开始住校,过集体生活,事事自己动手,怎么能不艰难呢?最难的是喝水和吃饭问题。喝水,每天必须自己提着水壶去打水;吃饭,一天三餐必须自己到食堂排队买饭。我们这些家庭中的少爷们,在家中从不做这些事。最使人头痛的还是打水,我们不仅没有打水的习惯,压根就没有自己喝水还要去开水房打水的意识。于是你壶里没水,就倒别人壶里的水,本宿舍的壶里都没有水,就到隔壁去“借”水。可笑、荒唐,可很真实。这样就出现了“打水和买饭”难的问题。矛盾产生和发展过程,就孕育着解决矛盾的办法,这就是生活的辩证法。我们这一群体,虽然少爷气十足,但年龄已经到了从少年向青年方向成长的阶段,知识在不断积累,思想也不断走向成熟。人在成长之中。成长之中的我们,终于在实践中解决了“打水和买饭”的难题。事情开始时很偶然,有两个同学自愿结成互助伙伴,两人约定今天你去水房打两个人的水,我去食堂买两个人的饭,互助合作。这样,两个人的时间都节省了一半,还减少了孤单感,增加了同学之间的亲近感。不久,这办法竟在全宿舍、全班推广开来。令人没有想到的是,往日里谁也不愿多做一点事的我们这些“少爷”们却无一例外地坚守了承诺,践行合作了两年半。在这两年半里,没有出现一例违约事件,并且大家都愿意继续合作下去。回想着、思考着,令我思迷。

随着年龄的增长,知识的积累,思索问题的力度也就日趋深刻和成熟,上述令我思迷的问题,我久思不解。两年半无一人违约,这是什么样的魔力?我把我思索的问题,告知还在做经济学博士的我的小姨,她说,这可以用经济学中的博弈论解开你的“迷思”。这是很专业的知识,我哪能懂呢?于是向小姨学习,她耐心向我传授这一知识和讲解博弈论在生活中的趣用,然后她给我布置作业,用博弈论解释“打水和买饭”过程的“迷思”。

二、博弈论及其逻辑

传统经济学以研究资源的最优配置为核心。但仅仅如此是不够的,因为人是一种“社会性动物”,利益冲突是社会关系的本质。因而现代经济学与传统经济学的重要区别之一,就是将人类冲突与协调纳入经济学的研究范畴,试图对人类的经济活动给出更加科学的解释。这一努力的成果就是现在我们看到的博弈论。博弈论不仅深远地影响了经济学的研究和发展,而且对其他社会科学,甚至是自然科学都产生了重大影响。

(一)博弈论的定义

博弈是指利益存在冲突的决策个体在相互对抗(或合作)中,对抗双方(或多方)相互依存的一系列策略和行动的过程集合。简言之,博弈论分析的就是在人们之间的行为互相影响的条件下,每个人如何决策。

在博弈论的早期,主要是数学家们在工作,后来经济学家们跟了上来,并且后来居上。博弈论假定人们是理性的,只追求自己利益的最大化,也就是坚持了经济学的基本假定。博弈论在解释经济问题时最为成功。

(二)博弈的基本构成

任何博弈都由三个部分:一组局中人(一个局中人集合),局中人可以采取的行动,局中人可能得到的支付。

每个局中人都会选择最佳的行动,以获取最大的支付。而且每个局中人总是认为,其他的局中人也在设法争取最好的成绩。

(三)博弈论的分类及其逻辑

经济学家为了分析的方便,根据信息是否完全,以及博弈是一次还是多次进行,把素有博弈分为四种:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。信息就是局中人做游戏的知识,这些知识对决策有影响。静态是说同时做出决策,或者虽然不是同时,但是后行动者并不知道先行者做了怎样的决策;动态则是行动有先有后,有r则指博弈可以多次进行。

1.完全信息静态博弈。所谓完全信息,是指局中人对于对方的战略和各自的支付是清楚的。最著名的一个例子就是“囚徒困境”。

甲乙两人被捕入狱,警察为了让他们交代罪行,把他们隔离开进行询问,并且给他们讲明了“政策”:

如果两人都坦白犯了罪,各判8年;如果一个坦白一个抵赖,则坦白一方获释,抵赖的人入狱10年;如果都抵赖,则两人同判2年。可以用图1表示。

在这场博弈中,甲乙双方都知道上面的支付矩阵。因为是隔离审查,互相不知情,所以是静态的。对于甲而言,如果乙选择坦白,甲的最佳策略是坦白;如果乙抵赖,甲的最佳策略还是坦白。所以对甲而言,无论乙如何选择,他的最佳策略都是坦白。同理,由于乙和甲是完全对称的,所以对乙而言,无论甲如何选择,他的最佳策略都是坦白。这样,各判8年,一共16年,对于他们这个集体来讲,是最差的结果。完全信息静态博弈的结果,就叫“纳什均衡”。

这一结果似乎不符合亚当斯密的“看不见的手”的学说,即每个人都从自己的利益最大化出发去做事,结果对别人来说是最好的。这就是个人理性与集体理性的矛盾。矛盾的原因,在于双方的信息不对称,甲乙都不知道对方的选择,或者说是静态。如果是反复博弈,那么结果会大不相同。

2.完全信息动态博弈。所谓动态,指的是博弈的一方行动在先,另一方可以根据先做出的决策来决定、调整自己的策略。

《三国演义》中第三十回合“曹丕乘乱纳甄氏,郭嘉遗计定辽东”,讲述的就是一个生动的完全信息动态博弈的例子。

官渡之战后,袁绍的两个儿子逃亡辽东,曹操在后猛追。辽东太守公孙康问手下的人怎么办。手下的人说,我们得先观察一下,如果曹操追到辽东,就要先与他们袁氏弟兄联合,赶走曹操,之后再解决袁氏弟兄;如果曹操没有追来,则先下手为强,把袁氏弟兄当即解决掉。

这是一个完全信息的博弈,因为博弈的各方(现在是三方)都知道,或者应该知道对方的策略或支付。但是这个博弈是动态的,因为曹操的行为在先,公孙康的行为在后。

现在这样的博弈就摆在曹操面前,曹操该怎样决策才能保证自己的利益达到最大化。其实曹操的四大谋士之一郭嘉生病在易州,他在死前给曹操写了一封信,信中告诫曹操,千万不要忙着追袁氏弟兄,先让他们与公孙康互相残杀,这样便可坐收渔翁之利。这一高明的战略被曹操所采纳,从而也奠定了辽东的胜利。所谓“郭嘉遗计定辽东”。郭嘉不愧是博弈论的高手。

3.不完全信息静态博弈。所谓不完全信息静态博弈,指的是信息是不完全的,博弈的各方都有一些信息,是自己知道而别人不知道的。在面临不确定的情况下,就要根据概率行事,这必然会有一定的风险。

这个时候,我们就需要计算不同行动的数学期望也就是不同类型下概率与支付乘积的和。在这里概率是一个先验的东西,凭个人的经验和感觉。

4.不完全信息动态博弈。所谓不完全信息动态博弈,即信息是不完全的,双方都有一些信息对方不知道,而且行动有先后。

在这里,我们假设博弈双方已经多次打过交道,对于对手的类型已经很清楚,不像静态博弈那样只知道类型的概率分布。由此,做决策相对容易,并且可以有确定的结果。

三、“打水和买饭”合约的博弈分析

运用博弈论对于引言中提到的关于宿舍“打水和买饭”的问题进行相关分析,有助于解开长期合约的迷思,得到比较满意的结果。

首先,我们假设宿舍内的二人“打水和买饭”合约只执行一次,一次合约结束,意味着博弈结束。那么,由于两位局中人对于对方的战略和各自的支付是清楚的,这单独一次合约的执行,就可归为完全信息静态博弈的范畴。假设二人小组中的一方为甲,另一方为乙。如果每个人按照约定履行了自己的义务,不仅打了自己的水(饭)而且打了对方的水(饭),算作诚信;如果每个人没有按照约定履行自己的义务,只打了自己的水(饭)而没有打别人的水(饭),算作欺骗。图2拟列出了它的支付矩阵。

在这个支付矩阵中,如果两个人都选择诚信,那么两个人都可以得到5这样一个较高的福利;如果其中一方选择欺骗而另一方选择诚信,那么选择欺骗的一方由于省了一定的力获得了较高的福利6,选择诚信的一方则由于福利受到损害,降为0;如果双方都选择了欺骗,那么由于双方利益均受到损害,同时降为2。

运用完全信息静态博弈进行分析,这一支付矩阵的纳什均衡为(欺骗,欺骗)。因为对于甲而言,如果乙选择诚信,那么甲会选择欺骗;如果乙选择欺骗,那么甲会选择欺骗。所以,对于甲而言,无论乙选择什么,他都会选择欺骗。同理,由于乙和甲是完全对称的,因此对于乙而言,无论甲选择什么,他都会选择欺骗。这样,在这个博弈只进行一次的情况下,(欺骗,欺骗)是纳什均衡最优解。也就是说,对于懒惰的学生而言,如果这种“打水和买饭”的约定只有一次,那么对于他们每个人,选择欺骗,即不遵守承诺,是最佳的策略。

事情的奇妙之处就在于没有一个人不遵守合约而选择欺骗,反而是几个人同心协力,彼此诚信以待,极力维护了这份合约的长期执行。难道是博弈论的分析与生活中的实际不相符吗?不是的,经过对博弈论的深入学习我了解到,合约的长期遵守与博弈的无限重复有关。

高中生活中要经历三年的买饭、打水,这其中的次数可以说数不胜数。所以谁也无法确定第几次买饭、打水将会是最后一次。也就是说,由于三年间买饭、打水的次数较多,因此可以看作“打水和买饭”这一合约将要被无限重复下去,谁也无法预知哪一次将是最后一次。

这里有必要介绍一下贴现因子q。对于甲而言,假设在这一次合作中,所获得收益为R1,那么在下一期合作中,他所获得的收益就为qR2。这里q指的是经济学中的贴现率,即qR2表示的是未来的收益在今天的价值。如果未来存在收益序列R1,R2,R3……那么这个未来收益流的贴现值之和就为:

现在这个三年的“打水和买饭”的合约可看作是无限次重复地如图2所示的信用困境博弈。假设每t期开始之前,t-1期此阶段博弈的结果都已被观察到。其中每一参与者的贴现因子为q,且每一参与者再重复博弈中得到的收益等于各自在所有阶段博弈中所得收益的现值。可以证明:在无限次重复博弈的条件下,合作可能是稳固的。如果博弈无限次,双方就会逐渐从互相背叛走向互相合作。因为任何一次背叛都会招致对方在下一次博弈时的报复;而双方都采取合作态度会带来合作收益。

在长期合约中,一次的欺骗招致下一次的报复的常见方式有三种,分别是:触发策略、有限惩罚策略和以牙牙策略。在这一问题上,我们假设合约的双方采取触发策略。

所谓触发策略,是指如果没有人选择欺骗,诚信将一直进行下去;一旦有人选择欺骗,就会触发其后所有阶段都不再相互诚信(合作)。图3形象说明了触发策略,(诚信,诚信)表示以前的所有历史阶段都是诚信,现阶段仍然选择诚信,如果发生欺骗将永远选择欺骗。

首先,假设参与者甲在t期选择欺骗,由于乙采取触发策略,则乙在t期以后都会选择欺骗,参与者甲的最优反应同样是在其后永远选择欺骗(选择诚信将得0

即在长期合约中,由于合约要重复很多次,没有知道哪一次是最后一次,因此,当贴现因子,如果双方采取触发策略,那么(诚信,诚信)将会使其纳什均衡。

四、分析的结论

上述分析解释了为什么在无限重复多次的信用困境博弈中,纳什均衡发生了偏移,由只进行一次的(欺骗,欺骗)移到了(诚信,诚信)。引言中的疑问由此得到了解答。对于大学生而言,如果这样的“打水和买饭”合作只有一次,那么由于缺乏约束和影响,理性人的选择将是(欺骗,欺骗),因为人们将从欺骗中得到更多的好处,此时陷入信用困境。然而如果将这种合作扩展到三年,这段时间里谁也不知道一共需要打多少次水,买多少次饭,哪一次才是最后一次,我们可以近似地将这一过程当成无限重复的信用困境博弈。在这一过程中,如果参与双方都采用触发策略,那么由于有了长期的约束,每一方的行动发生了改变,纳什均衡点落在了(诚信,诚信),这一“打水和买饭”的合作才得以长期维持下去。每个人都理性地选择了与他人合作,从而在高中三年里让自己在“打水”和“买饭”这两件事情上赢得了不少时间。

人生由一局又一局的博弈组成。在博弈中,我们每个人都想胜出并取得高分。但是用博弈论的原理再去解释生活,往往就可以参透看似奇妙的玄机,有助于我们更加深刻地解释事物的本质,匡正以往的似是而非。通过这次对博弈论的学习,我认识到了知识在人们生活中的重要性,更加坚定了我对于学习知识的渴望。

(作者单位:太原五中 山西太原 030002)

(责编:李雪)

上一篇:界定物资分类 降低采购成本 下一篇:地方农业院校全日制硕士研究生分类培养模式的...