博弈论角度下的企业内部监督管理

时间：2022-09-28 09:17:49

博弈论角度下的企业内部监督管理

摘要：企业内部监督博弈是由于监管部门和被监管者各自的效用函数的不一致，而为了各自的利益进行博弈。本文利用经济学中的博弈论，详细阐述了管理人员和内控人员的企业内部监督博弈及其纳什均衡，并由此得出了企业内部监督博弈中体现的激励悖论的现象。

关键词：内部监督；博弈论；激励悖论

中图分类号：F275 文献标识码：A

文章编号：1005-913X（2014）02-0094-03

一、引言

在现代市场经济条件下，现代企业制度逐步建立，企业成为自主经营、自负盈亏的市场竞争主体，公司所有权和经营权的分离，以及企业资产保值增值的客观需求，都需要强化企业内部的监督。为更好地发挥企业内控人员的监督作用，企业经常通过激励的方式来强化企业内部监督。

二、内部监督博弈模型及分析

博弈是一些人、对组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。一个博弈中应当设定下列四个方面：博弈的参加者即博弈方、各博弈方各自可选择的全部策略或行为的集合、进行博弈的次序和博弈方的得益。这也是建立企业内部监督博弈模型的基础。

博弈论的内容非常丰富，体系非常庞大。博弈可以根据不同的标准分出不同类别的博弈。其中，根据博弈方的理性和行为逻辑的不同，可分为非合作博弈和合作博弈。在非合作博弈中，根据博弈过程的不同，可以分为静态博弈、动态博弈和重复博弈；根据博弈方对得益信息的掌握情况可分为完全信息博弈和不完全信息博弈。根据所有博弈方的得益总和是否为0，或者是否为某一非0常数，博弈可分为零和博弈、常和博弈，不具备这两种特征的博弈则相应称为变和博弈。管理人员和内控人员的监督博弈是完全信息下的零和静态非合作博弈。

博弈论的目的是从博弈的分析中找到纳什均衡，从而对博弈的参加者的策略选择和行为进行预测。纳什均衡是一种策略组合，使得每个博弈方的策略是对其他博弈方策略的最优反应，这种纳什均衡指的是纯策略纳什均衡。混合策略纳什均衡是纳什均衡的扩展，是博弈方在给定的信息情况下，以某种概率分布随机地选择不同的策略，使得各博弈方的策略相互是对其他博弈方策略的最佳对策。

（一）博弈模型的建立

内部监督博弈中，博弈的双方是管理人员和内控人员，因为管理人员和内控人员的效用函数是不相同的。对管理人员来说他所获得的效用主要是他获得的工资、奖金、休息时间等的函数，因为工资和奖金常常取决于管理人员绩效，管理人员常常会通过舞弊粉饰的绩效来提高自己的效用；而对内控人员来说他所获得的效用主要是他获得的工资、休息时间等的函数，工资一定的情况下休息时间的多少将很大程度上决定了他所获效用的高低，所以内控人员会为了提高自己的效用而“偷懒”。由此可知，在管理人员和内控人员的企业内部监督博弈中，管理人员可以选择舞弊和不舞弊两种策略，内控人员可以选择监督和不监督两种策略。因为企业聘用管理人员目的之一就是要其不舞弊，而内控人员监督管理人员是否舞弊也是其分内之事，所以前提假设是管理人员不舞弊获益为0，内控人员监督获益也为0，这样他们都是得一份工资做一分事。

这就得出了内部监督博弈中管理人员和内控人员的获益情况。假设管理人员舞弊而内控人员没有监督，管理人员获益V，而内控人员为-H；假设管理人员舞弊而内控人员监督，管理人员获益-Q，而内控人员为0；假设管理人员不舞弊而内控人员不监督，管理人员获益0，而内控人员为S；假设管理人员不舞弊而内控人员监督，管理人员获益0，而内控人员为0。

由于管理人员不知道内控人员是采取监督还是不采取监督措施，内控人员也不知道管理人员舞不舞弊，他们双方也都知道相互所采取策略的获益情况，所以无论他们是否是先后采取各自策略还是同时采取各自策略，就可以把内部会计监督博弈中看成是一个完全信息的静态博弈。

（二）博弈模型的分析

根据以上的分析，可以得出图1的得益矩阵，从得益数字下划短线和箭头的方向很容易明白，这个博弈不存在纯策略纳什均衡。因为假设管理人员选择舞弊的策略，那么对内控人员来说最好的策略是选择监督，这样可以完成自己的职责；但当内控人员选择监督时，管理人员的正确策略是不舞弊；既然管理人员不舞弊，内控人员当然选择不监督比较合算；而内控人员选择不监督时，管理人员又会选择舞弊更有利于自己，当然选择舞弊……这种一环套一环的因果循环永远不可能停止。因此，在一次性博弈中也没有会自动实现的均衡性策略组合，也无法预测博弈的结果。那么这个博弈有没有混合策略纳什均衡呢？

由E（管理人员）+E（内控人员）=0可知，上述企业内部监督博弈属于零和博弈，也就说其中一方的得益必定是另一方的损失。这表明企业内部监督博弈中，内控人员针对管理人员舞弊的矛盾是相当尖锐的，内控人员不允许管理人员舞弊，而管理人员舞弊没被发现又能从中获得利益。现实中管理人员和内控人员矛盾并不激烈，那是因为当企业管理人员凌驾于内控人员之上或者相互合作组成的利益共同体的管理层向企业所有者舞弊中，利益是共同的，只是在所获得的利益分配中会有矛盾。这里很好地体现了马克思哲学中的矛盾论，在管理人员和内控人员博弈中两者的矛盾是对立的，而当管理人员和内控人员组成的管理层一起和企业所有者博弈中两者的矛盾又是统一的。管理层和企业所有者博弈是属于另一个博弈，也是一个零和博弈，因为管理层的所得就是所有者的所损失的。而在会计人员和企业负责人对所获得的舞弊利益分配博弈中，应该是一个合作博弈，而且是个非零和博弈。

三、内部监督博弈中的激励悖论

（一）图解法确定该博弈的混合策略纳什均衡的概率分布

先讨论管理人员舞弊和不舞弊两种策略的概率的确定（图2实线所示）。图2中横轴表示管理人员选择舞弊策略的概率，它分布在0到1之间。纵轴则反应对应于管理人员舞弊的不同概率下，内控人员选择不监督的期望得益。图中S到-H连线的纵坐标就是在横坐标对应的管理人员舞弊概率下，内控人员选择不监督的期望得益。

容易说明该线与横轴的交点PA*就是管理人员选择舞弊的概率的最佳水平，选择不舞弊的最佳概率则为1-PA*。首先，S到-H连线上每一点的纵坐标，就是在管理人员选择该点横坐标表示的舞弊概率PA*时，内控人员选择不监督策略的期望得益S（1-PA*）+（-H）PA*=0，也可解出结果PA*=。假设管理人员舞弊的概率大于PA*，此时内控人员不监督的期望得益小于0，因此他肯定选择监督，从而管理人员舞弊一次被抓一次，因此对管理人员来说大于PA*的舞弊概率是不可取的。反过来，如果管理人员舞弊的概率小于PA*，则内控人员的期望得益大于0，因此内控人员不监督是合算的，此时即使管理人员提高一些舞弊的概率，只要不大于PA*，内控人员都会选择不监督，因此管理人员不用害怕会被抓住，由于管理人员舞弊时保证不被抓住的前提下，舞弊的概率越大收获就越大，因此他会使舞弊的概率趋向于PA*，均衡点是以概率PA*和1-PA*分别选择舞弊和不舞弊。此时内控人员不监督和监督的期望得益都等于0，选择纯策略不监督和监督，即混合策略的期望得益都是相同的。不过，事实上为了让管理人员也没有可乘之机，内控人员也必须选择特定概率分布的混合策略。

内控人员采取不监督和监督的混合策略概率分布，也可以用同样的方法来确定（图3实线所示）。结论是图3中的PC*和1-PC*是内控人员的最佳概率选择。

在管理人员和内控人员的博弈中，管理人员分别以概率PA*和1-PA*随机选择舞弊和不舞弊，内控人员分别以概率PC*和1-PC*随机选择不监督和监督时，双方都不能通过改变策略或概率改善自己的期望得益，因此构成混合策略纳什均衡。

（二）该博弈中的激励悖论

斯金纳的强化理论认为人的行为是其所获刺激物的函数，激励手段（强化手段）可分为正强化和负强化。正强化就是奖励那些符合组织目标的行为，以便使这些行为得到进一步加强；负强化就是惩罚那些不符合组织目标的行为，以使这些行为消弱甚至消失。根据以上的论述，激励悖论应该分为以下两种：一种是使用正强化的手段却产生负强化的效果，反之亦然；也就是说激励者给被激励者以奖励，那些符合组织目标的行为不仅没有加强反而有所消弱，或者激励者给被激励者以惩罚，那些不符合组织目标的行为不仅没有消弱反而有所加强，这种悖论是因为给待激励者的强化刺激物不恰当导致的，本文中将这种激励悖论称之为激励结果的悖论。另一种是激励者给予被激励者正强化，以便加强被激励者的行为，然而被激励者并没有加强这种激励者想要的行为或者短期内有加强该行为有所加强，但长期来看这种激励的却加强了第三者（非被激励者）的某种行为；激励者给予被激励者负强化也一样，它并没有消弱被激励者的行为，反而消弱了第三者的这种行为，这是因为激励者没有看清被激励者和第三者之间的连锁关系，本文中将这种激励悖论称之为激励逻辑的悖论。

本文将揭示上述二种激励悖的结果悖论。首先考察企业为抑制舞弊现象而加重对管理人员的惩罚时出现的结果（图3虚线所示）。对管理人员的惩罚加重会使得Q增大，在图3中，这相当于-Q向下移动-Q'。如果内控人员混合策略中的概率分布不变（即PC*不变），此时管理人员仍以原概率选择舞弊时，其得益期望值变为负值，因此管理人员会停止舞弊。但是在长期中，管理人员不舞弊会使得内控人员更多地选择不监督，最终内控人员会将不监督的概率提高到PC*'，达到新的均衡，而此时管理人员舞弊的期望得益又恢复到0，达到新的纳什均衡。由于管理人员的混合策略概率分布是由图2决定的，并不受Q值的影响，因此加重对管理人员的惩罚在长期中并不能抑制舞弊，最多只能抑制短期的舞弊发生率，它的主要作用是使得内控人员可以更多的偷懒。这里就很好的体现了激励的逻辑悖论。

同样的，再讨论增加内控人员发现管理人员舞弊的奖励会出现什么结果呢？增加对内控人员的奖励意味着S增大到S'（图2虚线所示）。此时，如果管理人员舞弊的概率不变（即PA*不变），那么内控人员不监督的期望得益变为正值，内控人员肯定会毫不犹豫地选择不监督。内控人员不监督，管理人员就会增加舞弊的概率，直到将PA*提高到PA*'，此时又会恢复混合策略均衡。就是说，增加对内控人员发现舞弊的奖励在短期中的效果是使得内控人员更加偷懒不监督，这就体现了激励的结果悖论；在长期中并不仅不能使内控人员更尽职，反而会增加管理人员舞弊的概率，这是因为内控人员勤勉程度不是由S决定的，这里体现的就是激励的逻辑悖论了。

四、结论

从博弈论的角度上看，由于管理人员和内控人员效用函数的不同，企业存在内部监督博弈，这种博弈属于非合作零和博弈。因为非合作的零和博弈特点是博弈的一方所得是另一方所失，所以管理人员100%选择舞弊的时候，内控人员也将100%选择监督。管理人员和内控人员之间的博弈最终的结果是双方选择都能接受的概率选择各自的策略，也就是达到了混合策略纳什均衡。

企业内部监督博弈能够很好地说明企业所有者和领导者常常忽略的激励悖论，包括激励的结果悖论和激励的逻辑悖论。由于激励悖论的存在，使得企业所有者或领导者常常采取某一激励方式如肯定或否定员工的某些行为，却没有取得相应的效果，甚至是相反的效果，更有甚者，领导者在激励时被激励者并非是其所希望的激励之人。

参考文献：

[1] 谢识予.经济博弈论[M].上海：复旦大学出版社，2007：76～80.

[2] 周三多.管理学[M].北京：高等教育出版社，2010：263～264.

[3] 姚海鑫，等. 关于上市公司会计监管的不完全信息博弈分析[J].会计研究，2003（5）：1～2.

[4] 张玲.企业内部会计监督博弈分析及对策思考[J].财政监督，2011；13：2.

博弈论角度下的企业内部监督管理

热门标签更多>

热门推荐更多>

精品范文更多>

博弈论角度下的企业内部监督管理

热门标签 更多>

热门推荐 更多>

精品范文更多>

热门标签更多>

热门推荐更多>