排污监察问题的进化博弈分析

时间:2022-07-30 11:53:39

排污监察问题的进化博弈分析

[摘 要] 本文运用进化对策理论建立了排污监察模型,对排污监察的稳定性进行了分析,提出排污监察的稳定状态,与排污企业治理污染的成本、污染事故发生后企业的损失以及企业的贿赂成本相关,并且提出以下治理措施:加大激励措施,对治理排污行为的企业采取税收优惠、补贴等方式,提高企业治理污染的积极性,减少企业本身治理污染的成本;加大对发生污染事故企业的惩罚力度,对发生污染事故的企业加大罚金、停产整理以及追究法人代表和事故当事人的责任等,有助于减少污染事故的发生;加强监察部门的纪律教育,对因监察不力而发生污染事故的监察者加大处罚力度,有利于防范污染事故的发生。

[关键词] 排污监察;复制动态方程;进化对策

[中图分类号] F224.32 [文献标识码] A [文章编号] 1006-5024(2008)11-0084-03

[基金项目] 贵州省教育厅自然科学基金项目“进化对策理论、模型及其在经济学中的应用”(批准号:黔教科2006325)

[作者简介] 余孝军,贵州财经学院数学与统计分院讲师,博士生,研究方向为数理经济学、交通经济学;

唐华容,贵州财经学院马列部讲师,硕士,研究方向为社会主义市场经济与政治文明、精神文明建设。

(贵州 贵阳 550004)

一、引言

进化对策思想的早期研究在生物学中可以追溯到费希尔(Fisher)在《自然选择的基因理论》(The genetic of natural selection,1930)中关于性别比例的研究。1961年李文廷(Lewontin)在《进化和对策理论》(Evolution and the theory of games)中明确使用对策论用于解释生物进化。1972年梅纳德•斯密斯(Maynard Smith)在他的文章《对策论与进化冲突》中提出了进化对策理论的基本均衡概念――“进化稳定策略”(Evolutionary stable strategy――ESS)。1973年梅纳德•斯密斯和普林斯(Price)在他们的文章《动物冲突逻辑》(The logic of animal conflict)中把ESS应用在更广泛的范围,从此进化对策论得到了真正的重视。包括1994年诺贝尔经济学奖得主泽尔滕(Selten)在内的许多经济学家都投身到对进化对策的研究中。同时,进化对策在其他方面也得到了广泛的应用,形成了很多重要的结论。

环境污染问题是一个关系人们生活水平的重要因素,保护和治理环境、防止环境污染,已成为我国的一项重要国策。虽然我国政府对企业的排污行为进行了大力的治理,在一定程度上缓解了污染的境况,收到了重大的效果。但是,目前企业排污行为没有得到根本的改变。有资料显示,环境污染问题依然极其严重,不少的学者对这方面的问题进行了原因分析和提出解决的对策。

二、进化对策理论介绍

1.进化稳定策略(ESS)的数学描述。根据梅纳德•斯密斯(Maynard Smith)的定义,进化稳定策略ESS是这样的一种策略:如果群体中所有成员都采用这种策略,而这种策略的好处为其他策略所不及,那么在自然的影响下,将没有突变策略能侵犯这个群体。梅纳德•斯密斯(Maynard Smith)在1982年给出了2×2对策的ESS数学描述:

设某一群体中的某一个体(局中人)从其策略空间s中选用一种策略s1,当它的对手采用另外一种策略 s2时,它的收益就为E(s1,s2)。称策略s1是一个ESS,假如对所有的可选策略s2满足以下两个条件之一:

s2的一个最好策略,则s1一定是一个比s2关于它自己的最好策略。

若一个进化对策存在ESS,则称该对策存在进化稳定策略。

2.进化对策复制动态方程。下面我们以2×2对称对策来说明进化对策的复制动态方程。对策的收益矩阵如表1所示。这种对策的特征是对策双方在策略和收益方面都是对称的,因而,一个对策方究竟是在对策方1的位置,还是在对策方2的位置,对策并没有区别。

现在,我们来考虑在一个理性层次较低、学习速度较慢的大型群体中随机配对反复进行该对策的进化对策问题。假设在该群体中有比例为x的对策方采用策略1,比例为1-x的对策方采用策略2。那么,采用两种策略对策方的期望收益和群体平均期望收益分别为:

u1=ax+(1-x)b=b+(a-b)x

u2=cx+(1-x)d=d+(c-d)x

u=xu1+(1-x)u2

在上述问题中采用策略1的对策方比例为x的变化速度可以用微分方程 dx/dt=x(u1-u)=x[u1-xu1-(1-x)u2]=x(1-x)[x(a-c)+(1-x)(b-d)]来表示。该微分方程称为“复制动态方程”。一般地将上述复制动态方程简记为 dx/dt=F(x)。

进化复制动态方程表达的意义是:所采用策略收益较低的对策方会改变自己的策略,通过重复、模仿、学习等转向能获得较高收益的策略。因此,群体采用不同策略成员的比例,会随着时间的变化而发生变化。特定策略比例的变化速度,与其自身所占比重和其收益超过平均收益的幅度成正比。

令F(x)=0,就可以解出该复制动态方程的稳定点,即在复制动态过程中采用某一种策略的对策方比例逐渐增加(减少),最终所达到的稳定不变的水平。稳定点只意味着对策方采用特定策略的比例不会再发生变化,并没有说明会趋向哪个稳定点,这些取决于对策方所采用策略比例的初始状态和微分方程在相应区间的正负情况,需要根据具体问题进行分析。同时,具有真正稳定性的稳定状态必须具有抗干扰性,即如果由于对策方的错误等某种原因使得上述比例偏离了这些稳定点x*时,复制动态仍然会使其回复到这些水平。这要求x向低于 x*水平偏离时,dx/dt=F(x)大于0,当x向高于x*的水平偏离时,dx/dt小于0。也就是说,在不动点x*处F(x)的导数(切线的斜率) F(x*)< 0,满足这些要求的x*正是进化对策论中的进化稳定策略,即在有限理性对策方的动态策略调整过程中具有稳定的策略比例关系。

三、排污监察对策的模型

我们先对模型做出如下的假设:

1.局中人。我们假设对策的一方是产生对环境有一定污染的排放物的企业,我们简称它为排污企业;对策的另一方为监察企业排放物是否符合环境要求的国家有关职能部门,我们简称它为监察部门。

2.策略。当排放物产生后,排污企业有两种策略选择:一种是执行有关对排放物要求治理后再排放;另一种是不执行对排放物治理要求,直接排放。我们称排污企业的策略集为{执行,不执行}。监察部门的策略也是两种:一种是认真检查,看排污企业的排放物是否符合环保要求;另一种是对排污企业不进行检查,我们称监察部门的策略集为{监察,不监察}。

3.收益矩阵。我们假设企业生产时的收益为 r,治理排放物的成本是p。如果企业选择不执行策略,那么其对监察部门实施贿赂,金额为a,监察部门接受后对此类企业的监察均为走过场,即使查出排放物不合要求,也不对其进行处罚。企业选择不执行策略时,发生污染事故的概率为f,企业相应的损失为b。监察部门认真监察是其职责,因此,其此时的收益为0。如果监察部门对企业不认真监察时发生了污染事故,那么将受到处罚c。而如果是进行了监察,则不受处罚。监察部门不监察时节省的监察成本为m,这里a,b,c,f,m,r,p均为正值。这样我们可以得到对策双方的收益矩阵如表2所示:

本对策是一个非对称对策,因此,不能套用对称对策的分析框架。现在有两个不同的对策群体,一个是排污企业群体,另一个是监察部门群体,每一次对策实际都是这两个群体中的成员随机配对进行对策,对策方的学习和策略模仿局限在各自所在的群体内部,策略调整的机制仍然是与两人对称对策中相似的复制动态。设排污企业采用执行策略的比例是 x,那么采用不执行策略的比例为1-x;监察部门采用监察策略的比例为y,那么采用不监察策略的比例就为1-y。这样,排污企业采用执行、不执行策略的期望收益和群体平均收益分别为:

u1d=y(r-p)+(1-y)(r-p)=r-p

u1n=y(r-a-bf)+(1-y)(r-a-bf)=r-a-bf

u1=xu1d+(1-x)d1n=(r-a-bf)+x(a+bf-p)

此时,排污企业选择执行策略时的复制动态方程为:

F(x)= =x(u1d-u1)=x(1-x)(a+bf-p)(1)

监察部门采用监察、不监察策略的期望收益和群体平均收益分别为:

u2s=x0+(1-x)a=a(1-x)

u2n=xm+(1-x)(m+a-cf)=m+(1-x)(a-cf)

u2=yu2s+(1-y)u2n=[m+(1-x)(a-cf)]+y[cf(1-x)-m]

此时,监察部门采用监察策略的复制动态方程为:

F(y)= =y(u2s-u2)=y(1-y)[(cf-m)-cfx](2)

方程(1)和(2)描述了这个进化系统的全体动态,该系统的两个复制动态方程如下:

=x(1-x)(a+bf-p)

=y(1-y)[(cf-m)-cfx]

根据Friedman 提出的方法, 其均衡点的稳定性可由该系统的雅可比行列式的局部稳定性分析得到。其雅可比矩阵为:

矩阵J的行列式为:

detJ=[(1-2x)(a+bf-p)][(1-2y)(cf-m-cfx)](5)

矩阵J的迹为:

trJ=(1-2x)(a+bf-p)+(1-2y)(cf-m-cfx) (6)

四、模型分析

由方程(3)可知, 方程有四个均衡点, 分别是:

O(0 , 0) , A (1 , 0) , B (1 , 1) , C(0 , 1) 。

不同情况下各均衡点的稳定性如下:

情形1 : 当p >a+bf,且cf< m时,即排污企业执行治理污染的成本大于不执行治理污染时贿赂监察部门的成本和期望事故损失之和的同时监察部门的监察成本大于其出事时的期望处罚。此时各均衡点雅可比矩阵行列式与迹符号分析如表3所示:

由表可知,排污企业将向不执行治理污染物而选择贿赂监察部门进化,监察部门将选择接受贿赂,不监察排污企业, 最终稳定点O( 0 ,0) 。此时, 排污企业贿赂监察部门, 监察部门接受贿赂,不监察排污企业的治理。

情形2: 当p>a+bf,且cf≥m时,即排污企业执行治理污染的成本大于不执行治理污染时贿赂监察部门的成本和期望事故损失之和同时监察部门的监察成本不大于其出事时的期望处罚。此时各均衡点雅可比矩阵行列式与迹符号分析如表4所示:

由表可知,排污企业将向不执行治理污染物而选择贿赂监察部门进化,监察部门的策略会因执行治理污染物策略的排污企业的比例而发生变化,当执行治理污染物企业的比例 x>1-m/cf 时, 监察部门向选择不监察策略进化; 当执行治理污染物的企业的比例 x

情形3: 当p

由表可知,排污企业将选择执行治理污染物,而不选择贿赂监察部门进化。同时,监察部门将逐渐选择不监察排污企业。最终的稳定点是A (1 , 0) , 即此时的策略组合为(执行,不监察)。

情形4: 当pm时,即排污企业执行治理污染的成本,小于不执行治理污染时贿赂监察部门的成本和期望事故损失之和同时监察部门的监察成本小于其出事时的期望处罚。此时各均衡点雅可比矩阵行列式与迹符号分析如表6所示:

由表可知,排污企业将选择执行治理污染物,而不选择贿赂监察部门进化。监察部门的策略会因执行治理污染物策略的排污企业的比例而发生变化,当执行治理污染物的企业的比例x>1-m/cf 时, 监察部门向选择不监察策略进化; 当执行治理污染物的企业的比例x

参考文献:

[1]罗发友.刘友金.集群内企业创新行为的进化博弈分析[J].中国软科学,2004,(9).

[2]谢识予.有限理性条件下的进化博弈分析[J].上海财经大学学报,2001,(5).

[3]付茂林.黄定轩.存在腐败的煤矿安全监察进化博弈分析[J].中国煤炭,2006,(8).

[4]徐小钦,石磊. 环境污染及治理的经济学分析[J ] . 生态经济,2004 , (12) .

[5]黄宝连,黄海平.用博弈论分析我国造纸企业污染反弹的原因.[J].山东纺织经济,2006,(6).

上一篇:循环经济发展方式的路径选择 下一篇:构建社会主义新农村与发展农业循环经济的关系...