基于Multi—Agent仿真的知识转移行为演化博弈分析

时间：2022-02-23 07:03:21

摘要：在有限理性的前提下，各行为主体在知识转移活动中进行反复博弈，根据不同收益分配选择有利策略逐渐模仿，而最终采取某个策略达到演化稳定均衡状态。依据演化博弈理论、知识转移理论，采用复杂适应系统多智能（Multi-Agent）体的整体建模仿真方法，利用Swarm仿真软件平台创建多主体知识转移行为演化博弈仿真模型（KTGM），对模型中主体的属性、行为规则和算法进行描述，在不同的收益参数下运行模型，对主体知识转移行为进行对称合作博弈演化仿真分析，得出各行为主体在进行知识转移活动时应采用的策略，同时模型的建立和运行也为研究各层次主体知识转移动力行为提供了一种有效方法。

关键词：知识转移多智能体演化博弈 Swarm 整体建模仿真

知识经济时代，知识成为企业和组织获取竞争优势的关键性资源，任何一个企业或组织要在激烈的市场竞争中建立和保持自己的竞争优势，就必须根据环境的变化及时地创造和更新知识。Argote& McEvily（2003）认为对知识管理的研究在于组织如何创造、维持和转移知识。知识转移成为个体、群组、组织间知识管理的重要环节，研究人员从不同的研究层次、视角、对象及维度上对知识转移理论进行了广泛的研究。在知识转移与共享过程、激励等方面的博弈分析方面，如司训练等建立了一个企业与员工在隐性知识显性化过程中的博弈模型，探讨了企业与员工最佳博弈策略的选择；柳巧玲等应用博弈论方法对组织内员工间进行知识转移的行为进行了分析研究，构建了组织内员工合作博弈的机制；骆品亮等通过合作博弈模型分析，揭示了虚拟组织内部知识转移过程中可能出现的道德风险问题，构建了虚拟研发组织内部的知识转移体系框架；陈菊红等从知识合作角度用博弈论方法研究了动态联盟知识共享的机制。这些分析都是基于博弈方具有完全理性的假设条件对不同层次和对象进行讨论的，并不完全符合实际情况。经济系统中的经济行为及其效应都是相互依赖和影响的一系列决策的结果，这种决策行为是双方的一种博弈行为，作为经济行为的知识转移活动，在研究其行为与效应问题上也需要更多考虑博弈主体决策行为的相互依赖和影响以及主体理性对博弈均衡的制约和影响。由于知识转移行为主体往往表现为有限理性，因此博弈主体不可能正确地选择最佳策略，一次性达到均衡，而是通过成员间的某种反复博弈，选择有利的策略逐渐模仿下去，最终达到一种演化稳定均衡状态。基于多智能体（Agent）的整体建模仿真方法是在复杂适应系统理论指导下研究复杂系统的一种有效方法。智能仿真Agent 具有学习、推理、规划以及辅助决策等能力。将智能Agent 与仿真建模技术相结合，可以充分而有效地利用知识的表示方法以及各种学习算法、推理方法等人工智能领域的研究成果。本文以演化博弈理论、知识转移理论为基础，以基于多智能体的整体建模仿真方法为指导，构建知识转移行为的演化博弈模型（KTGM），应用多智能体仿真建模软件Swarm，以生物进化的复制动态机制来模拟分析有限理性主体的知识转移行为在不同收益下的演化稳定策略，从而得出各行为主体在进行知识转移活动时应采用的策略。

一、主体间知识转移的复制动态和演化稳定策略

主体在知识转移过程中除了直接吸收知识提供方原有知识而增加的倍增价值外，还会由于知识的协同及杠杆作用而获得新创造的协同价值。协同价值是由于主体间知识势能差异，双方进行知识转移时当专有知识融合时而产生的那部分知识的价值。同时，进行知识转移需要付出知识转移的成本，如知识的发送、接受和管理成本及知识提供方丧失垄断地位而引起的知识价值损失等。合作主体在进行知识转移行为时，有两种策略可供选择：一种是进行知识转移；另一种是不进行知识转移，仅接受对方转移的知识获得倍增价值。假设两个对称主体Agent1和Agent2，在进行知识转移的选择时，如果双方都选择知识转移，则各得到a单位的收益；双方都选择不转移时，各得到d单位的收益；当一方选择转移而另一方选择不转移时，转移方得到b单位的收益，而不转移者得到c单位的收益。双方的支付矩阵如图1所示。

二、KTGM模型的构建

在模型KTGM 中，有限理性的博弈主体根据自身的属性及所处的外部环境，按照特定的行为规则进行知识转移的决策，在反复博弈过程中学习、模仿，不断调整博弈策略，提高博弈所得，最后达到演化稳定状态。模型中的每个博弈主体都是一个智能Agent，模型是由博弈环境和大量Agent构成。外部环境主要是影响Agent之间交互的拓扑结构，在博弈过程中，每个Agent 所处的环境由外部环境和其它所有Agent组成的内部环境所组成，在KTGM模型中，所有Agent所处的外部环境被模拟成现实生活中的空间环境，由一个100×100 的网格构成，这里选择最简单的环境设置，网格是Agent活动空间，Agent可以在网格中前后左右4个方向自由移动。每个Agent在每次仿真周期t内可以在4个方向中随机选择一个遇到的Agent进行博弈，在本模型中Agent由属性、规则、行为和学习算法构成。在博弈过程中，按照Agent的移动规则，在网格中随机与相遇的Agent进行知识转移行为的博弈。Agent从初始t时刻随机选择转移或不转移策略开始进行博弈，根据Agent本次博弈的收益，学习模仿t+1时刻博弈时要采用的策略。

1.Agent属性与规则定义

在KTGM模型中Agent的主要属性包括：ID号、CS（本次所选策略）、NS（下次所选策略）、Proceed（本次收益）。CS记录当前Agent的策略选择，根据所选策略计算本次收益并记录到Proceed，经过学习算法计算确定下次的博弈策略。在KTGM模型中Agent的主要规则是移动规则，为使演化过程具有更好的随机性，Agent在环境中的空间位置是可以随机改变，Agent的博弈的拓扑关系图和相互关系是不固定的，Agent的博弈对手和博弈关系不断变化。仿真初始时Agent随机分布在100×100个网格空间中，在仿真时钟t内随机向四个方向移动，如果遇到其他Agent就进行一次博弈。具体的规则如下：每个Agent在t时刻都随机地选择移动一个方向，如果这个方向上的位置为空，在t时刻就移动到该位置，如果该位置已经存在其他Agent，则不移动，同时与该位置的Agent进行一次博弈，在t+1时刻重新随机选择方向移动位置，寻找本次博弈对象。

2.Agent行为策略与学习算法描述

三、基于KTGM模型仿真的演化博弈分析

在美国桑塔费研究所提供的Swarm仿真平台上创建并运行该模型，根据上文对模型描述和定义进行仿真，分析在不同支付矩阵下群体Agent在环境中知识转移行为的演化稳定策略。为了讨论方便设定环境中Agent稠密度0.05，个数为500；仿真图形的横坐标为时间t，纵坐标为选择转移策略的比率，图中实线表示选择转移策略的agent数占总数的比率，虚线为选择转移策略的平均比率。

1.在支付矩阵中a>c，b>d，即无论对方是否进行知识转移，另一方知识转移的收益总大于不转移的收益

这种情况发生在组织内或组织间对知识转移激励制度设置充分有效，知识转移主体的核心知识能够得到充分保护，且知识转移的成本较小，主体为了追求个体的自身价值或联盟的知识的协作价值，这时主体具有知识转移的动力。在完全理性下，各行为主体都应该选择知识转移策略。在有限理性的情况下，，是唯一的演化稳定策略。如图2的仿真结果所示，从结果可以知道博弈的演化稳定策略与初始的策略选择概率p无关，有限理性的主体经过长期反复博弈均趋向于采用转移策略。

2.在支付矩阵中a

这种情况出现在知识转移主体的核心知识保护力度非常小，很容易造成核心知识和技术的外溢，知识转移的成本非常大，这时完全理性的主体会选择不转移，而去等待其他主体的知识外溢，进行模仿并在此基础上进行一定的改造，从而获得倍增价值，使自己的收益更大。因此各主体会陷入不转移的囚徒困境。如图3的仿真结果所示，在有限理性的情况下，，是唯一的演化稳定策略。从结果可以知道博弈的演化稳定策略与初始的策略选择概率p无关，在有限理性的主体经过长期反复博弈均趋向于采用不转移策略。

3.在支付矩阵中a>c，b

这种情况发生在知识转移的成本较大，核心知识的保护力度能得到充分的保护，如果双方都不采取知识的转移，也是能够保持主体的收益不下降；如果主体单独进行知识的转移，转移知识的那一方要独立承当知识转移的成本或风险可能使自己的收益降低；如果双方采取合作，相互进行知识转移，共同承担转移的成本和风险，获得知识的倍增和协作价值，从而使双方的收益能力都得到加强。在完全理性的情况下，要么进行知识转移，要么就采取合作相互进行知识转移。在有限理性的情况下，，，和都是演化稳定策略。最终博弈的结果取决于P的初始水平。当初始的时，有限理性的企业经过长期反复博弈而趋向采用不转移策略；当初始值的时，有限理性的企业经过长期反复博弈而趋向采用转移策略，仿真结果如图4（A、B）所示，此时依据支付矩阵计算。进一步分析，当时，，反复博弈的结果为选择不转移策略；当时，，反复博弈的结果为选择转移策略。这说明当知识转移的成本越大，各行为主体越倾向不进行知识转移，但如果他们意识到合作能使知识转移获得更大收益时，各行为主体会倾向进行知识转移，而且带来的收益越大，主体间进行知识转移的动力就越强。

4.在支付矩阵中ad，即单独进行知识转移时的收益要大于同时转移或同时不转移的收益

通过基于多智能体的建模方法和SWARM 仿真平台，对复杂经济系统中的有限理性主体的知识转移的博弈问题建立演化仿真模型，利用该模型的仿真运行对知识转移行为进行演化博弈分析。从上面的讨论可知，要想激发个体、群组、组织间的知识转移，并能通过知识转移为组织带来更大的收益，可以通过加强主体间的合作和信任，使知识转移的成本和风险得到降低，知识转移的效率增强；其次通过加强知识产权的保护，提高知识发送者的释放、传递能力和知识接受者的学习和吸收能力，不断降低知识转移的成本；建立知识转移的激励机制，改变主体间的博弈格局，使均衡策略趋向最优，行为主体获得更大的收益。

参考文献

[1]陈立敏，王璇.2000-2007年知识转移理论研究综述[J].情报科学，2009，27（1）：137-144

[2]司训练，陈金贤，李秉祥.企业隐性知识外部化过程中企业与员工的博弈分析[J].科学学与科学技术管理，2005，26（9）：77-81

[3]柳巧玲，卞艺杰.组织内员工知识转移和共享的博弈分析[J].科技管理研究，2007（11）：215-216

[4]骆品亮，周勇.虚拟研发组织中知识转移的道德风险模型分析[J].研究与发展管理，2005，17（3）：64-69

[5]陈菊红，林聪.虚拟企业知识共享的过程及其博弈分析[J].情报杂志，2005（2）：47-49

[6]陈学彬.宏观金融博弈分析[M].上海：上海财经大学出版社，1999：1-9

[7]赵纯均，华立.Multi-agent仿真与资源稀缺下的适应行为[J].管理科学学报，1999，2（4）：1-7

[8]谢识予.有限理性条件下的进化博弈理论[J].上海财经大学学报，2001：103-109

[9]Gelf A E.Ensemble modeling[M].New York：MarcelDekker，1984：1-6

[10]周登勇，戴汝为.适应与仿真[J].系统仿真学报，2000，12（6）：578-583

[11]廖守亿，戴金海.复杂适应系统及基于Agent的建模与仿真方法[J].系统仿真学报，2004，16（1）：113-117

[12]John Maynard Smith.Evolution and the Theory of Games[M].Cambridge University Press，1982

[13]A rthurW plexity in economic and financial markets[J].Complexity，1995，1（1）：489-494

[14]程德华.有限理性下的企业合作竞争的进化博弈分析[J].计算机与数字工程，2004，33（5）：45-47

[15]黄海燕，秦红霞.企业成员知识转移的博弈分析[J].2008（12）：309-311

[16]霍沛军.信息共享——效应与问题[J].系统工程理论与实践，2002，22（6）：105-107

基于Multi—Agent仿真的知识转移行为演化博弈分析

文档上传者

热门推荐更多>

精品范文更多>

基于Multi—Agent仿真的知识转移行为演化博弈分析

文档上传者

热门推荐 更多>

精品范文更多>

热门推荐更多>