基于信标的多Agent系统关键技术研究

时间:2022-05-03 07:28:50

基于信标的多Agent系统关键技术研究

摘 要针对基于信标的新型多Agent系统涉及的基本概念、系统模型、控制算法等关键技术进行研究并做了阐述。提出一种新型的多Agent系统,模块间仅通过信标检测的方式进行信息交互。且通过仿真来进一步进行了验证。

【关键词】信标 Agent系统 控制算法

1 概述

多Agent系统目前己经成为AI领域研究的主流方向之一,起源于分布式人工智能的研究。计算机网络技术的飞速发展和分布式人工智能的需要,多Agent技术正式形成并进入工程应用领域。对于Agent的研究已经成为分布式人工智能研究的一个重要分支。

Agent系统从控制方式不同可分为集中式控制和分布式控制两种结构方式。以上两种方式中,都是采用数字通信的方法来处理协调个体行为的问题,在一般情况下是非常有效的,但对于大的系统来说,该方法将存在一些问题,因为数字通信可能会通信失败,这些失败的通信可能会导致系统的恶化。为了让系统能够正常的运行,需要更多的控制和增加硬件机制,这样就增加了Agent的复杂性且系统的可靠性也越差。在群Agent系统研究方面,试图发现或发明群体行为的控制机制,将这种机制应用于控制大规模数量的简单Agent,使大规模数量的简单Agent能够像生物界中的群体生物一样,自组织的表现出群体智能行为。

2 基本原理

2.1 基本概念

Agent 最初是分布式人工智能领域提出的一个概念,由三部分构成:具有某些领域的知识、能够进行科学的推理和要求达到的目标描述,在一定的环境中,能够根据自己的知识和目标自主地采取行动。在分布式作战仿真中通常用来代表一些自主节点。

多 Agent 系统(Multi-Agent System,MAS)是多个 Agent 组成的集合,相互之间能够通讯、协商,并根据环境和目标进行协作。由于 Agent 的工作过程是非线性的,因此多Agent 系统解决问题的方法更贴近实际的人的行为,同时解决多问题的能力远远超过单独的 Agent。

Agent的信标的构成可以简单概括,Agent模块配备的一对无线节点,分别在模块的左、右两侧,根据模块两侧的无线节点接收到的信标强度和类型不同来实现相应的功能。主要的工作原理是根据左、右两个无线节点源点的距离不同,将两侧的信标强度作差和求和运算,控制器根据运算值及信标类型作出判定, Agent模块以一定的频率重复上述运算,最终实现与其他Agent处于安全状态的情况下,向目标物位置方向靠拢。

Agent的排斥信标只对在一定范围内的Agent有反应,若以ρ为半径的圆表示Agent的防撞范围。每个Agent之间要保持ρ距离的足够空间,才能确保Agent的正常运行。距离ρ与Agent的最小半径旋转半径 Γ有关,进一步的可以认为直接与Agent的运动速度有关。

2.2 Agent系统模型

Agent可采用移动模块,主要包含左、右两个无线节点、传感器、单片机控制模块、电机和电源模块。Agent之间的通信主要通过无线节点来发射/接收信标,根据信标强度变化值来计算出距离这一原理实现的,Agent主要是通过两侧的无线节点接收的信标强度不同(到发射信标位置的距离不同)和信标的类型(吸引/排斥)来作出相应的移动方向判定。该控制机制运用了无线网络技术,且对无线网络技术要求较高。如图1所示。

2.2 基于信标的多Agent系统模型

每个群agent都配有两种类型的信标,碰撞回避信标col(排斥和分散agents),和当agents探测目标(无论该目标可能是什么)时才能被激活的目标吸引信标tar。碰撞回避信标总是开着的,并且每个agent都配有一个天线/接收器对以检测其他agents的防撞信标(和它们的方向)。以同样的方式,每个agent使用天线/接收器对检测其他agents的目标吸引信标。请注意,目标吸引信标有效地把信号从一个目标(无论它是如何被检测出)转换成不同的模式(即开/关无线电信标),以扩大其探测范围。相比于目标信标接收器,防撞接收器可以利用的接收信号强度,提取出源点的近似距离。这使得防撞算法只能对自由空间中的某半径ρ(下称“排斥半径”)内的对象起作用。有效的半径ρ是一个对象的防撞范围,代表对象必须保持自身和其相邻对象之间的距离,以留出足够的空间来改变方向。因此,ρ是取决于对象的最小转向半径τ,相应地,转向半径通常取决于对象的速度。

对于这种控制算法,我们定义:

,其中是在位置x处agnet i的y类型信标的接收功率的测量值,y∈{col, tar},而是y类型信标发射功率。(共有n个agent,而且所有相同类型的信标具有相同的功率。)利用两个侧向定向天线的方向敏感性,可以得到对于每两个模式的左边和右边天线的信号强度。在y=col的情况下,左右天线信号强度的Li和Ri的和分别是agent j满足时成立。这就要求在调制方案中规定,允许agents来区分每个碰撞信标。

在平面内随着 Agent 的数量增多,Agent 的位置将会靠近,当数量增到一定时,在运行过程中,每个Agent按照上述的移动规则,以一定的频率执行这一移动规则,从而向发射吸引信标的Agent靠拢。由于是多个Agent共同执行这一移动规则。将以发射吸引信标的Agent为中心形成一个封闭区域,其密度由排斥临界值确定,由图2中的虚线描述。在运行过程中,Agent在其他Agent排斥范围内,将向分离的方向移动,当不在排斥范围内时,将向发射吸引信标位置移动,最终Agent必须要形成一个致密的覆盖区域,其致密程度将由Agent的排斥信标的范围来决定。例如,在区域中心给出一个吸引信标,Agent将由于这两种不同的信标功能,将在排斥范围的左右移动,最终将会形成近似六角形的稳定动态。如图2所示的多个Agent达到平衡的位置。Agent之间处于最短的安全距离,此时Agent受到的信标的吸引力和与其他Agent之间的排斥力将达到平衡状态。对已设计出的控制机制,在尽受两种信标作用时的最终的位置进行验证,是否形成如下形状。

3 结论

现有的多Agent系统,模块间通信采用的是数字通信方式。相对而言硬件电路较复杂,且可靠性不高。基于以上原因,本文提出一种新型的多Agent系统,模块间仅通过信标检测的方式进行信息交互。对系统的运行原理进行了详细的描述。并对Agent模块的移动规则进行主要的分析及研究,且通过仿真来进一步进行了验证。

参考文献

[1]齐一名.基于多Agent的磨矿过程智能控制系统研究[D].吉林大学,2014(06).

[2]兰少华,多Agent技术及其应用研究[D].南京理工大学,2002(11).

[3]瞿雷.Zigbee技术及应用[M].北京:北京航空航天大学出版社,2007:132-147.

[4]郭建.基于多 Agent 的智能管理信息系统研究[D].天津大学,2004(12).

上一篇:相对引用、选择性粘贴和定位在数据处理中的应... 下一篇:浅谈网络时代高校加强对大学生干部的管理