智能系统:多智能体网络系统的自适应协调控制

第7卷第3期 智能系统学报 Vol.7 No.3 2012年6月 CAAI Transactions on Intelligent Systems Jun.2012 D0I:10.3969/i.issn.16734785.201201001 多智能体网络系统的自适应协调控制 马连增2,陈雪波2,张化光 (1.东北大学信息科学与工程学院,过宁沈阳110004;2.过宁科技大学电子与信息工程学院,过宁鞍山114051) 摘要:为实现多智能体网络系统的协调控制,设计了一种新型的带有自适应协调器的控制器.基于动态图建立了 多智能体网络系统的模型,并考虑了系统的非线性互联和不可避免存在的时变时滞.应用分布式控制策略,设计了 自适应参数估计的协调器,用于调节智能体之间的互联强度,使网络达到稳定的预设水平.并基于Lyapunov-Km s0vsk茹泛函和自适应动态偏差反馈控制技术,根据拉萨尔不变集原理证明了偏差控制系统的渐近收敛性.这种控制 方法,可在系统参数不确定的情况下,同时完成参数估计和协调控制.所设计的控制律和自适应律简单,易于实现, 仿真示例验证了所提方法的有效性. 关键词:多智能体网络系统:协调控制:自适应控制:网络控制 中图分类号:TP18文献标志码:A文章编号:16734785(2012)03022005 Adaptive coordination control for networked multi-agent systems MA Lianzeng'2,CHEN Xuebo2,ZHANG Huaguang' (1.School of Information Science and Engineering,Northeast University,Shenyang 110004,China;2.School of Electronics and In- formation Engineering,Liaoning University of Science and Technology,Anshan 114051,China) Abstract:In this paper,a novel controller with an adaptive coordinator was designed in order to realize coordination control of multi-agent networked systems.First,multi-agent networked systems were modeled based on dynamic graphs while taking into consideration nonlinear interconnection and non-avoidable time-varying delays.Then,ap- plying distribution control policy,a coordinator with adaptive parameter estimation was designed to obtain the de- sired stable state by adjusting the interconnection level.Asymptotic convergence of the error control system was proved by the Lyapunov-Krasovskii function,adaptive deflection feedback control technology,and La Salle's invar- iant set theory.This method can complement parameter estimation and coordination control simultaneously under uncertainty and has the advantages of being simple and easy to complement.A simulation example was given to ver- ify the effectiveness of the proposed method. Keywords:multi-agent networked systems;coordination control;adaptive control;network control 多智能体网络系统动力学行为中的控制问题已 着诸如智能体动态交互情况下稳定性和性能的定量 成为控制理论界的重要研究课题).最近,由于多 分析、分布式条件下的任务分解和分配、互联拓扑和 智能体系统在卫星编队飞行、合作无人驾驶飞行器、 信息交换不确定等问题的挑战,因而需要控制、计 智能交通系统、空中交通控制等领域的广泛应用,多 算、通信等交叉领域新的工具和技术.很明显,控制 智能体的协调问题引起了不同学科领域学者的关 理论的发展得益于图论、分布式计算、信息理论、网 注.多智能体的协调控制问题有着广泛的研究 络分析等学科.文献[12]提出动态图建模的思想, 方向,比如编队控制、群集智能、一致性理论等[81 基于流形的双时标分析方法设计了多智能体系统的 在这些应用中,协调控制器的设计至关重要,仍面临 协调器.本文拓展了文献[12]的多智能体系统模 型,考虑了信息交换中不可避免存在的传输时滞.在 收稿日期:2012-0103. 多智能体之间固定拓扑的条件下,应用分布式控制 基金项目:国家自然科学基金资助项目(60874017,61034005) 通信作者:马连增.E-mail:mlzhxm@ina.com 策略,设计了一种新型的带有自适应协调器的控制

第3期 马连增,等:多智能体网络系统的自适应协调控制 ·221· 器,可在系统参数不确定的情况下,同时完成参数估 计和协调控制,以调节智能体之间的互联强度,使网 2自适应控制器设计与稳定性分析 络达到稳定的预设水平的目的。 考虑带有未知参数的多智能体网络系统的自适 应协调控制问题.自适应控制器设计包括3个步骤: 1系统描述 1)选择带有参数估计的自适应规律;2)选择带有更 考虑如下n个同质智能体组成的具有时变时滞 新律的控制律;3)分析所得偏差系统的收敛特性. 的多智能体网络系统,每个智能体的动力系统可描 系统模型考虑了智能体之间状态信息传输过程中的 述为: 时变时滞,它体现在互联项中,影响系统的互联强度 和动态本节的目标是设计K的更新律和A、E和 花:(t)=ax,(t)+山+ 三(0)+ E的参数自适应估计,使得当t→∞时,A→A,E→ Σ断((t-r() E,E2+E2. = 定理1当控制律K=diag(K1,k2,…,K.)由下 y:(t)=f(x(t)),i=1,2,…,n. 述更新律更新: 或整个网络系统可描述为 K=-a:[△:(t)]2,i=1,2,…,n, (t)=Ax(t)+U+E'f(x(t))+ 并且参数自适应律选择如式(3): Ef(x(t-7(t))), a=-B:△(t)(t), y(t)=f(x(t)). 号=-nA,()((t), (3) 式中:(t)=((t),x2(t),…,xn(t))为智能体的 状态向量,n为智能体的个数;A=dig(a,a2,…, 号=-6A:(t)f((t-r(t)), 式中:aB、门、6g(i,j=1,2,…,n)是任意的正常 an);E=(e)nxn和E2=(e)nxn表示内联矩阵和带 数.则im((a:-a:)=0,lim(eg-eg)=0, 有时滞项的内联矩阵,代表互联强度;(()是 0 第j个智能体的输出函数;(t)是一个随时间变化 lim()=0. 的函数,表示系统的传输时滞,它满足0≤r(t)≤ 证明令△(t)=x(t)-x(t)是期望系统和响 Tm,0≤()≤u0,Tm和4是常 应系统的状态误差,则能够得到如式(4)的误差动 量;U=(u1,山2,…,4n)T表示控制输入 态系统: A(t)=A△(t)+Ef△(t)+Ef△(t-r(t))- 假设A、E和E2是期望网络的参数,它们是未 (A -A)(t)+(E-E')f((t))+ 知的,需要估计.x(t)=(x1(t),x2(t),…,n(t) (E2-E2)fx(t-r(t)))+k(t)△(t).(4) 是期望网络的状态预设值,若取控制输人U(t)= 对于误差系统(4),选择下面的Lyapunov泛函: k(t)(x(t)-x(t)),设x(t)为控制响应系统的状 态,K(t)为控制增益,则响应系统由方程(1)或(2) V=2A()]'A(d)+∑(K+0)2+ a心: 给出 元=A(t)+Ef())+ 2ap.aa1a4o· Efx(t-r(t))+k(t)(x(t)-x(t)),(1) 层a-+月4-+ 台7 (0)=a(+新(()+ 含好- (5) 月新u-)》+((属-o》 式中:0是一个待定的常数. (2) 沿着误差系统(4)的任意轨迹,计算式(5)的导 式中:k(t)=[K1(t),k2(t),…,Kn(t)]和K(t)· 数,可以得到 (x(t)-x(t))=[K(t)(x(t)-x1(t),k2(t)· e)=[A(e)]rA()-∑(K:+)[△,()]2+ (2(t)-2(t),…,kn(t)(xn(t)-xn(t))]是反 1 馈控制项;A、E和E是完全未知的.定义期望系统 21-[△0)]7△()- 和响应系统之间的状态误差为 A(t)=x()-x(t). 29a-0)]a-(0)+

·222· 智能系统学报 第7卷 哈aa+宫民-+ [a(0][-i(a,)+a(2E(E'))+ 含高-》-a-a+ a(E(E)r+宁+2dn-ao. E(△(t)+E(△(t-r(t))- 常数0若能够合理选择,如式(10): (A-A)(t)+(E'-E')f((t))+ 0=-i(a)+A(2E'(E')r)+ (E2-E2)fx(t-r(t))+k(t)△(t)}- 含&+9[Aor+2n40Ja0)- (2E(E)月+21+2a- (10) 则可以得到 29a4-74:-e) (t)≤-[△(t)]T△(t). 很明显,当且仅当△(t)=0时,(t)=0.根据熟知 [(a,-aA(0(0+ 的拉萨尔不变集原理,从任意的初始值出发,误差系 统(4)的轨迹渐近收敛到最大不变集E.这里集合E A-A(()+ 如式(11): E={e=01A=A,E=E, (-G)Ao-01 E2=E2,k=K0∈Rmx.(11) -[△(t)]TA△(t)+[△(t)]TE△(t)+ 因此带有任意初值的未知参数A、E和E渐近 [A(t)]Ef(△(t-r(t))-[△(t)]T△(t)+ 收敛于期望系统的待辨识系数矩阵A、E和E2,证 20a0140)-茹8 明完毕 [(△(t-x()]A(t-x()).(6) 3仿真实验 由于 考虑如式(12)的多智能体网络模型: 2[A()]EA(t)≤[A(t)]E(E)T△(t)+ (t)=Ax(t)+E'f(x(t))+ [(△(t))]A(t), (7) E"f(x(t-7(t)))+U. (12) 2[A(t)]'E(△(t-r(t))≤ 式中: [A(t)]E2(E2)TA(t)+ [(△(t-(t))](△(t-(t)),(8) =81s=821 [(△(t))](A(t))≤[△(t)]TA(t).(9) 式中:l=max{1i=1,2,…,n. 图-d20e4 将式(7)~(9)代入式(6),可得 f(x)=[tanh(),tanh(2)] 假设有4个参数需要被辨识: ≤-[a)]'A)+2[a)]'E(E)'a()+ e1=2.1,e2=3.2 2a)]7ae)+2[a()]'E(E)'a()+ e品=-1.6,2=-2.4 响应系统设计如式(13): 2A:-rJ4e-》-Aa]'A0+ (t)=Ar(t)+E副f((t))+ Ef((t-7(t)))+K(t)((t)-x(t)). 2daoja)- (13) 式中: 2a(t-r()]7△(:-()≤ -[A()]AA()+2[A()]E(E)'a()+ 3ae)]7ae)+2A]'E(E)ra)- la0]r40+2d'7ao》≤ 根据定理1,设计控制更新律和参数自适应律 如式(14):

第3期 马连增,等:多智能体网络系统的自适应协调控制 ·223 K=-2.5(-x)2,i=1,2, e=-4.01(x-x)anh(x(c)), 2 e2=-5.0(2-x)tanh((t), e品:=-2.8(-x)tanh(x,(t-e/(e+l)), e2=-3.0(x2-x2)tanh((t-e/(e+1)). MMA (14) 若取各个初值为: [x(s),x2(s)]=(0.1,0.1), [x(s),x2(s)]=(0.2,0.2),s∈[-1,0], 0 100 200300 400 500 [k1(0),k2(0)]=(0.1,0.1), [e(0),e22(0),e(0),e2(0)]= (b)偏差e2 (-2,5,-1,0.8). 图2给定和响应系统的状态误差轨迹曲线 根据定理1,可以得到im(a-a:)=0, Fig.2 State error trajectories of set-point and response systems lim(e-e)=0,im(e-e)=0,i,j=1,2.由仿真 曲线(图1~2所示)可见,系统的误差快速趋近于 4结束语 零,而且系统中那些未知的参数被准确地辨识出来 自适应协调控制是控制多智能体网络系统最吸 数值仿真实验验证了本文所提出的定理的有效性, 引人的方法.一般来说,系统可以有动态结构不确定 性或参数不确定性.本文提出的方法只能处理具有 固定结构的参数不确定系统,并且设计相对比较简 0-e 单.不同于以前相关研究考虑的系统模型,本文同时 考虑非线性互联项和包含在互联项中的时变传输时 滞,因而更贴近于实际,但基于Lyapunov-Krasovskii 泛函选择得到的定理难免有一定的特殊性和保守 性.进一步的研究可以考虑结构不确定性和采用复 合自适应控制的方法. 参考文献: 100 200300 400 500 t/s [1]JADBABAIE A,LIN J,MORSE A S.Coordination of 图1参数辨识曲线 groups of mobile autonomous agents using nearest neighbor Fig.1 Parametric identification curves rules[J].IEEE Transactions on Automatic Control,2003, 48(6):988-1001. [2]REN W,BEARD R W.Consensus seeking in multi-agent systems under dynamically changing interaction topologies [J].IEEE Transactions on Automatic Control,2005,50 (5):655661. [3]MOREAU L.Stability of multi-agent systems with time-de- pendent communication links[J].IEEE Transactions on Automatic Control,2005,50(2):169-181. [4]OLFATI-SABER R.Flocking for multi-agent dynamic sys- tems:algorithms and theory[J].IEEE Transactions on Au- tomatic Control,2006,51(3):401-420. 100 200300400500 [5]SAVKIN A V.Coordinated collective motion of groups of autonomous mobile robots:analysis of Vicsek's model[J]. (a)偏差e IEEE Transactions on Automatic Control,2004,39(6): 981-983

·224· 智能系统学报 第7卷 [6]|LI Zhongkui,DUAN Zhisheng,CHEN Guanrong,et al. 作者简介: Consensus of multiagent systems and synchronization of 马连增,男,1970年生,副教授,博士 complex networks:a unified viewpoint[IEEE Transac- 研究生,主要研究方向为非线性系统、组 tions on Circuits and Systems,2010,57(1)):213-224. 群系统分散控制,参与国家自然科学基金 ⑦]洪奕光,翟超.多智能体系统动态协调与分布式控制设 项目2项,发表学术论文8篇 计切1.控制理论与应用,2011,28(10)':1506-1512. HONG Yiguang,ZHAI Chao.Dynamic coordination and distributed control design of multi-agent systems[J].Con trol Theory and Applications,2011,28(10)):1506-1512. 陈雪波,男,1960年生,教授,博士 图梅杰,张海博,马广富.有向图中网络Euler-Lagrange系 生导师,中国自动化学会过程控制专 统的自适应协调跟踪[J].自动化学报,2011,37(5): 业委员会委员.主要研究方向为复杂系 596-603. 统、多智能体系统等.主持多项国家及 MEI Jie,ZHANG Haibo,MA Guangfu.Adaptive coordina- 省部级科研基金项目。 ted tracking for networked Euler-Lagrange systems under a directed graph[J].Acta Automatica Sinica,2011,37(5)): 596-603. 张化光,男,1959年生,教授,博士 []CORTES J.Distributed algorithms for reaching consensus on 生导师,流程工业综合自动化国家教 general functions[J].Automatica,2008,44(3),:726- 育部重点实验室副主任,中国人工智 737. 能学会智能系统专业委员会副主任委 [0]]ARCAK M.Passivity as a design tool for group coordina- 员.主要研究方向为复杂系统的模糊自 tion[J].IEEE Transactions on Automatic Control,2007, 适应控制、非线性控制等.作为课题负 52(⑧)):1380-1390. 责人曾获得国家自然科学基金重点或面上项目(4项)、国 [1]]HONG Yiguang,HU Jiangping,GAO Linxin.Tracking 家“863“计划重大项目(4项)、归国商学人员基金、国家教 control for multi-agent consensus with an active leader and 委博士点金、辽宁省重点科技攻关课题、国家教育部国 variable topology[J].Automatica,2006,42(7):1177- 际合作专项基金等资助,以及承担了20余项企业的重大自 1182. 动化工程项目.曾作为第一获奖人获国家、省部级科技进 [1]SILJAK DD.Dynamic graphs[J]].Nonlinear Analysis: 步奖和自然科学奖6项,申请国家技术发明专利20余项.发 Hybrid Systems,2008,2(2):544-567. 表学术论文300余篇,被SCI、旦、STP检索200余篇
马连增,男,1970年生,副教授,博士 研究生,主要研究方向为非线性系统、组 群系统分散控制,参与国家自然科学基金 项目2项,发表学术论文8篇. [6] LI Zhongkui,DUAN Zhisheng,CHEN Guanrong,et al. Consensus of multiagent systems and synchronization of complex networks: a unified viewpoint[ J] . IEEE Transactions on Circuits and Systems,2010,57(1) :213-224. ·224· 第7卷 张化光,男,1959年生,教授,博士 生导师,流程工业综合自动化国家教 育部重点实验室副主任,中国人工智 能学会智能系统专业委员会副主任委 员.主要研究方向为复杂系统的模糊自 [1] HONG Yiguang,HU Jiangping,GAO Linxin. Tracking control for multi-agent consensus with an active leader and variable topology[J]. Automatica,2006,42(7) :1177- 1182. [8] 梅杰,张海博,马广富.有向图中网络 Euler-Lagrange系 统的自适应协调跟踪[J] .自动化学报,2011,37(5) : 596-603. [7] 适应控制、非线性控制等.作为课题负 责人曾获得国家自然科学基金重点或面上项目(4项) 、 国 家"863"计划重大项目(4项) 、归国留学人员基金、国家教 委博士点基金、辽宁省重点科技攻关课题、国家教育部国 际合作专项基金等资助,以及承担了20余项企业的重大自 动化工程项目.曾作为第一获奖人获国家、省部级科技进 步奖和自然科学奖6项,申请国家技术发明专利20余项.发 表学术论文300余篇,被SCI、EI、ISTP检索200余篇. 洪奕光,翟超.多智能体系统动态协调与分布式控制设 计[J] .控制理论与应用,2011,28(10) :1506-1512. HONG Yiguang,ZHAI Chao. Dynamic coordination and distributed control design of multi-agent systems[J]. Control Theory and Applications,2011,28(10) : 1506-1512. [9] CORTES J. Distributed algorithms for reaching consensus on general functions[J] . Automatica,2008,44(3) : 726- 737. [12] SILJAK D D. Dynamic graphs[J] . Nonlinear Analysis: Hybrid Systems,2008,2(2) :544-567. MEI Jie,ZHANG Haibo,MA Guangfu. Adaptive coordinated tracking for networked Euler-Lagrange systems under a directed graph[J] . Acta Automatica Sinica,2011,37(5) : 596-603. 作者简介: 陈雪波,男,1960年生,教授,博士 生导师,中国自动化学会过程控制专 业委员会委员.主要研究方向为复杂系 统、多智能体系统等.主持多项国家及 省部级科研基金项目. [10] ARCAK M. Passivity as a design tool for group coordination[J]. IEEE Transactions on Automatic Control,2007, 52(8) : 1380-1390. 智 能 系 统 学 报
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 智能系统:基于认知模型的室内移动服务机器人人机耦合协同作业机制.pdf
- 智能系统:基于自适应差分进化的干线交通信号协调控制.pdf
- 智能系统:基于联系数的不确定空情意图识别.pdf
- 智能系统:基于止血机制的冗余并联机器人精准容错控制.pdf
- 智能系统:基于改进粒子群算法的污水处理过程神经网络优化控制.pdf
- 智能系统:基于外骨骼机器人技术的人体手臂震颤抑制的理论和方法.pdf
- 智能系统:基于FPGA的全流水双精度浮点矩阵乘法器设计.pdf
- 智能系统:城市交通最优路径算法.pdf
- 智能系统:图像复原中的模糊参数估计.pdf
- 智能系统:图书馆机器人机械手参数自整定模糊PID控制器设计.pdf
- 智能系统:单喷泵无人滑行艇航向的反步自适应滑模控制.pdf
- 智能系统:动力总成振动对车内噪声的传递路径影响.pdf
- 智能系统:具有时变时滞耦合的二阶多主体系统的编队控制.pdf
- 智能系统:一种采用脊线特征的指纹模糊匹配方法.pdf
- 智能系统:一种能量有效的无线传感器网络轮询接入控制协议.pdf
- 人工智能基础:结合GM(1,1)和LSSVM的多效蒸发过程参数预测.pdf
- 人工智能基础:混合改进蚁群算法的函数优化.pdf
- 人工智能基础:模糊相似关系下变精度模糊粗糙集.pdf
- 人工智能基础:概率联系数化的原理及其在概率推理中的应用.pdf
- 人工智能基础:最坏情况下Min-2SAT问题的上界.pdf
- 智能系统:模糊CMAC的柔性空间机器人轨迹跟踪自学习控制.pdf
- 智能系统:模糊自适应的高超飞行器控制与干扰.pdf
- 智能系统:求解旅行商问题的混合粒子群优化算法.pdf
- 智能系统:离散时间混合多智能体的拟平均一致性控制.pdf
- 智能系统:自适应扩维UKF算法在SINSGPS组合导航系统中的应用.pdf
- 智能系统:采用时间差分算法的九路围棋机器博弈系统.pdf
- 机器学习:基于图像处理技术的瞳孔和角膜反射中心提取算法.pdf
- 机器学习:视觉关注转移的事件检测算法.pdf
- 机器学习:逻辑回归分析的马尔可夫毯学习算法.pdf
- 机器感知与模式识别:一种无线传感器信号衰减自适应测距模型.pdf
- 机器感知与模式识别:使用稀疏约束非负矩阵分解算法的跨年龄人脸识别.pdf
- 机器感知与模式识别:基于图像显著性特征的铸坯表面缺陷检测.pdf
- 机器感知与模式识别:视频下的正面人体身份自动识别.pdf
- 机器感知与模式识别:采用Hough变换的道路边界检测算法.pdf
- 机器感知与模式识别:采用旋转校正的指静脉图像感兴趣区域提取方法.pdf
- 知识工程:面向学术社区的专家推荐模型.pdf
- 【脑认知基础】脑电信号的小波变换和样本熵特征提取方法.pdf
- 【自然语言处理与理解】基于关联词的主题模型语义标注.pdf
- 【自然语言处理与理解】基于文本的新闻事件多版本发现模型.pdf
- 【自然语言处理与理解】基于词共现图的中文微博新闻话题识别.pdf