1.一种多时延影响下的智能无人集群系统最优一致性协同控制方法,其特征在于,包括:S1:获取智能无人集群系统中智能体的交互信息,根据交互信息确定系统的拓扑结构;
S2:设置智能体中Actor网络和Critic网络的权重初始值;
S3:智能体向邻居智能体发送自身的状态信息,智能体根据邻居智能体的状态信息和自身的状态信息计算智能体状态误差;其中,状态信息包括状态变量和控制信息;
S4:Critic网络和Actor网络均根据当前时刻的智能体状态误差和网络权重更新下一时刻的网络权重;Actor网络根据当前时刻的Actor网络权重和当前时刻的智能体状态误差更新控制信息;
S5:根据Critic网络的权重判断智能无人集群系统是否达到一致,若达到一致,则采用当前Critic网络的控制信息控制智能体,否则,返回步骤S3。
2.根据权利要求1所述的一种多时延影响下的智能无人集群系统最优一致性协同控制方法,其特征在于,智能体自身的状态信息和控制信息表示为:其中, 表示第i个智能体在k时刻的状态信息, 表示第i个智能体在
时刻到k时刻的状态变量, 表示表示第i个智能体在 时刻到
k‑1时刻的控制输入,表示最大状态时延,表示最大输入时延。
3.根据权利要求1所述的一种多时延影响下的智能无人集群系统最优一致性协同控制方法,其特征在于,计算智能体状态误差的公式为:其中,ei(k)表示第i个智能体上新的状态信息 下的一致性误差; 表示智能体i的邻居节点;aij表示智能体j到智能体i的连接权重;bi表示智能体i上的牵制控制;
表示领导者在k时刻的状态信息。
4.根据权利要求1所述的一种多时延影响下的智能无人集群系统最优一致性协同控制方法,其特征在于,Critic网络更新下一时刻的网络权重的过程包括:Critic网络根据当前时刻的Critic网络权重和智能体状态误差计算当前时刻的性能表现指数以及下一时刻的性能表现指数,根据当前时刻的性能表现指数、当下一时刻的性能表现指数、当前时刻智能体的状态信息和当前时刻的智能体状态误差计算第一时序误差;根据第一时序误差计算第一目标函数;根据第一目标函数和当前时刻的网络权重计算下一时刻的网络权重。
5.根据权利要求4所述的一种多时延影响下的智能无人集群系统最优一致性协同控制方法,其特征在于,计算性能表现指数的公式为:其中,V(ei(k))为性能表现指数; 表示在第l轮迭代时智能体i上的Critic网络权重;sc,i(k)表示在第i个智能体上Critic网络的输入;σ(·)表示网络中节点上的激活函数。
6.根据权利要求4所述的一种多时延影响下的智能无人集群系统最优一致性协同控制方法,其特征在于,计算第一时序误差的公式为:κc,i=Vi(ei(k))‑r(ei(k),ui(k),uj(k))‑αVi(ei(k+1))其中,κc,i表示当前时刻的第一时序误差,Vi(ei(k))表示第i个智能体在k时刻的性能表现指数;r(·)为效用函数;ui(k)表示第i个智能体在k时刻下的控制输入,uj(k)表示智能体i的邻居智能体j在k时刻下的控制输入,ei(k)表示第i个智能体上新的状态信息下的一致性误差;α表示折扣因子;Vi(ei(k+1)表示第i个智能体在k+1时刻性能表现指数。
7.根据权利要求1所述的一种多时延影响下的智能无人集群系统最优一致性协同控制方法,其特征在于,Actor网络更新下一时刻的网络权重的过程包括:根据当前时刻的Critic网络权重和智能体状态误差计算当前时刻的性能表现指数;将当前时刻的性能表现指数作为第二时序误差并根据第二时序误差计算第二目标函数;根据第二目标函数和当前时刻的网络权重计算下一时刻的网络权重。
8.根据权利要求1所述的一种多时延影响下的智能无人集群系统最优一致性协同控制方法,其特征在于,更新控制信息的公式为:其中, 表示第i个智能体在k时刻的控制输入, 表示第l轮迭代时智能体i上的Actor网络权重,sa,i(k)表示第i个智能体在k时刻Actor网络的输入。
9.根据权利要求1所述的一种多时延影响下的智能无人集群系统最优一致性协同控制方法,其特征在于,智能无人集群系统达到一致的公式为:其中, 表示在第l轮迭代时智能体i上的Critic网络权重, 表示第l+1轮迭代时智能体i上的Critic网络权重,∈表示稳定阈值。