考虑量化的多智能体系统数据驱动双向一致性控制

来源 :控制理论与应用 | 被引量 : 0次 | 上传用户：zhx35003

【摘要】

：

针对未知动力学模型非线性离散时间多智能体系统,在信息传递过程中的数据量化问题,以及智能体之间的合作与竞争关系,提出了一种数据驱动控制算法,实现了多智能体系统的双向一致性跟踪控制.首先,利用紧凑形动态线性化(CFDL)方法,将未知动力学模型的非线性智能体转化为含有时变参数的数据模型,并通过设计性能指标函数获得时变参数的估计算法;然后基于该数据模型,利用代数图论和扇形界算法,设计了一种量化数据驱动分布式双向一致性跟踪控制协议,并对其收敛性给出了严格的证明.结果表明,当多智能体系统存在数据量化时,所设计的控制协

【作者】

：

赵华荣彭力于洪年沈奕宏

【机构】

：

江南大学物联网应用技术教育部工程中心,江苏无锡214122;江南大学物联网应用技术教育部工程中心,江苏无锡214122;无锡太湖学院江苏省物联网应用技术重点建设实验室,江苏无锡214064;爱丁堡龙比

【出处】

：

控制理论与应用

【发表日期】

：

2022年2期

【关键词】

：

数据驱动控制多智能体系统双向一致性控制量化控制无模型自适应控制

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

纤维对混凝土性能的影响研究进展

纤维混凝土是指在混凝中掺加纤维,以达到提高混凝土抗弯抗拉韧性的目的.目前关于纤维混凝土的研究多以试验及定性分析为主,难以形成统一的指导纤维设计的理论系统.因此,本文从纤维的材性、尺寸形状以及掺量三个方面的变量对混凝土力学性能的影响进行了论述,并对纤维混凝未来的研究方向提出了几点建议,以供参考.

期刊

纤维混凝土尺寸效应纤维种类混杂纤维工程应用

多步积累奖励的双重时序Q网络算法

车辆行驶控制决策是无人驾驶的核心技术,现有基于深度强化学习的无人驾驶控制决策算法存在处理数据效率低、无法有效提取状态间时序特征等问题.因此本文提出了一种基于多步积累奖励的双重时序Q网络算法.首先,设计了一种多步积累奖励方法,该方法对未来多步即时奖励的累加和进行均值化,与当前即时奖励共同作用于智能体的控制策略,并在奖励函数中突出当前即时奖励的主导影响.接着设计了一种长短期记忆网络和卷积神经网络相结合的时序网络结构,增强智能体对数据间时序特征的捕获能力.实验结果验证了时序网络和多步积累奖励方法有助于提升智能体

期刊

深度强化学习无人车多步积累奖励时序网络数据利用率

间歇过程动态潜结构阶段划分与在线监控

阶段划分是间歇过程准确建模和有效监控的前提.针对传统阶段划分方法未考虑间歇过程的动态性造成阶段划分不准确、影响监控精度,且具有参数选择难、鲁棒性差的局限,提出一种基于动态潜结构的动态间歇过程阶段划分与在线监控方法.首先,对间歇过程三维张量数据沿变量方向展开,并增加时滞变量构建增广矩阵来提取过程动态关系;然后,以增广矩阵作为输入,定义一种新的基于解释方差变化的合并代价函数,衡量不同子序列之间的动态潜结构相似度;利用上述动态潜结构相似度的衡量标准,提出基于自底向上启发式搜索策略的动态间歇过程阶段划分方法;最后

期刊

间歇过程过程监控动态主元分析相似性度量

簇中心初始选择策略与更新异权机制相耦合的MDBA算法

在聚类任务中,初始簇中心的选取和更新方式影响聚类结果的准确性.针对现有DBA算法初始簇中心选择的不确定性、簇中心更新序列的差异性以及算法复杂度高、收敛性差等问题,提出了一种融合簇中心初始选择策略与更新异权机制的MDBA算法.MDBA算法针对DBA算法中初始簇中心选取的不确定性问题,通过选取数据集中惯性最小的时间序列作为初始簇中心以消除其随机性;同时,利用更新异权机制更新簇中心以改善DBA算法中簇中心更新时数据集中序列存在差异性问题.数值实验结果表明,相比于原算法,簇中心初始选择策略迭代的最终惯性值接近多次

期刊

时间序列DBA算法初始选择策略更新异权机制收敛性分析

事件触发下马尔可夫跳跃神经网络的随机同步

本文研究了事件触发机制下带有随机噪声的马尔可夫跳跃神经网络的随机同步问题.为了更有效地降低数据传输量和节约网络资源,本文采用了一种事件触发控制.当传输误差和状态误差满足触发条件时,数据才能够被传输,使得主从系统可以在有限的资源和带宽下实现同步.通过构建新的Lyapunov泛函,以及使用广义Dynkin公式和不等式分析方法,得到误差系统的稳定性条件,并能够进一步保证主系统和从系统的随机同步.最后利用MATLAB进行仿真实验,结果表明与采样数据控制相比,事件触发控制能够有效减少数据传输次数,同时该数值例子验证

期刊

神经网络随机同步事件触发控制马尔可夫跳跃参数

基于深度强化学习与自学习的多无人机近距空战机动策略生成算法

为解决多无人机近距空战机动决策问题,提出一种基于参数共享Q网络与虚拟自我对局的多无人机近距空战机动策略生成算法.首先,设计一种适用于不同无人机编队规模的混合马尔可夫博弈模型与多无人机机动决策策略生成强化学习框架一参数共享Q网络,并通过自编码器对状态空间进行压缩以提高策略学习效率.然后,使用虚拟自我对局方法使机动策略收敛至纳什均衡策略.最后对自编码器的参数选择、策略生成算法的训练过程与机动策略的合理性与迁移性进行了仿真实验.通过仿真结果表明,引入自编码器可以有效地提高策略学习效率,并且使用该算法生成的多无人

期刊

空战决策多无人机协同强化学习虚拟自我对局

适宜老年人居住的室内空间设计探讨

近年来,随着市场经济的高速发展,人们的物质生活水平不断提高,也开始更加注重自己的居住环境,希望能够有一种更为舒适安逸的生活.特别是对于老年人的居住室内空间设计而言,更是需要兼顾舒适性、安全性和老年人的需求.鉴于此,本文将着重分析适宜老年人居住的室内空间设计情况,了解设计原则及要点,并提出具体优化策略,旨在创设出一种适合老年人居住的室内空间环境.

期刊

老年人室内空间设计探讨

预拌混凝土粉料储存仓及操作方法

本文通过预拌混凝土粉料储存仓结构及操作方式创新,对预拌混凝土粉料筒设置预拌混凝土粉料筒仓固定架,对预拌混凝土粉料安全上料采用预拌混凝土粉料上料固定装置,同时针对特殊时期仓筒需扩容时采用预拌混凝土粉料储仓组合扩储技术,针对预拌混凝土上料智能控制采用预拌混凝土粉料仓智慧控制技术,本文所提供的操作方式具有较高创造性,有重要的参考价值.

期刊

预拌混凝土储存仓智慧控制

荷载不确定移动机器人视觉伺服系统鲁棒预测控制

考虑具有可见性约束和执行器约束的载荷不确定移动机器人视觉伺服系统,提出一种鲁棒视觉伺服预测控制策略.首先将该移动机器人视觉伺服系统建模为关于视觉伺服误差和驱动的不确定系统.其次,对约束的视觉伺服误差子系统,设计基于半正定规划的速度规划预测控制算法.该算法分为离线计算和在线调度两个部分,降低预测控制算法的在线计算量.而对约束的视觉伺服驱动子系统,采用极小极大鲁棒预测控制算法,实现对视觉伺服误差子系统的规划速度的渐近跟踪.进一步,建立了载荷不确定移动机器人视觉伺服误差和驱动系统的鲁棒渐近稳定性结果.最后,对比

期刊

移动机器人视觉伺服模型预测控制约束鲁棒稳定性

具有未知负载扰动的水井钻机电液伺服系统无模型自适应控制

针对电液伺服系统在水井钻机推进工况下存在的参数不确定以及未知负载扰动突变等非线性因素,提出了基于径向基(RBF)神经网络扰动观测器的无模型自适应控制方法.首先,通过改进的无模型自适应控制动态线性化方法,将被控系统线性化为与输入输出相关的增量形式,并将未知负载扰动合并到一个非线性项中;然后,设计了径向基神经网络扰动观测器对含有未知负载扰动的非线性项进行估计,作为对未知扰动的补偿;最后,设计了时变参数估计律,通过在线调整伪偏导数,给出了电液伺服系统的控制更新律.仿真结果表明,所设计的控制器能够对未知负载扰动突

期刊

水井钻机电液伺服系统无模型自适应控制径向基神经网络扰动

考虑量化的多智能体系统数据驱动双向一致性控制

与本文相关的学术论文