admin管理员组

文章数量:1531792

基于改进SAP算法的势博弈无人机任务分配

UAV Task Assignment Based on Potential Game with Improved SAP Algorithm | SpringerLink

摘要

基于势博弈(potential game)的分布式控制与决策是一种同时考虑个体和集体利益的策略,因为其优势在于通过智能体的最优选择逐渐提高群体的收益。势博弈是解决分布式系统中信息不完全问题的合理方案,为此,设计了一种基于势博弈的无人机任务分配模型。提出了一种改进的空间自适应博弈( SAP )算法【3.2】,通过调整联盟结构来求解最优解,并证明了纳什均衡( NE )的收敛性和平衡性【3.3】。仿真结果表明【4】,我们提出的改进的势博弈模型可以解决分布式下的无人机任务分配问题

1 引言

目前,许多多无人机任务分配算法如数学规划法、仿生算法、神经网络、多智能体强化学习等已成功应用于大量的任务分配项目中。

动态博弈理论(dynamic game theory)的提出是为了解决众多研究中的个体博弈问题势博弈作为一种很有前途的技术,由于其在制定行动策略方面的优势,特别是在涉及竞争对手的复杂情况下,受到了越来越多的关注。

搜索"Task assignment based on the dynamic alliance formation game."可以有很多相关的文献。

“本文结合无人机任务分配问题的特点,将无人机蜂群按照任务对象进行分组,提出了一种改进的势博弈算法。将任务分配问题描述为求解博弈模型最优解的问题【2.2】,通过改进SAP算法对其进行优化。通过仿真实验,本文提出的算法在可行性和有效性方面都有较好的表现。”

2 数学模型

2.1 UAV的简化模型

2.2 任务分配模型

定义了无人机形成的联盟。

全局收益(也是任务分配模型)为

 式子(6)为 在方案a下分配任务 j 所获得的收益

3 基于势博弈的任务分配

3.1 博弈框架和无人机效用函数

将任务分配问题描述为求解博弈模型最优解的问题。无人机是博弈的参与者。为了得到一个策略轮廓,需要建立一个博弈模型,这个模型被称为纳什均衡( NE )。

 式子(9)为方案a下的个体收益

当个体(式9)和全局(式5)收益函数满足特定要求时,优化过程即为潜在博弈的收敛过程,达到NE。

3.2 博弈优化算法

空间自适应博弈( spatial adaptive play,SAP )算法是空间博弈中的一种自适应学习方法,可以根据任务分配问题的特点进行调整。

periodic mechanism周期机制

分布式环境下智能体的随机选择是困难的,因此引入周期自适应选择机制来考虑周期更新。每架无人机以M1到Mn为一个周期进行更新。虽然放弃了一定的随机性,但仍能满足SAP算法的要求。

为了提高SAP的收敛速度,在智能体更新任务时加入了基于邻居信息和历史信息的全局修改。如果更新后的收益低于邻居最优解或历史最优解,无人机将放弃任务更新,随机选择新的任务更新。

 式子(12)为改进的SAP算法(无人机 i 的任务选择概率分布)

3.3 NE(纳什均衡)分析

理论多多,没咋看

基于改进势博弈的无人机任务分配详细流程图

图中提到的公式如上,黄色标记处为3.2节

4 仿真实验

在规定的任务区域内设计了仿真实验。任务区域设置为10 km × 10 km × 1 km的矩形空间。

设计15架无人机对5个目标任务进行协同打击的任务分配

5 总结

针对无人机任务分配问题中分布式协调控制的需求,本文提出了一种基于改进势博弈的任务分配方法。首先,将任务分配问题描述为联盟形成博弈模型,并设计了无人机个体和全局收益函数。接下来,利用改进的SAP算法对博弈模型进行优化求解。仿真结果表明,所提方法在有限时间内的任务分配均衡度和任务收益度具有较好的优势,验证了该方法的有效性。未来的研究重点将是提高分布式算法求解结果的优化性和稳定性,以及在复杂动态任务场景中的应用。

本文标签: 笔记论文TaskAssignmentBased