检索结果-南通市图书馆

飞行力学 2024年

作者：蒋方庆陈自力高喜俊张云陆军工程大学

在执行区域侦察任务时，无人机需要更高性能的算法，以便对未知辐射源目标进行快速准确定位。利用改进的双延迟深度确定性策略梯度算法（Twin Delayed Deep Deterministic Policy Gradient，TD3）实现无人机快速侦察目标。针对TD3算法... 详细信息

在执行区域侦察任务时，无人机需要更高性能的算法，以便对未知辐射源目标进行快速准确定位。利用改进的双延迟深度确定性策略梯度算法（Twin Delayed Deep Deterministic Policy Gradient，TD3）实现无人机快速侦察目标。针对TD3算法的单策略网络输出动作波动大问题，提出构建双A网络来缓解。并提出利用带修正偏差的指数移动加权平均法建立价值网络与策略网络更新之间的联系，以自适应地改变更新周期。当无人机接收到辐射源信号时，采用最优航迹对辐射源进行定位。未检测到信号时，则根据历史经验飞行寻找信号源。仿真结果表明，所提方法可有效提高算法的收敛速度。

关键词：无人机双延迟深度确定性策略梯度算法双策略网络自适应延迟更新机制

来源：

同方期刊数据库评论

在线全文

同方期刊数据库

学校读者我要写书评

暂无评论

基于改进TD3算法的无人机决策研究

引用

信息化研究 2023年第3期49卷 36-42页

作者：蒋方庆陈自力高喜俊王春峰贺道坤陆军工程大学石家庄校区石家庄050003 南京信息职业技术学院智能制造学院南京210023

针对无人机在执行打击任务时,对飞行区域的环境掌握甚少、飞行区域大、目标稀疏、火力威胁等相对不确定因素会导致任务的完成度低的问题。本文提出利用双策略网络对双延迟深度确定性策略梯度算法(TD3)进行改进,解决单策略动作波动大问... 详细信息

针对无人机在执行打击任务时,对飞行区域的环境掌握甚少、飞行区域大、目标稀疏、火力威胁等相对不确定因素会导致任务的完成度低的问题。本文提出利用双策略网络对双延迟深度确定性策略梯度算法(TD3)进行改进,解决单策略动作波动大问题。针对优质训练样本利用率低导致的收敛速度慢问题,采用优先经验回放机制提高优质样本利用率。使用改进后的TD3算法训练无人机,通过改变偏航角、俯仰角以及速度控制无人机飞行,无人机在三维环境中完成抵近打击任务并规避威胁。实验结果表明,改进后的算法相比于传统TD3算法,算法收敛的速度更快,无人机的任务完成度可相对提高15%。

关键词：无人机双延迟深度确定性策略梯度算法双策略网络优先经验回放

来源：

维普期刊数据库

同方期刊数据库评论

在线全文

学校读者我要写书评

暂无评论

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

在线全文

在线全文

请选择保存的检索档案：

请选择收藏分类：

通借通还

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

在线全文

在线全文

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：