基于模型选择的多智能体行为预测方法研究-南通市图书馆

文献详情 >基于模型选择的多智能体行为预测方法研究收藏

基于模型选择的多智能体行为预测方法研究

学位级别：硕士

导师姓名：魏小鹏

授予年度：2021年

学科分类：12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术（可授工学、理学学位）]

主题：多智能体系统行为预测模型选择

摘要：近年来,针对智能体或多智能体系统的研究已经成为当前人工智能领域的研究热点之一。在多智能体系统中,多个智能体往往需要通过交互(例如,合作、竞争等)完成目标任务。本质上,智能体之间的高效交互可以通过分析并预测其他智能体的行为实现,进而提升整体系统任务完成的速率和成功率。其中,一种广泛使用的方法是利用智能体历史交互信息构建对手行为模型来预测当前交互过程中相关智能体的策略或行为。然而,该类方法需要在大量的候选模型中选择最合适的模型完成智能体行为预测任务,具有较高的时间和空间代价。因此,本文提出了一种基于次模函数优化的模型选择方案,致力于解决复杂多智能体系统中的智能体行为预测问题。首先,针对预测模型选择困难的问题,本文提出了一种基于次模函数的模型空间优化方法。该方法能够从大规模的候选模型中提取出具有代表性的小规模模型子集,极大地缩小智能体预测模型的筛选空间。此外,次模函数的性质保证所得模型子集的解在最差情况下不低于最优解的(1-1/e)。具体地,本文针对多智能体系统中使用次模函数求解候选模型子集的问题提出了两种解决方案:(1)在不考虑智能体物理内存空间局限的理想情况下,提出离线的次模函数求解方案,在智能体交互之前利用历史交互信息构建对手智能体行为模型,并基于候选模型之间的相似性统一筛选出具有代表性的候选模型子集;(2)考虑智能体物理内存有限的真实复杂场景,提出分批次的在线次模函数模型选择方案,在智能体交互的过程中通过最小化增量模型与已选模型子集的重合度更新模型子集。其次,本文引入基于置信度上界的多臂赌博机算法,致力于在智能体交互过程中在线识别出预测模型子集中最适用的模型对对手行为进行预测。该方法通过多次探索预测模型子集中每个模型的奖励分布,可以有效平衡针对模型子集空间的探索和利用,获取更多预测收益。此外,本文还引入了一种基于“精英模仿示范学习策略的知识迁移方法。该策略支持适应度高的精英智能体将有益知识分享给与其经历相似但学习能力较差的智能体,以此来提高智能体的表现能力并加速系统的学习进程。最后,本文将所提出的方法整合到一个现有基于模因计算的多智能体学习系统框架中。利用该系统在复杂的雷区导航任务平台进行实验并与现有方法进行对比,证明了所提出的方法在解决智能体行为预测问题上的有效性。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于模型选择的多智能体行为预测方法研究

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于模型选择的多智能体行为预测方法研究

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：