咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >带泊松跳跃的线性二次平均场随机博弈问题研究及应用 收藏
带泊松跳跃的线性二次平均场随机博弈问题研究及应用

带泊松跳跃的线性二次平均场随机博弈问题研究及应用

作     者:周莹 

作者单位:齐鲁工业大学 

学位级别:硕士

导师姓名:徐瑞民

授予年度:2024年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 07[理学] 070105[理学-运筹学与控制论] 0701[理学-数学] 

主      题:泊松跳跃 线性二次 平均场博弈 主从参与者 Markov跳跃 ?-Nash均衡 

摘      要:本文研究了带泊松跳跃的线性二次平均场随机博弈问题,其中每个参与者的扩散项包含状态项和控制项。平均场系统的最大的特点是每个普通参与者对其他参与者的单独作用可以忽略,但是所有普通参与者的群体行为以平均场项耦合项的形式对每个参与者的状态方程和效用泛函产生了显著的影响。平均场随机博弈问题的核心困难是如何解决参与者之间以平均场耦合项形式体现的交互影响。为了处理平均场耦合项带来的困难,本文使用纳什确定性方法(Nash Certainty Equivalency,简称NCE)构造了一组分散控制策略。论证了这组分散控制策略的渐近最优性,称之为?-Nash均衡策略。本文还研究了一类定价问题,说明平均场对策问题的研究动机和实际应用背景。最后,数值算例验证了平均场估计的一致性,以及平均场项对参与者状态轨迹的影响。 论文的第一章,就本文所研究问题的研究背景进行深入介绍,详细阐述了本文所做的主要工作。 论文的第二章研究了一类含N个同等地位的普通参与者的带泊松跳跃的线性二次平均场随机博弈问题。与已有的研究成果相比,在本章的平均场博弈系统中,参与者状态方程的扩散项含状态项和控制项,且状态方程带泊松跳跃项。研究的目标是:每一个参与者,都需要在考虑其他参与者行为的前提下,选择自己的控制策略,以最优化自己的效用泛函。为解决此问题,借助NCE方法,首先根据平均场博弈系统构造相应的极限控制系统,给出此极限系统最优控制的反馈形式。然后,验证耦合的NCE方程解的存在唯一性,确定平均场逼近项的表达式,进而根据极限系统最优控制的反馈形式构造原平均场博弈系统的分散控制策略。最后,论证平均场博弈系统与极限系统之间的逼近关系,根据逼近关系证明所设计的分散控制策略为平均场博弈系统的?-Nash均衡策略。通过一个定价问题,验证了理论成果的应用价值。 论文的第三章研究了一类含主从参与者的带泊松跳跃的线性二次平均场随机博弈问题,此博弈系统包含一个主要参与者(Major agent)与N个具有相同地位的普通参与者(Minor agent)。在此平均场博弈系统中,主要参与者的状态、效用泛函受平均场项的影响,每一个普通参与者的状态方程与效用泛函既受到主要参与者的影响,也受到平均场项的影响。所有参与者的方程均为含泊松跳跃项的随机微分方程形式。在分析参与者根据自己的状态信息、群体行为信息来选择自己的最优控制策略时,需要从主要参与者、普通参与者两个角度分别进行分析。具体处理步骤如下: 第一步,根据所研究的含主从参与者的平均场博弈系统构造两个辅助的极限控制系统,给出此极限系统的最优控制策略。第二步,根据耦合的NCE方程确定平均场逼近项满足的方程形式,进而根据极限系统最优控制策略的反馈形式构造原平均场博弈系统的分散控制策略。最后,论证含主从参与者的平均场博弈系统与极限系统之间的逼近关系,根据逼近关系证明所设计的分散控制策略为带主从参与者的平均场博弈系统的?-Nash均衡策略。 论文的第四章,为了研究实际问题中存在的许多由于突变因素而引起系统状态和参数跳变的现象,本章研究了一类含N个同等地位的普通参与者的带Markov跳的线性二次平均场随机博弈问题。每个参与者状态方程和效用泛函中的系数均为含Markov跳跃的情形。每一个参与者需要依据自身的状态信息和群体行为信息来选择自己的控制策略,以最优化其效用泛函。 为解决此问题,首先根据平均场博弈系统构造一个带Markov跳的极限控制系统,给出此极限系统最优控制的反馈形式。其次,给出平均场逼近项的表达式,利用极限系统最优控制策略构造原平均场博弈系统的分散控制策略。最后,论证带Markov跳的平均场博弈系统与带Markov跳的极限系统之间的逼近关系,据此证明所设计的分散控制策略为带Markov跳的平均场博弈系统的?-Nash均衡策略。 论文的第五章,为了验证理论结果,本章给出了数值仿真结果。数值结果验证了平均场估计的一致性,以及群体行为x(t)对参与者状态轨迹的影响。 论文的第六章,对本文的内容进行总结并且展望未来的方向和计划。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分