Markov控制过程基于性能势的平均代价最优策略
OPTIMALITY STRATEGY OF AVERAGE COST BASED PERFORMANCE POTENTIALS FOR MARKOV CONTROL PROCESS作者机构:中国科技大学管理科学系合肥230026 中国科技大学自动化系合肥230026
出 版 物:《自动化学报》 (Acta Automatica Sinica)
年 卷 期:2002年第28卷第6期
页 面:904-910页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金 ( 6 9974 0 37) 国家高性能计算基金 ( 0 0 2 12 )资助
主 题:Markov控制过程 性能势 平均代价模型 最优平稳策略 最优控制
摘 要:研究了一类离散时间 Markov控制过程平均代价性能最优控制决策问题 .应用Markov性能势的基本性质 ,在很一般性的假设条件下 ,直接导出了无限时间平均代价模型在紧致行动集上的最优性方程及其解的存在性定理 .提出了求解最优平稳控制策略的迭代算法 ,并讨论了这种算法的收敛性问题 .最后通过分析一个实例来说明这种算法的应用 .