折扣马氏决策规划的方差最小最优策略问题
OPTIMAL POLICIES WITH MINIMAL VARIANCE FOR DISCOUNTED MARKOVIAN DECISION PROGRAMMING作者机构:昆明工学院
出 版 物:《应用数学学报》 (Acta Mathematicae Applicatae Sinica)
年 卷 期:1987年第2期
页 面:175-188页
学科分类:07[理学] 0701[理学-数学] 070101[理学-基础数学]
摘 要:对折扣目标马氏决策规划,Derman 讨论了状态空间 S 可列、措施集 A(i∈S)均有限且报酬 r 有界时的最优策略问题.Harrison 提出了 S、A(i∈S)均可列的一种r 无界模型.文献[3]改进了 Harrison 条件提出报酬函数绝对平均相对有界模型,它是指存在一个常数 d0和{r(i)0,i∈S},r(i)有限,对一切 l∈S,a∈A均有:i)|r(l,a)|≤r(l)+∞;ii)∑q(j|l,a)r(j)≤r(l)+d.指出对于这个模型,当 S、