咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >向量值马氏决策规划的线性加权解法 收藏

向量值马氏决策规划的线性加权解法

Linear-weighted Method for Solving Vector-Valued Markov Decision Decision Programming.

作     者:曾庆宁 

作者机构:广西桂林电子工业学院电子信息分院信息工程系桂林541004 

出 版 物:《应用数学学报》 (Acta Mathematicae Applicatae Sinica)

年 卷 期:2001年第24卷第4期

页      面:630-632页

核心收录:

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 07[理学] 070105[理学-运筹学与控制论] 0701[理学-数学] 

主  题:折扣向量值 马氏决策规划 线性加权解法 多目标规划 

摘      要:类似[1-4],折扣向量值马氏决策规划(DVMDP)描述为:{S,(A(i), i ∈ S),q,r,Vβ, (1)其中S为可数状态集,A(i)是有限决策集,q(j|i,a)是转移概率,r=r(i,j,a)=(r1(i,j,a),r2(i,j,a),…,rp(i,j,a))是状态i处使用决策a于下一步转移到状态j时所获的p维报酬向量,r(i,j,a)对i,j,a一致有界,Vβ是β折扣目标.以Ⅱ表一般策略集,若π∈Ⅱ有Vβ(π) Vβ(π*),则称π*为DVMDP的 强有效策略 ,Vβ(π*)为 强有效报酬 .如果不存在任何π∈Ⅱ使Vβ(π)Vβ(π*),则称π*为DVMDP的 有效策略 ,Vβ(π*)为 有效报酬 .

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分