咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于拉普拉斯特征映射的启发式Q学习 收藏

基于拉普拉斯特征映射的启发式Q学习

Heuristically accelerated Q-learning algorithm based on Laplacian Eigenmap

作     者:朱美强 李明 程玉虎 张倩 王雪松 

作者机构:中国矿业大学信息与电气工程学院江苏徐州221116 

出 版 物:《控制与决策》 (Control and Decision)

年 卷 期:2014年第29卷第3期

页      面:425-430页

核心收录:

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金项目(61072094 61273143) 教育部高等学校博士学科点专项科研基金项目(20110095110011 20110095110016) 中央高校基本科研业务费专项资金项目(2013XK09) 江苏省自然科学基金项目(BK20130207) 江苏省博士后基金项目(1301029C) 

主  题:强化学习 启发式策略选择 Q学习 拉普拉斯特征映射 

摘      要:在基于目标的强化学习任务中,欧氏距离常作为启发式函数用于策略选择,其用于状态空间在欧氏空间内不连续的任务效果不理想.针对此问题,引入流形学习中计算复杂度较低的拉普拉斯特征映射法,提出一种基于谱图理论的启发式策略选择方法.所提出的方法适用于状态空间在某个内在维数易于估计的流形上连续,且相邻状态间的连接关系为无向图的任务.格子世界的仿真结果验证了所提出方法的有效性.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分