基于智慧客服系统的改进MaxQ算法模型研究
会议名称:《2023电力行业信息化年会》
会议日期:2024年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 080202[工学-机械电子工程] 08[工学] 0804[工学-仪器科学与技术] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
关 键 词:智慧客服 强化学习 分层强化学习 MaxQ算法 改进MaxQ算法
摘 要:目前智慧客服系统机器人问答技术通过分词、词性标注、生成词向量、相似度计算等较常规的方式实现,自我学习、客户意图理解等能力较差,强化学习是提升机器人自我学习能力的好方法,故引入强化学习算法。但在强化学习的过程中,状态空间往往会随着特征数量的增大呈指数级增长,针对维数灾难的问题,提出了分层强化学习算法。但传统的MaxQ算法的完成函数等参数受到了限制,为提高其处理任务的能力,创新性地提出改进的MaxQ算法,通过调整传统MaxQ算法的协作规则参数,提高了收敛速度,学习知识点的速度提升了约29%,且机器人命中客户问题的次数提升约4%。