咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >考虑多粒度反馈的多轮对话强化学习推荐算法 收藏

考虑多粒度反馈的多轮对话强化学习推荐算法

Multi-round conversational reinforcement learning recommendation algorithm via multi-granularity feedback

作     者:姚华勇 叶东毅 陈昭炯 YAO Huayong;YE Dongyi;CHEN Zhaojiong

作者机构:福州大学计算机与大数据学院福州350108 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2023年第43卷第1期

页      面:15-21页

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:福建省科技计划项目(2018H6010) 

主  题:多轮对话推荐系统 反馈信息 深度Q学习网络 偏好挖掘 多粒度 

摘      要:多轮对话推荐系统(CRS)以交互的方式获取用户的实时信息,相较于基于协同过滤等的传统推荐方法能够取得更好的推荐效果。然而现有的CRS存在用户偏好捕获不够准确、对话轮数要求过多以及推荐时机不恰当等问题。针对这些问题,提出一种基于深度强化学习且考虑用户多粒度反馈信息的对话推荐算法。不同于现有的CRS,所提算法在每轮对话中同时考虑用户对商品本身以及更细粒度的商品属性的反馈,然后根据收集的多粒度反馈对用户、商品和商品属性特征进行在线更新,并借助深度Q学习网络(DQN)算法分析每轮对话后的环境状态,从而帮助系统作出较为恰当合理的决策动作,使它能够在比较少的对话轮次的情况下分析用户购买商品的原因,更全面地挖掘用户的实时偏好。与对话路径推理(SCPR)算法相比,在Last. fm真实数据集上,算法的15轮推荐成功率提升了46.5%,15轮推荐轮次上缩短了0.314轮;在Yelp真实数据集上,算法保持了相同水平的推荐成功率,但在15轮推荐轮次上缩短了0.51轮。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分