咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于词嵌入和双向LSTM的深度强化学习推荐算法研究 收藏
基于词嵌入和双向LSTM的深度强化学习推荐算法研究

基于词嵌入和双向LSTM的深度强化学习推荐算法研究

作     者:孙洪 

作者单位:东北师范大学 

学位级别:硕士

导师姓名:张邦佐

授予年度:2022年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 081203[工学-计算机应用技术] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:Bert GloVe 深度强化学习 推荐算法 双向长短期记忆网络 

摘      要:在互联网飞速发展的今天,各种互联网应用爆炸式涌现,各种娱乐、购物、办公、出行和社交等互联网应用平台走进了人们的生活。人们既是信息的使用者,也是信息的生产者,每天在互联网上留下大量痕迹。如何利用这些海量的历史信息,快速准确地为人们提供个性化服务是学术界和工业界都感兴趣的研究内容,推荐系统应用和算法研究也成为了人们研究的热点。随着深度学习、强化学习等技术的发展,新技术与传统推荐算法相结合,解决了传统推荐算法不能解决的数据稀疏、冷启动等问题。这些新技术推动了推荐系统的发展,一定程度上提高了推荐的性能,然而这些方法依然存在问题:(1)不能动态的捕捉到用户的兴趣;(2)没有考虑历史信息和未来信息对用户兴趣的影响;为了切实缓解以上两个实际问题,本文基于深度强化学习、词嵌入技术与双向长短期记忆网络提出了两个推荐模型,主要工作如下:1.提出了基于GloVe和双向LSTM的深度强化学习推荐模型。GloVe词嵌入模型把用户交互行为和物品描述转化为嵌入向量,然后通过双向LSTM获得隐藏状态向量作为深度强化学习模型的输入部分。在本模型中双向长短期记忆网络结合历史信息和未来信息来提高智能体的决策能力。通过构建线上环境模拟器,从中选择策略并获得用户动作空间的反馈信息,进而优化动作策略,从而比较准确捕获用户的兴趣,推荐给用户偏好的物品。2.提出了基于Bert和双向LSTM的深度强化学习推荐模型。该模型是在上述模型的基础上用Bert处理用户交互行为,充分考虑了行为之间的交互关系,并通过主成分分析方法降维,构建的物品候选集具有动态性和整体性。该模型充分体现了用户与物品之间的交互关系,可以获取动态的用户偏好物品集,更好反映用户偏好的时效性。上述两个模型在亚马逊Music和Beauty数据集上进行了实验,实验结果表明两个模型的性能优于基线模型,并且基于Bert和双向LSTM的深度强化学习推荐模型的性能更优。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分