基于Self-Attention机制的音乐推荐算法研究
作者单位:华中师范大学
学位级别:硕士
导师姓名:史文中;张文元
授予年度:2020年
学科分类:13[艺术学] 1302[艺术学-音乐与舞蹈学] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:音乐 个性化推荐 self-attention 深度学习
摘 要:伴随着信息技术的快速发展,音乐作品也走上了信息化的道路,如今,越来越多的人选择在互联网上收听自己喜欢的音乐,同时互联网也是海量音乐作品的载体,而面对音乐种类和数目如此巨大的互联网,如何快速找到人们喜欢的音乐就显的尤为重要。音乐推荐系统可以很好的解决这个问题,实现由人找音乐到音乐找人的转变,提高音乐的传播效率,同时提高用户的收听体验。本文正是在这种技术背景和需求的推动下,对音乐推荐算法做了深入的研究。由于在不同的场景下用户的会话行为具有极强的关联性,因此本文提出了基于会话记录的的音乐推荐算法,利用self-attention机制提取会话记录特征。使用音乐推荐领域常用的***数据集对本文提出的音乐推荐模型进行性能评估。实验的主要设计为模型超参数的设定、时间因素及长期偏好对推荐效果的影响、与传统算法的对比分析等,实验结果显示本文提出的算法在音乐推荐方面具有良好的性能。论文基于用户对音乐喜爱的时段性以及易受时间因素影响的特性,提出了基于会话及引入了时间因素和长期偏好的self-attention机制的音乐推荐算法,以有效对音乐及用户偏好进行建模,加强模型对音乐收听记录的短期特征抽取能力和长距离特征捕获能力。论文的主要研究工作包括:第一,以用户最近一定时间内收听的音乐来表征用户的长期偏好,将这段时间内收听的音乐对应的向量均值作为会话的初始输入,这样在表征长期偏好的同时,也缓解了会话冷启动问题;第二,采用了多层多头单向self-attention作为特征抽取器,增强特征抽取能力,尤其对于长距离特征的抽取能力有很大提高,且不受时间序列限制,可并行计算;第三,将时间因素融入模型,更有利于模型捕获用户音乐偏好的在短期内的变化,同时解决self-attention机制的序列丢失问题;第四,在模型训练过程中引入Dropout技术,缓解过拟合;第五,在最后的输出层,运用负采样技术以降低模型训练瓶颈,提高训练速度。论文在验证集上通过选取合适的学习率、批量大小、self-attention头数、self-attention层数以及隐层维度等超参数,在通用评估指标下和协同过滤、session-Word2Vec、Item-kNN等推荐算法进行比较分析,实验结果表明本文提出的模型具备较好的用户音乐偏好建模能力,同时时间因素及长期偏好的引入也对模型的推荐效果产生了积极影响。