基于深度学习的睡眠音乐自动生成
作者单位:重庆大学
学位级别:硕士
导师姓名:文静
授予年度:2022年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:音乐生成 主旋律提取 注意力机制 Transformer WaveNet
摘 要:近年来随着人们的生活水平不断提高,人们承受的压力也逐渐增加甚至部分人由此导致了如睡眠质量变差等各种问题。有研究表明合适的音乐可以改善人的睡眠质量,但由于音乐种类众多使得寻找适合自己的音乐也成为一个难题,本文的目标是通过深度学习技术来实现睡眠音乐的自动生成,从而缓解这个难题。本文实现睡眠音乐生成的方法主要包括主旋律提取以及音乐生成两个方面的内容。其中存在许多难点:1)音乐数据不同于普通的序列数据,可能会非常长,并且音乐数据中各个音符之间的联系可能会非常紧密;2)音乐中存在多条音轨,需要识别、区分各个音轨,并且从各音轨中得到主旋律的音高序列;3)通过主旋律得到的音符并不是我们需要的音乐,需要将这些音符转化为我们日常听的音乐;4)通主旋律生成的音乐并不一定是适合睡眠的音乐,我们还需要为它添加一些特性,将它转化为睡眠音乐。针对上述问题,本文对音乐以及深度学习相关技术进行研究与实现,主要成果如下:1)为了更加准确提取到音乐的主旋律,本文提出了一种新的主旋律提取方法,以编码器-解码器为基础网络结构,使用频谱图作为音乐的数据表示并结合注意力机制来处理音乐数据,提高了主旋律提取的准确率的同时也降低了误检率。2)为了生成音乐,建立了一种以生成对抗网络(GAN)为基础,并结合Transformer结构来处理音乐数据,实现将主旋律的音符生成音乐的功能;3)为了生成睡眠音乐,使用Wave Net作为基础网络,以促进睡眠音乐的主旋律为样本,并且加入睡眠音乐的梅尔频率倒谱系数作为局部条件来控制模型的风格使得模型能够产生睡眠音乐。