基于跨用户语音域适应网络的抑郁症检测
作者机构:浙江理工大学信息科学与工程学院 浙大宁波理工学院信息科学与工程学院
出 版 物:《电子科技》 (Electronic Science and Technology)
年 卷 期:2024年
学科分类:0711[理学-系统科学] 1002[医学-临床医学] 07[理学] 100205[医学-精神病与精神卫生学] 10[医学]
基 金:国家自然科学基金(61972350,32073028) 宁波市自然科学基金(2022J165)
主 题:域适应 抑郁症检测 CUADAN 语音 跨用户 梅尔频谱 特征提取 削弱差异性
摘 要:由于抑郁症的检测方式主观性较强,因此使用用户语音诊断抑郁症已成为一种较具有潜力的辅助方式。但不同用户的语音信号存在差异,文中提出了一个跨用户语音域适应网络(Cross User Audio Domain Adaptation Network, CUADAN)来检测抑郁症。从语音中提取可视化的梅尔频谱,利用CUADAN模型的特征提取器从梅尔频谱中获取更深层次的抑郁特征。由于源域和目标域中包含不同健康用户和抑郁用户的语音特征,因此利用CUADAN模型的域分类器在不同用户数据之间进行域适应,从而通过已有的分类器对未知用户进行检测。实验结果表明,CUADAN模型的抑郁症检测准确率更高,其平均准确率达到81.0%±2.4%。因此,CUADAN模型可以有效削弱不同用户语音之间的差异性,提高跨用户抑郁症检测的准确率。