咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于样本内外协同表示和自适应融合的多模态学习方法 收藏

基于样本内外协同表示和自适应融合的多模态学习方法

Multimodal Learning Method Based on Intra-and Inter-Sample Cooperative Representation and Adaptive Fusion

作     者:黄学坚 马廷淮 王根生 Huang Xuejian;Ma Tinghuai;Wang Gensheng

作者机构:江西财经大学虚拟现实(VR)现代产业学院南昌330013 南京信息工程大学计算机学院南京210044 江西财经大学信息管理学院南昌330013 

出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)

年 卷 期:2024年第61卷第5期

页      面:1310-1324页

核心收录:

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金项目(62372243 72061015 62102187) 

主  题:多模态表示 多模态融合 多模态学习 协同表示 自适应融合 

摘      要:多模态机器学习是一种新的人工智能范式,结合各种模态和智能处理算法以实现更高的性能.多模态表示和多模态融合是多模态机器学习的2个关键任务.目前,多模态表示方法很少考虑样本间的协同,导致特征表示缺乏鲁棒性,大部分多模态特征融合方法对噪声数据敏感.因此,在多模态表示方面,为了充分学习模态内和模态间的交互,提升特征表示的鲁棒性,提出一种基于样本内和样本间多模态协同的表示方法.首先,分别基于预训练的BERT,Wav2vec 2.0,Faster R-CNN提取文本特征、语音特征和视觉特征;其次,针对多模态数据的互补性和一致性,构建模态特定和模态共用2类编码器,分别学习模态特有和共享2种特征表示;然后,利用中心矩差异和正交性构建样本内协同损失函数,采用对比学习构建样本间协同损失函数;最后,基于样本内协同误差、样本间协同误差和样本重构误差设计表示学习函数.在多模态融合方面,针对每种模态可能在不同时刻表现出不同作用类型和不同级别的噪声,设计一种基于注意力机制和门控神经网络的自适应的多模态特征融合方法.在多模态意图识别数据集MIntRec和情感数据集CMU-MOSI,CMU-MOSEI上的实验结果表明,该多模态学习方法在多个评价指标上优于基线方法.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分