咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 理学
    • 1 篇 系统科学
  • 1 篇 工学
    • 1 篇 机械工程

主题

  • 1 篇 双路径递归网络
  • 1 篇 跨模态注意力
  • 1 篇 视听融合
  • 1 篇 conv-tasnet
  • 1 篇 语音分离

机构

  • 1 篇 中国舰船研究设计...
  • 1 篇 哈尔滨理工大学
  • 1 篇 哈尔滨工大卫星技...

作者

  • 1 篇 郭小霞
  • 1 篇 蒋朋威
  • 1 篇 韩玉兰
  • 1 篇 韩闯
  • 1 篇 陈欢
  • 1 篇 兰朝凤
  • 1 篇 赵世龙

语言

  • 1 篇 中文
检索条件"主题词=双路径递归网络"
1 条 记 录,以下是1-10 订阅
排序:
基于双路径递归网络与Conv-TasNet的多头注意力机制视听语音分离
收藏 引用
电子与信息学报 2024年 第3期46卷 1005-1012页
作者: 兰朝凤 蒋朋威 陈欢 赵世龙 郭小霞 韩玉兰 韩闯 哈尔滨理工大学测控技术与通信工程学院 哈尔滨150080 哈尔滨工大卫星技术有限公司 哈尔滨150023 中国舰船研究设计中心 武汉430064
目前的视听语音分离模型基本是将视频特征和音频特征进行简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,分离效果不理想。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合卷积时域分离模型... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论