咨询与建议

限定检索结果

文献类型

  • 4 篇 期刊文献

馆藏范围

  • 4 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 3 篇 工学
    • 3 篇 计算机科学与技术...
    • 2 篇 软件工程
  • 1 篇 教育学
    • 1 篇 教育学
  • 1 篇 理学
    • 1 篇 系统科学

主题

  • 4 篇 wav2vec 2.0
  • 1 篇 语音情感识别
  • 1 篇 iemocap dataset
  • 1 篇 transformer
  • 1 篇 多任务约束
  • 1 篇 教师学生模型
  • 1 篇 扩散机制
  • 1 篇 面部动画
  • 1 篇 attention block
  • 1 篇 speaker-specific...
  • 1 篇 speech emotion r...
  • 1 篇 语音驱动
  • 1 篇 ser
  • 1 篇 语音增强
  • 1 篇 distil hubert
  • 1 篇 hubert
  • 1 篇 audio and audio-...

机构

  • 1 篇 research laborat...
  • 1 篇 research unite o...
  • 1 篇 department of ai...
  • 1 篇 college of softw...
  • 1 篇 南京邮电大学
  • 1 篇 温州大学

作者

  • 1 篇 hyunki hong
  • 1 篇 李平安
  • 1 篇 bogyung park
  • 1 篇 陈昂
  • 1 篇 mpabulungi mark
  • 1 篇 王少波
  • 1 篇 孙林慧
  • 1 篇 雷云龙
  • 1 篇 臧梦利
  • 1 篇 karim dabbabi
  • 1 篇 张子晓
  • 1 篇 somin park
  • 1 篇 abdelkarim mars
  • 1 篇 智宇

语言

  • 2 篇 英文
  • 2 篇 中文
检索条件"主题词=wav2vec 2.0"
4 条 记 录,以下是1-10 订阅
排序:
Using Speaker-Specific Emotion Representations in wav2vec 2.0-Based Modules for Speech Emotion Recognition
收藏 引用
Computers, Materials & Continua 2023年 第10期77卷 1009-1030页
作者: Somin Park Mpabulungi Mark Bogyung Park Hyunki Hong College of Software Chung-Ang UniversitySeoul06973Korea Department of AI Chung-Ang UniversitySeoul06973Korea
Speech emotion recognition is essential for frictionless human-machine interaction,where machines respond to human instructions with context-aware *** properties of individuals’voices vary with culture,language,gende... 详细信息
来源: 维普期刊数据库 维普期刊数据库 评论
Self-supervised Learning for Speech Emotion Recognition Task Using Audio-visual Features and Distil Hubert Model on BAVED and RAVDESS Databases
收藏 引用
Journal of Systems Science and Systems Engineering 2024年 第5期33卷 576-606页
作者: Karim Dabbabi Abdelkarim Mars Research Unite of Analyse and Processing of Electrical and Energetic Systems Faculty of Sciences of TunisTunis El-Manar University2092Tunis-Tunisia Research Laboratory in Algebra Numbers Theory and Intelligent SystemsFaculty of Sciences of Monastir90 Mohamed V street5000-MonastirTunisia
Existing pre-trained models like Distil HuBERT excel at uncovering hidden patterns and facilitating accurate recognition across diverse data types, such as audio and visual information. We harnessed this capability to... 详细信息
来源: 维普期刊数据库 维普期刊数据库 评论
多任务师生模型的语音情感识别实验设计
收藏 引用
实验科学与技术 2024年
作者: 孙林慧 李平安 雷云龙 张子晓 南京邮电大学通信与信息工程学院
针对人机智能交互中语音情感识别的研究热点,将基于多任务约束师生模型的含噪语音情感识别设计为研究型教学实验,观察教师模型的指导作用、学生模型的学习过程和多级增强损失的约束力。设计基于wav2vec 2.0的师生模型和多级增强损失... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
Self-Diffuser:语音驱动人脸表情的技术研究
收藏 引用
计算机科学与应用 2024年 第8期14卷 236-249页
作者: 臧梦利 王少波 智宇 陈昂 温州大学计算机与人工智能学院 元宇宙与人工智能研究中心浙江 温州 温州大学元宇宙与人工智能研究院 浙江 温州
先前的语音驱动面部表情的动画研究从音频信号中产生了较为逼真和精确的嘴唇运动和面部表情。传统的方法主要集中在学习从语音到动画的确定性映射,最近的研究开始探讨语音驱动的3D人脸动画的多样性,即通过利用扩散模型的多样性能力来捕... 详细信息
来源: 维普期刊数据库 维普期刊数据库 博看期刊 评论