咨询与建议

限定检索结果

文献类型

  • 3 篇 期刊文献
  • 2 篇 学位论文

馆藏范围

  • 5 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 4 篇 工学
    • 2 篇 控制科学与工程
    • 2 篇 计算机科学与技术...
    • 2 篇 软件工程
    • 1 篇 电气工程
    • 1 篇 电子科学与技术(可...
  • 3 篇 理学
    • 3 篇 系统科学
  • 2 篇 管理学
    • 2 篇 管理科学与工程(可...

主题

  • 5 篇 梅尔语谱图
  • 3 篇 说话人识别
  • 1 篇 注意力机制
  • 1 篇 res2net
  • 1 篇 变压器
  • 1 篇 音频分类
  • 1 篇 残差块末端嵌入
  • 1 篇 平行注意力机制
  • 1 篇 3a-rcnn网络
  • 1 篇 残差神经网络
  • 1 篇 gmm托肯
  • 1 篇 注意力统计池化(a...
  • 1 篇 声纹故障诊断
  • 1 篇 深度神经网络
  • 1 篇 背景说话人语料选...
  • 1 篇 压缩激活(squeeze...
  • 1 篇 多维度注意力机制
  • 1 篇 附加角裕度的soft...
  • 1 篇 频率向卷积循环结...
  • 1 篇 卷积神经网络

机构

  • 1 篇 兰州交通大学
  • 1 篇 陕西科技大学
  • 1 篇 国网青海省电力公...
  • 1 篇 四川大学
  • 1 篇 浙江大学

作者

  • 1 篇 李军
  • 1 篇 熊华煜
  • 1 篇 李建文
  • 1 篇 王理丽
  • 1 篇 张小玉
  • 1 篇 赵统军
  • 1 篇 陈鸿雁
  • 1 篇 王子乐
  • 1 篇 王生杰
  • 1 篇 李秋阳
  • 1 篇 令晓明
  • 1 篇 张真
  • 1 篇 杨潇洁
  • 1 篇 李子彬
  • 1 篇 梅文星

语言

  • 5 篇 中文
检索条件"主题词=梅尔语谱图"
5 条 记 录,以下是1-10 订阅
排序:
基于ASP-SERes2Net的说话人识别算法
收藏 引用
北京工业大学学报 2025年 第1期51卷 42-50页
作者: 令晓明 陈鸿雁 张小玉 张真 兰州交通大学光电技术与智能控制教育部重点实验室 兰州730070 兰州交通大学国家绿色镀膜技术与装备工程技术研究中心 兰州730070
为提升说话人识别的特征提取能力,解决在噪声环境下识别率低的问题,提出一种基于残差网络的说话人识别算法——ASP-SERes2Net。首先,采用梅尔语谱图作为神经网络的输入;其次,改进Res2Net网络的残差块,并且在每个残差块后引入压缩激活(sq... 详细信息
来源: 维普期刊数据库 维普期刊数据库 评论
基于卷积神经网络的音频分类研究及系统应用
基于卷积神经网络的音频分类研究及系统应用
收藏 引用
作者: 熊华煜 四川大学
学位级别:硕士
在信息技术高速发展的当下,如何高效率地管理和利用生活中所流动的音频信息成为了声音信息管理技术发展的关键,音频分类则是实现这个目标的核心;准确的分类可以为音识别及检测、场景分析、音转换与合成等应用提供分类预处理支持,可... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
说话人识别中通用背景模型研究及深度学习初探
说话人识别中通用背景模型研究及深度学习初探
收藏 引用
作者: 梅文星 浙江大学
学位级别:硕士
说话人识别是音信号处理领域重要的研究方向,主要目的是在音中自动获取说话人身份,在银行、公安系统和智能家居等领域存在广泛应用。当前主流算法基于概率模型,在背景料充足和信道单一情况下,GMM-UBM模型已经取得良好的性能;但在... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于声纹识别的油浸式变压器局部放电故障诊断研究
收藏 引用
青海电力 2024年 第4期43卷 36-41页
作者: 王理丽 李子彬 李军 王生杰 李秋阳 王子乐 杨潇洁 国网青海省电力公司电力科学研究院 青海西宁810008
油浸式变压器的局部放电会导致局部绝缘的损坏,并随着时间的推移逐渐扩大,最终导致设备的损坏或故障。为有效监测油浸式变压器的局部放电故障,以声纹识别技术为监测手段,对油浸式变压器局部放电产生的声音信号进行采集和处理,搭建局部... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于3A-RCNN网络的说话人识别研究
收藏 引用
电子技术与软件工程 2020年 第14期 23-27页
作者: 李建文 赵统军 陕西科技大学电子信息与人工智能学院 陕西省西安市710021
本文为了更加有针对性的从音信息中筛选出说话人的身份信息,减少冗余信息,提出一种将通道维度、时间维度、频率维度三种维度的多重注意力机制嵌入每个残差块末端的模型(3A-RCNN)。结果表明,3A-RCNN模型收敛后平均准确率达到98.0%。相... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论