咨询与建议

限定检索结果

文献类型

  • 23 篇 期刊文献
  • 16 篇 学位论文

馆藏范围

  • 39 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 28 篇 工学
    • 20 篇 计算机科学与技术...
    • 19 篇 控制科学与工程
    • 18 篇 软件工程
    • 7 篇 仪器科学与技术
    • 3 篇 机械工程
    • 1 篇 电子科学与技术(可...
    • 1 篇 地质资源与地质工...
  • 22 篇 理学
    • 22 篇 系统科学
  • 14 篇 管理学
    • 13 篇 管理科学与工程(可...
    • 1 篇 公共管理
  • 6 篇 艺术学
    • 6 篇 设计学(可授艺术学...
  • 2 篇 文学
    • 1 篇 中国语言文学
    • 1 篇 外国语言文学
  • 1 篇 法学
    • 1 篇 民族学
  • 1 篇 农学
    • 1 篇 兽医学
  • 1 篇 医学
    • 1 篇 临床医学

主题

  • 39 篇 连接时序分类
  • 15 篇 语音识别
  • 6 篇 卷积神经网络
  • 5 篇 端到端
  • 4 篇 注意力机制
  • 4 篇 门控循环单元
  • 4 篇 深度学习
  • 4 篇 循环神经网络
  • 3 篇 长短期记忆网络
  • 2 篇 transformer
  • 2 篇 自动语音识别
  • 2 篇 端到端模型
  • 2 篇 双向长短时记忆网...
  • 2 篇 端到端语音识别
  • 2 篇 conformer
  • 1 篇 多尺度卷积
  • 1 篇 “端”到“端”网络
  • 1 篇 las
  • 1 篇 深度可分离卷积
  • 1 篇 标签软对齐

机构

  • 4 篇 武汉理工大学
  • 2 篇 河北工程大学
  • 2 篇 江南大学
  • 2 篇 华南理工大学
  • 2 篇 浙江大学
  • 2 篇 广东工业大学
  • 1 篇 华中科技大学
  • 1 篇 西安邮电大学
  • 1 篇 中国航天科工集团...
  • 1 篇 中国航天科工集团...
  • 1 篇 北京计算机技术及...
  • 1 篇 中国科学院大学
  • 1 篇 新疆民族语音语言...
  • 1 篇 东南大学
  • 1 篇 兰州文理学院
  • 1 篇 太原理工大学
  • 1 篇 同济大学
  • 1 篇 南京晓庄学院
  • 1 篇 中国人民解放军95...
  • 1 篇 中国人民解放军战...

作者

  • 2 篇 董家仁
  • 2 篇 陈戈
  • 2 篇 蒋志翔
  • 2 篇 徐冬冬
  • 2 篇 黎长江
  • 2 篇 陈祺东
  • 2 篇 孙俊
  • 2 篇 谢旭康
  • 1 篇 常合友
  • 1 篇 李宜亭
  • 1 篇 文成玉
  • 1 篇 李鸿燕
  • 1 篇 唐倩
  • 1 篇 舒珊珊
  • 1 篇 慕亚东
  • 1 篇 屈丹
  • 1 篇 苏健彬
  • 1 篇 李朔
  • 1 篇 王军
  • 1 篇 胡黎

语言

  • 39 篇 中文
检索条件"主题词=连接时序分类"
39 条 记 录,以下是1-10 订阅
排序:
融合注意力机制和连接时序分类的多模态手语识别
收藏 引用
信号处理 2020年 第9期36卷 1429-1439页
作者: 王军 鹿姝 李云伟 中国矿业大学信息与控制工程学院 江苏徐州221116
连续手语识别的难点之一是手语数据中存在时空维度的冗余信息,以及手语数据与给定标签序列的对齐问题。因此,本文提出一种融合注意力机制和连接时序分类的连续手语识别模型,可以提取手语数据中彩色和深度视频片段的短期时空特征以及手... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于残差注意网络的端到端手写文本识别方法
收藏 引用
控制与决策 2023年 第7期38卷 1825-1834页
作者: 王寅同 郑豪 常合友 李朔 南京晓庄学院信息工程学院 南京211171 浙江大学计算机科学与技术学院 杭州310058 英国德蒙福特大学人工智能研究所 莱斯特LE19BH
中文手写文本识别是模式识别领域中的研究热点问题之一,其存在字符类别数量多、书写风格差异大和训练数据集标记难等问题.针对上述问题,提出无切分无循环的残差注意网络结构用于端到端手写文本识别.首先,以ResNet-26为主体结构,使用深... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于空间转换网络的端到端车牌检测与识别
收藏 引用
光电子.激光 2021年 第5期32卷 524-531页
作者: 唐倩 贺伟 张林江 西安邮电大学通信与信息工程学院 陕西西安710121 西北工业大学计算机学院 陕西西安710109
在复杂场景中,许多现有的车牌检测和识别方面的研究方法存在数据集单一且有限、算法复杂等问题。因此提出了一个端到端的统一网络:残差-空间变换-连接时序分类融合的车辆号牌检测识别网络(LPDR-RSCNet)。该网络结合残差神经网络、空间... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
一种改进的线性注意力机制语音识别方法
收藏 引用
信号处理 2023年 第3期39卷 516-525页
作者: 李宜亭 屈丹 杨绪魁 张昊 沈小龙 中国人民解放军战略支援部队信息工程大学信息系统工程学院 河南郑州450001 中国人民解放军95897部队 辽宁大连116001
Conformer模型因其优越的性能,吸引了越来越多研究者的关注,逐渐成为语音识别领域的主流模型,但因其采用注意力机制从输入中提取信息,需要对输入序列中所有样本点进行交互计算,导致网络计算复杂度为输入序列长度的平方,因此在对长语音... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
使用Conformer增强的混合CTC/Attention端到端中文语音识别
收藏 引用
计算机工程与应用 2023年 第4期59卷 97-103页
作者: 陈戈 谢旭康 孙俊 陈祺东 江南大学人工智能与计算机学院 江苏无锡214122
最近,基于自注意力的Transformer结构在不同领域的一系列任务上表现出非常好的性能。探索了基于Transformer编码器和LAS(listen,attend and spell)解码器的Transformer-LAS语音识别模型的效果,并针对Transformer不善于捕捉局部信息的问... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
联合CTC和Transformer的轮式移动机器人语音控制研究
收藏 引用
中国测试 2024年 第6期50卷 117-123页
作者: 唐咸荣 高瑞贞 河北工程大学机械与装备工程学院 河北邯郸056038
针对人机交互过程中手动控制轮式移动机器人步骤繁琐且双手受到限制的问题,提出并实现基于深度学习算法的轮式移动机器人语音控制系统。系统选取树莓派4B开发板作为主控制器,科大讯飞6阵列语音模块作为语音采集器,STM32单片机作为底层... 详细信息
来源: 维普期刊数据库 维普期刊数据库 博看期刊 同方期刊数据库 同方期刊数据库 评论
基于QRNN-CTC的中文语音识别声学模型
收藏 引用
计算机应用与软件 2023年 第12期40卷 184-188,262页
作者: 王先欢 孙自强 华东理工大学化工过程先进控制和优化技术教育部重点实验室 上海200237
针对卷积神经网络(CNN)在语音识别中处理时序能力不足和循环神经网络(RNN)在语音识别中模型复杂度较高、训练慢的问题,提出一种新的基于准循环神经网络和连接时序主义(QRNN-CTC)的声学模型。该模型既降低了参数量,又保证了一定的时序间... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于双路卷积神经网络的中文语音识别
收藏 引用
计算机工程与设计 2023年 第3期44卷 880-886页
作者: 张昱 李鸿燕 邢璐 任健 太原理工大学信息与计算机学院 山西榆次030600
为解决卷积神经网络在中文语音识别中识别准确率低、鲁棒性差的问题,提出一种基于双路卷积神经网络的声学建模方法。利用多尺度学习方法提取多尺度特征信息;将软阈值非线性转换层和注意力机制进行融合后嵌入残差网络,减轻网络梯度问题,... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于HOPE-CTC的端到端语音识别
收藏 引用
计算机工程与设计 2021年 第2期42卷 462-467页
作者: 徐冬冬 蒋志翔 中国航天科工集团第二研究院七〇六所 北京100854
为增强端到端语音识别模型的鲁棒性和特征提取的有效性,对瓶颈特征提取网络进行研究,提出采用基于联合优化正交投影和估计的端到端语音识别模型。通过连接时序分类损失函数训练瓶颈特征提取网络,摆脱对语言学和对齐信息的先验知识的依赖... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于ResNet-BLSTM的端到端语音识别
收藏 引用
计算机工程与应用 2020年 第18期56卷 124-130页
作者: 胡章芳 徐轩 付亚芹 夏志广 马苏东 重庆邮电大学光电工程学院 重庆400065 重庆邮电大学先进制造学院 重庆400065
基于深度学习的端到端语音识别模型中,由于模型的输入采用固定长度的语音帧,造成时域信息和部分高频信息损失进而导致识别率不高、鲁棒性差等问题。针对上述问题,提出了一种基于残差网络与双向长短时记忆网络相结合的模型,该模型采用语... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论