咨询与建议

限定检索结果

文献类型

  • 49 篇 学位论文
  • 37 篇 期刊文献

馆藏范围

  • 86 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 80 篇 工学
    • 53 篇 机械工程
    • 30 篇 控制科学与工程
    • 18 篇 计算机科学与技术...
    • 6 篇 仪器科学与技术
    • 2 篇 电子科学与技术(可...
    • 2 篇 信息与通信工程
    • 1 篇 光学工程
    • 1 篇 电气工程
    • 1 篇 化学工程与技术
  • 9 篇 理学
    • 8 篇 系统科学
    • 1 篇 生物学
  • 2 篇 经济学
    • 2 篇 应用经济学
  • 1 篇 文学
    • 1 篇 中国语言文学

主题

  • 86 篇 唇语识别
  • 30 篇 深度学习
  • 17 篇 注意力机制
  • 9 篇 卷积神经网络
  • 8 篇 特征提取
  • 6 篇 知识蒸馏
  • 6 篇 循环神经网络
  • 4 篇 人脸识别
  • 4 篇 长短时记忆网络
  • 4 篇 时间卷积网络
  • 3 篇 动态时间规整
  • 3 篇 身份认证
  • 3 篇 语音识别
  • 3 篇 跨模态
  • 3 篇 深度神经网络
  • 2 篇 藏语
  • 2 篇 注意机制
  • 2 篇 图像分割
  • 2 篇 迁移学习
  • 2 篇 三维卷积神经网络

机构

  • 11 篇 北方工业大学
  • 6 篇 北方民族大学
  • 6 篇 北京邮电大学
  • 4 篇 东南大学
  • 4 篇 中国科学院大学
  • 4 篇 合肥工业大学
  • 3 篇 广东工业大学
  • 3 篇 解放军理工大学
  • 3 篇 哈尔滨理工大学
  • 3 篇 中国矿业大学
  • 2 篇 华中科技大学
  • 2 篇 上海交通大学
  • 2 篇 浙江大学
  • 2 篇 辽宁工程技术大学
  • 2 篇 西北师范大学
  • 2 篇 南京航空航天大学
  • 2 篇 电子科技大学
  • 2 篇 图像图形智能信息...
  • 2 篇 中国科学院重庆绿...
  • 1 篇 珠海欧比特宇航科...

作者

  • 5 篇 马金林
  • 4 篇 马自萍
  • 4 篇 刘宇灏
  • 4 篇 朱艳彬
  • 3 篇 张瑛琪
  • 3 篇 王渊
  • 3 篇 巩元文
  • 3 篇 陈德光
  • 3 篇 岳振军
  • 2 篇 马宁
  • 2 篇 魏华杰
  • 2 篇 房国志
  • 2 篇 刘大运
  • 2 篇 杨宇
  • 2 篇 李森
  • 2 篇 薛峰
  • 2 篇 李修政
  • 2 篇 任玉强
  • 2 篇 何珊
  • 2 篇 骆天依

语言

  • 86 篇 中文
检索条件"主题词=唇语识别"
86 条 记 录,以下是1-10 订阅
排序:
基于多重视觉注意力的唇语识别
收藏 引用
模式识别与人工智能 2024年 第1期37卷 73-84页
作者: 谢胤岑 薛峰 曹明伟 合肥工业大学计算机与信息学院 合肥230601 合肥工业大学软件学院 合肥230601 安徽大学计算机科学与技术学院 合肥230601
唇语识别是将单个说话人嘴运动的无声视频翻译成文字的一种技术.由于嘴运动幅度较小,现有唇语识别方法的特征区分能力和泛化能力都较差.针对该问题,文中分别从时间、空间和通道三个维度研究视觉特征的提纯问题,提出基于多重视... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于Transformer-LSTM的闽南唇语识别
收藏 引用
泉州师范学院学报 2024年 第2期42卷 10-17页
作者: 曾蔚 罗仙仙 王鸿伟 泉州师范学院数学与计算机科学学院 福建泉州362000 福建省大数据管理新技术与知识工程重点实验室 福建泉州362000 智能计算与信息处理福建省高等学校重点实验室 福建泉州362000
针对端到端句子级闽南唇语识别的问题,提出一种基于Transformer和长短时记忆网络(LSTM)的编解码模型.编码器采用时空卷积神经网络及Transformer编码器用于提取读序列时空特征,解码器采用长短时记忆网络并结合交叉注意力机制用于文... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
针对唇语识别的上下文相关性蒸馏方法
收藏 引用
计算机辅助设计与图形学学报 2022年 第10期34卷 1559-1566页
作者: 赵雅 冯尊磊 王慧琼 宋明黎 浙江大学计算机科学与技术学院 杭州310027 浙江大学软件学院 杭州310027 浙江大学宁波研究院 宁波315100 之江实验室 杭州311121
针对唇语识别模型的性能受到数据集大小限制的问题,提出一种跨模态知识蒸馏方法C2KD.C2KD将识别模型的多尺度上下文相关性知识蒸馏到唇语识别模型中.首先,利用Transformer模型的自注意力模块得到上下文相关性知识;其次,使用层映射... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于Vision Transformer的中文唇语识别
收藏 引用
模式识别与人工智能 2022年 第12期35卷 1111-1121页
作者: 薛峰 洪自坤 李书杰 李雨 谢胤岑 合肥工业大学软件学院 合肥230601 合肥工业大学计算机与信息学院 合肥230601
唇语识别作为一种将读视频转换为文本的多模态任务,旨在理解说话者在无声情况下表达的意思.目前唇语识别主要利用卷积神经网络提取部视觉特征,捕获短距离像素关系,难以区分相似发音字符的形.为了捕获视频图像中部区域像素之间... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
LipSense:基于CSI相位差的自适应唇语识别方法
收藏 引用
传感技术学报 2023年 第3期36卷 419-426页
作者: 陶志勇 陈露 刘影 郭京 辽宁工程技术大学电子与信息工程学院 辽宁葫芦岛125105 国网河南省电力公司安阳供电公司 河南安阳455000
针对目前基于CSI幅度的行为识别方法对细粒度动作不敏感及传统的动作分割算法存在动作起止点判断不准确的问题,提出了一种基于相位差的自适应唇语识别方法。首先,利用MIMO系统的空间分集,构造出对细粒度动作更敏感的相位差信号,解决了... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
HSKDLR:同类自知识蒸馏的轻量化唇语识别方法
收藏 引用
计算机科学与探索 2023年 第11期17卷 2689-2702页
作者: 马金林 刘宇灏 马自萍 巩元文 朱艳彬 北方民族大学计算机科学与工程学院 银川750021 图像图形智能信息处理国家民委重点实验室 银川750021 北方民族大学数学与信息科学学院 银川750021
针对唇语识别模型的识别率较低和计算量较大的问题,提出一种同类自知识蒸馏的轻量化唇语识别模型(HSKDLR)。首先,提出关注部图像空间特征的S-SE注意力模块,用其构建提取部图像通道特征和空间特征的i-Ghost Bottleneck模块,以提升... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于中文发音视觉特点的唇语识别方法研究
收藏 引用
计算机工程与应用 2022年 第4期58卷 157-162页
作者: 何珊 袁家斌 陆要要 南京航空航天大学计算机科学与技术学院 南京211106 南京航空航天大学信息化处 南京211106
随着深度学习的发展,唇语识别技术在英文方面取得了长足的进步,但针对中文无论是在数据集丰富性还是识别准确率上均存在一定的落差。通过分析中文发音的视觉特点,提出"视觉拼音",意图规避中文在视觉表达上的歧义性。为了验证视觉拼音的... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
解耦同类自知识蒸馏的轻量化唇语识别方法
收藏 引用
北京航空航天大学学报 2023年
作者: 马金林 刘宇灏 马自萍 郭兆伟 吕鑫 北方民族大学图像图形智能处理国家民委重点实验室 北方民族大学计算机科学与工程学院 北方民族大学数学与信息科学学院
针对唇语识别模型因参数量和计算量较大而无法在移动终端和边缘设备上应用的问题,提出基于解耦同类自知识蒸馏和GhostNet-TSM的唇语识别方法。具体地:首先,提出具有时序特征提取能力的GhostNet-TSM网络;其次,将同类自知识蒸馏的特... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
基于单标签射频识别唇语识别算法
收藏 引用
计算机应用 2022年 第6期42卷 1762-1769页
作者: 张瑛琪 彭大卫 李森 孙莹 牛强 中国矿业大学计算机科学与技术学院 江苏徐州221116
近年来,有研究提出了使用多个定制且可拉伸的射频识别(RFID)标签进行识别的无线平台,但该标签难以精准捕捉拉伸引起的大频率偏移,而且需要探测多个标签,标签脱落或自然磨损时还须重新校准。针对以上问题,提出基于单标签RFID的... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于单标签RFID的唇语识别算法
收藏 引用
计算机应用 2022年
作者: 张瑛琪 彭大卫 李森 孙莹 牛强 中国矿业大学计算机科学与技术学院
近年来,有研究提出了使用多个定制且可拉伸的射频识别技术(RFID)标签进行识别的无线平台,但该标签精准捕捉拉伸引起的大频率偏移比较困难,且需要探测多个标签,标签脱落或自然磨损时须重新校准。针对以上问题,提出基于单标签RFI... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论