咨询与建议

限定检索结果

文献类型

  • 5 篇 期刊文献
  • 4 篇 学位论文

馆藏范围

  • 9 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 9 篇 工学
    • 5 篇 机械工程
    • 3 篇 控制科学与工程
    • 1 篇 信息与通信工程
    • 1 篇 计算机科学与技术...
  • 1 篇 理学
    • 1 篇 系统科学
  • 1 篇 医学
    • 1 篇 中西医结合

主题

  • 9 篇 多模态对齐
  • 3 篇 深度学习
  • 2 篇 外部知识
  • 2 篇 多模态表示
  • 2 篇 多模态融合
  • 2 篇 注意力机制
  • 2 篇 视觉问答
  • 2 篇 特征融合
  • 1 篇 终身学习
  • 1 篇 多模态模型
  • 1 篇 多神经网络
  • 1 篇 多模态预训练
  • 1 篇 多模态传译
  • 1 篇 多模态
  • 1 篇 多模态检索
  • 1 篇 自动评分系统
  • 1 篇 基于文本的行人重...
  • 1 篇 知识蒸馏
  • 1 篇 基于文本描述的行...
  • 1 篇 手写汉字识别

机构

  • 2 篇 华南理工大学
  • 1 篇 公共大数据国家重...
  • 1 篇 沈阳航空航天大学
  • 1 篇 黑龙江大学
  • 1 篇 南京理工大学
  • 1 篇 中国石油大学
  • 1 篇 哈尔滨工业大学
  • 1 篇 贵州大学

作者

  • 2 篇 苏振强
  • 2 篇 苟刚
  • 1 篇 邱天
  • 1 篇 姜紫惠
  • 1 篇 丁熙浩
  • 1 篇 李千目
  • 1 篇 李照奎
  • 1 篇 潘梦竹
  • 1 篇 由鸿铭
  • 1 篇 王珂
  • 1 篇 邵智寅
  • 1 篇 罗雄麟
  • 1 篇 刘建伟
  • 1 篇 郑玉栋
  • 1 篇 丁泽锋

语言

  • 9 篇 中文
检索条件"主题词=多模态对齐"
9 条 记 录,以下是1-10 订阅
排序:
联合知识和视觉信息推理的视觉问答研究
收藏 引用
计算机工程与应用 2024年 第5期60卷 95-102页
作者: 苏振强 苟刚 贵州大学计算机科学与技术学院公共大数据国家重点实验室 贵阳550025
视觉问答作为多模态领域中的一项任务,需要对不同模态的特征进行融合推理,具有重要的应用价值。在传统视觉问答中,只需依靠图像的视觉信息,便能很好地推理出问题答案,但纯视觉信息无法满足现实场景中多样化的问答需求。知识在视觉问答... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
利用多级知识蒸馏进行高光谱图像分类的终身学习方法
收藏 引用
激光杂志 2024年
作者: 姜紫惠 李照奎 王珂 沈阳航空航天大学计算机学院
针对终身学习面临的灾难性遗忘问题,提出利用多级知识蒸馏进行高光谱图像分类的终身学习方法。首先,设计基于多模态对齐的特征提取器,充分利用高光谱图像的空谱信息和标签文本信息。此外,设计多级知识蒸馏策略,有效保留旧阶段的多... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
深度多模态表示学习的研究综述
收藏 引用
计算机工程与应用 2023年 第2期59卷 48-64页
作者: 潘梦竹 李千目 邱天 南京理工大学计算机科学与工程学院 南京210094
尽管深度学习因为强大的非线性表示能力已广泛应用于许多领域,多源异构模态数据间结构和语义上的鸿沟严重阻碍了后续深度学习模型的应用。虽然已经有许多学者提出了大量的表示学习方法以探索不同模态间的相关性和互补性,并提高深度学习... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于外部注意力机制的多模态模型研究
基于外部注意力机制的多模态模型研究
收藏 引用
作者: 郑玉栋 黑龙江大学
学位级别:硕士
在深度学习盛行的今天,单一形态的数据已经不足以支持人们完成一些困难的任务,为了让人工智能在理解事物上取得进一步突破,人们利用多模态信息进行解释和推理,多模态信息指的是来自不同模态的信息,例如图像、文本等。通过将不同的模态... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
联合知识和视觉信息推理的视觉问答研究
收藏 引用
计算机工程与应用 2022年
作者: 苏振强 苟刚 公共大数据国家重点实验室计算机科学与技术学院贵州大学
视觉问答作为多模态领域中的一项任务,需要对不同模态的特征进行融合推理,具有重要的应用价值。在传统视觉问答中,只需依靠图像的视觉信息,便能很好的推理出问题答案,但纯视觉信息无法满足现实场景中多样化的问答需求。知识在视觉... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
多模态深度学习综述
收藏 引用
计算机应用研究 2020年 第6期37卷 1601-1614页
作者: 刘建伟 丁熙浩 罗雄麟 中国石油大学(北京)自动化系 北京102249
多模态深度学习发展前期总结当前多模态深度学习,发现在不同多模态组合和学习目标下,多模态深度学习实现过程中的共有问题,并对共有问题进行分类,叙述解决各类问题的方法。具体来说,从涉及自然语言、视觉、听觉的多模态学习中考虑了... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于文本描述的行人重识别方法研究
基于文本描述的行人重识别方法研究
收藏 引用
作者: 丁泽锋 华南理工大学
学位级别:硕士
基于文本描述的行人重识别,指的是给定特定行人的文本描述,算法模型在图像库中寻找到该行人对应的图像,它在监控领域上具有广泛的应用前景。然而,由于图像与文本间模态的异质性和文本描述的无序性,现有方法需要借助跨模态注意力操作或... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于文本描述的行人重识别特征提取方法研究
基于文本描述的行人重识别特征提取方法研究
收藏 引用
作者: 邵智寅 华南理工大学
学位级别:硕士
基于文本的行人重识别(Re ID)的目标是通过文本描述查找感兴趣的身份的行人图像,其在安防监控领域有着广泛的应用。但是由于其任务中内部模态变化丰富且模态间差异显著,因此该任务非常具有挑战性。本文围绕模态对齐思想展开了研究,提出... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
面向拍照场景整页手写作文图像的识别和评分方法
面向拍照场景整页手写作文图像的识别和评分方法
收藏 引用
作者: 由鸿铭 哈尔滨工业大学
学位级别:硕士
伴随着智慧教育产业的不断发展,师生对于作文自动评分(AES)的需求不断涌现。一套完整的作文评分系统需要实现从文字识别到文本评分的全流程,但现有研究成果忽略了识别和评分之间的关联性,也忽略了书写质量等视觉特征对于作文评分的影响... 详细信息
来源: 同方学位论文库 同方学位论文库 评论