咨询与建议

限定检索结果

文献类型

  • 4 篇 期刊文献
  • 4 篇 学位论文

馆藏范围

  • 8 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 8 篇 工学
    • 5 篇 计算机科学与技术...
    • 4 篇 机械工程
    • 4 篇 软件工程
    • 2 篇 控制科学与工程
    • 1 篇 航空宇航科学与技...
    • 1 篇 生物医学工程(可授...
  • 2 篇 管理学
    • 2 篇 管理科学与工程(可...
  • 1 篇 理学
    • 1 篇 物理学

主题

  • 8 篇 多模态推理
  • 3 篇 视觉问答
  • 2 篇 视觉定位
  • 2 篇 图神经网络
  • 1 篇 先验缓解
  • 1 篇 深度特征融合
  • 1 篇 图卷积网络
  • 1 篇 多尺度表征
  • 1 篇 图像细粒度分析
  • 1 篇 引用表达式定位
  • 1 篇 智能医疗
  • 1 篇 注意力机制
  • 1 篇 引用表达
  • 1 篇 问题自注意力
  • 1 篇 多模态智能融合
  • 1 篇 多任务学习
  • 1 篇 采纳模型
  • 1 篇 临床决策支持
  • 1 篇 遥感视觉问答

机构

  • 2 篇 华东师范大学
  • 1 篇 中国海洋大学
  • 1 篇 东华大学
  • 1 篇 江苏科技大学
  • 1 篇 辽宁工程技术大学
  • 1 篇 桂林电子科技大学
  • 1 篇 清华大学
  • 1 篇 青岛海洋科技中心
  • 1 篇 合肥工业大学

作者

  • 2 篇 王月
  • 1 篇 郑程予
  • 1 篇 叶加博
  • 1 篇 赵恩源
  • 1 篇 王鑫
  • 1 篇 张海涛
  • 1 篇 聂婕
  • 1 篇 郭欣雨
  • 1 篇 魏志强
  • 1 篇 陈南聪
  • 1 篇 金学勤
  • 1 篇 林欣
  • 1 篇 黄辉
  • 1 篇 宋宁
  • 1 篇 潘恒

语言

  • 8 篇 中文
检索条件"主题词=多模态推理"
8 条 记 录,以下是1-10 订阅
排序:
基于多模态推理图神经网络的场景文本视觉问答模型
收藏 引用
计算机应用研究 2022年 第1期39卷 280-284,302页
作者: 张海涛 郭欣雨 辽宁工程技术大学软件学院 辽宁葫芦岛125105
文本阅读能力差和视觉推理能力不足是现有视觉问答(visual question answering,VQA)模型效果不好的主要原因,针对以上问题,设计了一个基于图神经网络的多模态推理(multi-modal reasoning graph neural network,MRGNN)模型。利用图像中... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
视觉问答系统中先验缓解与多模态推理技术研究
视觉问答系统中先验缓解与多模态推理技术研究
收藏 引用
作者: 金学勤 东华大学
学位级别:硕士
随着人工智能技术的发展,传统的文本问答系统无法满足人们对问答系统准确、高效的需求,人们期待问答系统具备获取和理解不同类型信息的能力。视觉问答系统结合文本信息和视觉图像信息进行联合推理,弥补了文本问答信息源单一的缺点,能够... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于双路径多模态交互的一阶段视觉定位模型
收藏 引用
华东师范大学学报(自然科学版) 2024年 第2期 65-75页
作者: 王月 叶加博 林欣 华东师范大学计算机科学与技术学院 上海200062
现有的一阶段方法分别提取视觉特征映射和文本特征,并进行多模态推理来预测被引用对象的边界框.这些方法存在以下两个缺点:首先,预先训练的视觉特征提取器在视觉特征中引入了与文本无关的视觉信号,阻碍了多模态交互;其次,现有模型的推... 详细信息
来源: 维普期刊数据库 维普期刊数据库 博看期刊 同方期刊数据库 同方期刊数据库 评论
面向遥感视觉问答的尺度引导融合推理网络
收藏 引用
软件学报 2024年 第5期35卷 2133-2149页
作者: 赵恩源 宋宁 聂婕 王鑫 郑程予 魏志强 中国海洋大学信息科学与工程学部 山东青岛266100 清华大学计算机科学与技术系 北京100084 青岛海洋科技中心 山东青岛266061
遥感视觉问答(remote sensing visual question answering,RSVQA)旨在从遥感图像中抽取科学知识.近年来,为了弥合遥感视觉信息与自然语言之间的语义鸿沟,涌现出许多方法.但目前方法仅考虑多模态信息的对齐和融合,既忽略了对遥感图像目... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
文本信息引导的注意力机制细粒度图像分类
收藏 引用
计算机与数字工程 2024年 第08期 2493-2497页
作者: 潘恒 江苏科技大学能源与动力学院
自然图像中带有显式语义信息的场景文本,能提供重要的线索用来解决对应的计算机视觉问题,在文本中,一般专注于利用视觉和文本提示形式的多模式内容来解决细粒度图像分类和检索的任务。论文采用图卷积网络执行多模推理,并通过学习... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
智能医疗辅助诊断系统的采纳影响因素与决策模型研究
智能医疗辅助诊断系统的采纳影响因素与决策模型研究
收藏 引用
作者: 黄辉 合肥工业大学
学位级别:硕士
经过快速的发展变革,我国居民健康水平和医疗诊疗能力得到了显著提升。然而,优质医疗资源在我国区域之间、城乡之间分配严重不均,基层医院特别是边远地区落后的医疗机构,在胃癌等重大疾病的诊疗水平差异显著,不利于保障广大人民群众的... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于多任务学习的一阶段视觉定位研究
基于多任务学习的一阶段视觉定位研究
收藏 引用
作者: 王月 华东师范大学
学位级别:硕士
视觉定位旨在定位由自然语言查询引用的图像上的一个区域,它包含两个子任务:引用表达式理解(Referring Expression Comprehension,REC)和引用表达式分割(Referring Expression Segmentation,RES)。近年来,视觉定位技术受到越来越多的关... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于注意力机制的视觉问答方法研究
基于注意力机制的视觉问答方法研究
收藏 引用
作者: 陈南聪 桂林电子科技大学
学位级别:硕士
视觉问答任务(Visual Question Answering,VQA)是融合自然语言处理和计算机视觉任务中一个新兴的重要子课题。作为图灵测试中一个重要的环节,它对推动未来通用人工智能的发展奠定了坚实的基础。针对不同模态间存在的语义鸿沟等问题,本... 详细信息
来源: 同方学位论文库 同方学位论文库 评论