咨询与建议

限定检索结果

文献类型

  • 2 篇 期刊文献
  • 1 篇 学位论文

馆藏范围

  • 3 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 3 篇 工学
    • 2 篇 机械工程
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程
    • 1 篇 公安技术

主题

  • 3 篇 视觉-语言预训练模...
  • 1 篇 交通目标检测
  • 1 篇 交叉注意力
  • 1 篇 相似度建模
  • 1 篇 多模态
  • 1 篇 零样本学习
  • 1 篇 提示学习
  • 1 篇 开集目标检测
  • 1 篇 faster r-cnn
  • 1 篇 计算机视觉
  • 1 篇 跨模态匹配
  • 1 篇 零样本迁移

机构

  • 1 篇 上海交通大学
  • 1 篇 矿山数字化教育部...
  • 1 篇 上海华讯网络系统...
  • 1 篇 西安电子科技大学
  • 1 篇 中国矿业大学

作者

  • 1 篇 安国成
  • 1 篇 孙仁科
  • 1 篇 许靖昊
  • 1 篇 皇甫志宇
  • 1 篇 林坚
  • 1 篇 黄琦强
  • 1 篇 许新征
  • 1 篇 熊刚
  • 1 篇 李仲年

语言

  • 3 篇 中文
检索条件"主题词=视觉-语言预训练模型"
3 条 记 录,以下是1-10 订阅
排序:
基于视觉-语言预训练模型的开集交通目标检测算法
收藏 引用
计算机工程 2024年
作者: 黄琦强 安国成 熊刚 上海交通大学电子信息与电气工程学院 上海华讯网络系统有限公司行业数智事业部
交通目标检测是智慧交通系统的重要组成部分,但现有的交通目标检测算法只能实现对于设目标的检测,无法应对开集目标场景。对此,提出一种基于视觉-语言预训练模型(VLP)的开集交通目标检测算法:首先,基于Faster R-CNN,修改测... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
基于视觉-语言预训练模型的零样本迁移学习方法综述
收藏 引用
计算机工程 2024年 第10期50卷 1-15页
作者: 孙仁科 许靖昊 皇甫志宇 李仲年 许新征 中国矿业大学计算机科学与技术学院 江苏徐州221116 矿山数字化教育部工程研究中心 江苏徐州221116
近年来随着人工智能(AI)技术在计算机视觉与自然语言处理等单模态领域表现出愈发优异的性能,多模态学习的重要性和必要性逐渐展现出来,其中基于视觉-语言预训练模型的零样本迁移(ZST)方法得到了国内外研究者的广泛关注。得益于训练模... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
低资源场景下的视觉-语言预训练模型适应性研究
低资源场景下的视觉-语言预训练模型适应性研究
收藏 引用
作者: 林坚 西安电子科技大学
学位级别:硕士
视觉-语言训练(Vision-Language Pre-training,VLP)模型是一种针对视觉和文本模态相关任务进行大规模无监督训练的深度学习模型。得益于Transformer结构善于处理长距离依赖的能力以及亿级别的数据驱动的大批次对比表征学习,VLP模型... 详细信息
来源: 同方学位论文库 同方学位论文库 评论