咨询与建议

限定检索结果

文献类型

  • 10 篇 期刊文献
  • 4 篇 学位论文
  • 3 篇 报纸

馆藏范围

  • 17 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 15 篇 工学
    • 9 篇 计算机科学与技术...
    • 4 篇 机械工程
    • 4 篇 控制科学与工程
    • 2 篇 电气工程
    • 1 篇 电子科学与技术(可...
    • 1 篇 信息与通信工程
    • 1 篇 船舶与海洋工程
    • 1 篇 软件工程
    • 1 篇 网络空间安全
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 17 篇 视觉语言模型
  • 4 篇 图像分类
  • 2 篇 多模态融合
  • 2 篇 多模态
  • 2 篇 蒙古文古籍
  • 2 篇 图像语义
  • 2 篇 自然语言处理
  • 2 篇 视觉词袋模型
  • 2 篇 机器人
  • 2 篇 显著图
  • 1 篇 gpt-4
  • 1 篇 跨模态检索
  • 1 篇 创业机会
  • 1 篇 隐含狄利克雷分配...
  • 1 篇 图像信息
  • 1 篇 目标分类
  • 1 篇 无人艇
  • 1 篇 性能优化
  • 1 篇 长距离依赖
  • 1 篇 情感分析

机构

  • 2 篇 解放军信息工程大...
  • 2 篇 信息工程大学
  • 2 篇 内蒙古大学
  • 1 篇 华中科技大学
  • 1 篇 多模态人工智能系...
  • 1 篇 华中师范大学
  • 1 篇 山东大学
  • 1 篇 北京工业大学
  • 1 篇 中国科学院大学
  • 1 篇 湖南工业大学
  • 1 篇 北京印刷学院
  • 1 篇 天津理工大学
  • 1 篇 武汉大学
  • 1 篇 北京信息科技大学

作者

  • 3 篇 赵永威
  • 3 篇 李弼程
  • 3 篇 王挺进
  • 1 篇 文巧
  • 1 篇 陈曦
  • 1 篇 滕尚志
  • 1 篇 陆利坤
  • 1 篇 曾庆涛
  • 1 篇 金枢炜
  • 1 篇 王欣宇
  • 1 篇 李宝安
  • 1 篇 刘金安
  • 1 篇 马军
  • 1 篇 黎坤
  • 1 篇 杜永萍
  • 1 篇 姚涵涛
  • 1 篇 谢润锋
  • 1 篇 李一杰
  • 1 篇 张博超
  • 1 篇 吕学强

语言

  • 17 篇 中文
检索条件"主题词=视觉语言模型"
17 条 记 录,以下是1-10 订阅
排序:
视觉语言模型引导的文本知识嵌入的小样本增量学习
收藏 引用
软件学报 2024年 第5期35卷 2101-2119页
作者: 姚涵涛 余璐 徐常胜 多模态人工智能系统全国重点实验室(中国科学院自动化研究所) 北京100190 中国科学院大学人工智能学院 北京100049 天津理工大学计算机科学与工程学院 天津300384
真实场景往往面临数据稀缺和数据动态变化的问题,小样本增量学习的目的是利用少量数据推理数据知识并减缓模型对于旧知识的灾难性遗忘.已有的小样本增量学习的算法(CEC和FACT等)主要是利用视觉特征来调整特征编码器或者分类器,实现模型... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于视觉语言模型的跨模态多级融合情感分析方法
收藏 引用
模式识别与人工智能 2024年 第5期37卷 459-468页
作者: 谢润锋 张博超 杜永萍 北京工业大学信息学部 北京100124
图文多模态情感分析旨在通过融合视觉模态和文本模态预测情感极性,获取高质量的视觉模态表征和文本模态表征并进行高效融合,这是解决图文多模态情感分析任务的关键环节之一.因此,文中提出基于视觉语言模型的跨模态多级融合情感分析方法... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于视觉语言模型的无人艇环境感知技术研究
基于视觉语言模型的无人艇环境感知技术研究
收藏 引用
作者: 李一杰 华中科技大学
学位级别:硕士
随着智能硬件与人工智能技术的发展,越来越多的任务转而由各种先进的机器代替人工进行实现,其中水面无人艇有望在未来代替人类发挥重要作用。无人艇在提高工作效能的同时降低人力成本,其中水面无人艇的环境感知能力是其执行任务的前提... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于显著图加权视觉语言模型的图像分类方法
收藏 引用
计算机工程 2015年 第3期41卷 204-210页
作者: 王挺进 赵永威 李弼程 信息工程大学信息系统工程学院 郑州450002
传统基于视觉语言模型(VLM)的图像分类方法在参数估计阶段,通常采用最大似然估计的方式统计视觉单词的分布,忽略了图像背景噪声对该模型参数估计的影响。为此,提出一种新的图像分类方法。利用基于视觉注意的显著性检测算法提取图像中的... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于视觉语言模型的图像语义挖掘研究
收藏 引用
图书情报工作 2013年 第5期57卷 120-123页
作者: 金聪 刘金安 金枢炜 华中师范大学计算机学院 武汉大学物理科学与技术学院
针对图像的特性,给出一种图像的二元视觉语言模型,在此基础上提出一种新的图像语义挖掘方法。该方法将每幅图像表示成一个由视觉单词构成的矩阵,通过计算每个视觉单词的权重,按照权重的大小对视觉单词进行选择,利用选择后的视觉单词集合... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于视觉语言模型的蒙古文古籍图像检索技术研究
基于视觉语言模型的蒙古文古籍图像检索技术研究
收藏 引用
作者: 郭星 内蒙古大学
学位级别:硕士
随着数字化技术的发展,在内蒙古自治区,越来越多的蒙古文古籍被转成数字图像,以便长久保存。但是以图像格式保存的古籍文档没有索引信息,无法实现全文检索,因此制约了古籍文献资料的传播与利用。本文关注蒙古文古籍图像检索技术,这为挖... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于视觉语言提示学习的少样本图像分类方法
收藏 引用
北京邮电大学学报 2024年 第2期47卷 11-17页
作者: 李宝安 王欣宇 滕尚志 吕学强 北京信息科技大学网络文化与数字传播北京市重点实验室 北京100101
为了提高少样本图像分类的性能和泛化能力,充分利用大规模视觉语言预训练模型,提出了一种高效处理少样本图像分类问题的方法。首先,在文本编码部分,整合多个可学习的文本提示,充分挖掘图像类别标签在提示语句中不同位置对模型泛化性能... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
N步长距离视觉语言模型的图像分类方法
收藏 引用
信息工程大学学报 2014年 第4期15卷 453-458,465页
作者: 王挺进 赵永威 李弼程 信息工程大学 河南郑州450001
传统的视觉语言模型(visual language model,VLM)只考虑了相邻视觉单词之间的空间位置关系,不考虑不相邻视觉单词之间的贡献。针对传统视觉语言模型的不足,提出了一种N步长距离视觉语言模型,并将其用于图像分类。该方法首先给出了相隔N... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
句法依存关系指导的视觉语言融合模型研究
句法依存关系指导的视觉语言融合模型研究
收藏 引用
作者: 张知奇 湖南工业大学
学位级别:硕士
人类学习本质上是多模态的,因为联合利用多种感官有助于更好地理解和分析新信息。理所当然地,视觉语言模态学习从人类最为关键的视觉语言两种模态融合学习过程的有效性中汲取灵感,在具有挑战性的任务中表现出了让人眼前一亮的能力,诸... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于视觉语言的文字识别方法综述
收藏 引用
北京印刷学院学报 2024年 第6期32卷 35-43页
作者: 陈曦 陆利坤 王彤 曾庆涛 北京印刷学院 北京102600
从光学字符识别(OCR)的基础到自然语言处理在文字识别中的应用,再到视觉语言模型在文字识别领域的最新进展,详细介绍了文字识别的各个步骤,包括图像预处理、特征提取、字符分割和识别,并讨论了多种先进技术和模型如对比学习、多模态融合... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论