咨询与建议

限定检索结果

文献类型

  • 9 篇 学位论文
  • 5 篇 期刊文献

馆藏范围

  • 14 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 13 篇 工学
    • 8 篇 机械工程
    • 4 篇 计算机科学与技术...
    • 4 篇 软件工程
    • 1 篇 信息与通信工程
    • 1 篇 控制科学与工程
    • 1 篇 公安技术
    • 1 篇 网络空间安全
  • 1 篇 理学
    • 1 篇 生物学
  • 1 篇 医学
    • 1 篇 基础医学(可授医学...
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 14 篇 跨模态交互
  • 7 篇 注意力机制
  • 2 篇 图像描述
  • 2 篇 卷积神经网络
  • 2 篇 特征融合
  • 2 篇 特征增强
  • 1 篇 无监督域适应
  • 1 篇 情感识别
  • 1 篇 情感关系推理
  • 1 篇 多模态情感分析
  • 1 篇 语义分割
  • 1 篇 头皮脑电记录
  • 1 篇 复合融合层
  • 1 篇 智慧交通
  • 1 篇 多层融合
  • 1 篇 多模态
  • 1 篇 遥感图像
  • 1 篇 异常检测
  • 1 篇 跨模态对齐
  • 1 篇 多模态检索

机构

  • 1 篇 中央音乐学院
  • 1 篇 中国人民公安大学
  • 1 篇 西南石油大学
  • 1 篇 安徽大学
  • 1 篇 山东大学
  • 1 篇 山东建筑大学
  • 1 篇 东北石油大学
  • 1 篇 华东师范大学
  • 1 篇 苏州大学
  • 1 篇 华南理工大学
  • 1 篇 北京工业大学
  • 1 篇 辽宁大学
  • 1 篇 湖南大学
  • 1 篇 哈尔滨理工大学
  • 1 篇 山东警察学院
  • 1 篇 郑州大学
  • 1 篇 太原科技大学
  • 1 篇 中国传媒大学

作者

  • 1 篇 潘嘉男
  • 1 篇 何金波
  • 1 篇 尹义龙
  • 1 篇 李小兵
  • 1 篇 吴彤
  • 1 篇 钟俊弘
  • 1 篇 聂秀山
  • 1 篇 张文靖
  • 1 篇 程慧杰
  • 1 篇 齐林
  • 1 篇 杨帆
  • 1 篇 帖云
  • 1 篇 刘新放
  • 1 篇 季怡
  • 1 篇 张赟
  • 1 篇 王鹏宇
  • 1 篇 靳聪
  • 1 篇 刘纯平
  • 1 篇 吴然万
  • 1 篇 刘凯

语言

  • 14 篇 中文
检索条件"主题词=跨模态交互"
14 条 记 录,以下是1-10 订阅
排序:
基于复合跨模态交互网络的时序多模态情感分析
收藏 引用
计算机科学与探索 2024年 第5期18卷 1318-1327页
作者: 杨力 钟俊弘 张赟 宋欣渝 西南石油大学计算机与软件学院 成都610500
针对多模态情感分析中存在的不同模态间语义特征差异性导致模态融合不充分、交互性弱等问题,通过研究分析不同模态之间存在的潜在关联性,搭建一种基于复合跨模态交互网络的时序多模态情感分析(CCIN-SA)模型。该模型首先使用双向门控循... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于跨模态交互的车辆监控视频片段检索技术研究
基于跨模态交互的车辆监控视频片段检索技术研究
收藏 引用
作者: 王琴 华南理工大学
学位级别:硕士
根据国家全面提升公共安全保障的要求,监控视频是新形势下维护社会安全、预防和打击违法犯罪行为的重要手段。近年来,各地积极推进监控视频系统建设,利用视频监控系统充分挖掘车辆记录、检测车辆行为的发生时间,可以节省处理交通肇事案... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于多模态融合和跨模态交互的遥感图像语义分割研究
基于多模态融合和跨模态交互的遥感图像语义分割研究
收藏 引用
作者: 何金波 安徽大学
学位级别:硕士
随着遥感图像拍摄技术和机载平台的快速发展,大量高分辨率的遥感图像更容易获得,遥感图像场景解析更是渗透到人类的生活中。比如:道路检测,灾害预测,环境监测,土地规划,农作物规划,水域面积计算等。在这些领域中,计算机视觉技术可以帮... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于双通道注意力机制的多尺度指代目标分割方法
收藏 引用
计算机辅助设计与图形学学报 2024年
作者: 胡梦楠 王蓉 张文靖 张琪 中国人民公安大学信息网络安全学院 山东警察学院治安系 山东警察学院社会治安与应急管理研究中心
针对指代分割任务中视觉和语言间缺乏充分的跨模态交互、不同尺寸的目标空间和语义信息存在差异的问题,提出了基于双通道注意力机制的多尺度指代目标分割方法. 首先, 利用语言表达中不同类型的信息关键词来增强视觉和语言特征的模... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
基于交叉模态注意力特征增强的医学视觉问答
收藏 引用
计算机工程 2024年
作者: 刘凯 任洪逸 李蓥 季怡 刘纯平 苏州大学计算机科学与技术学院
医学视觉问答需要对医学图像内容与问题文本内容进行理解与结合,因此设计有效的模态表征及模态的融合方法对医学视觉问答任务的表现至关重要。目前,医学视觉问答方法通常只关注医学图像的全局特征以及单一模态内注意力分布,忽略了... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
红外与可见光图像自注意力融合方法研究
红外与可见光图像自注意力融合方法研究
收藏 引用
作者: 杨帆 太原科技大学
学位级别:硕士
红外与可见光图像融合的目的是整合两种源图像各自的互补信息,从而生成视觉效果更好的融合图像。传统融合方法通常依据特定的特征提取模块和人为设定的融合规则得到有效的融合信息。但受性能提高与计算成本的影响,传统融合方法模型通常... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于自然语言的视频片段定位综述
收藏 引用
计算机科学 2022年 第9期49卷 111-122页
作者: 聂秀山 潘嘉男 谭智方 刘新放 郭杰 尹义龙 山东建筑大学计算机科学与技术学院 济南250101 山东大学软件学院 济南250100
自然语言视频定位(Natural Language Video Localization, NLVL)是一项新颖而富有挑战性的任务。该任务的目的是根据给定的查询文本从未修剪的视频中找到与这条查询文本语义最为相似的目标片段。与传统的时序动作定位任务不同,NLVL具有... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于音视频特征融合的情感识别方法研究
收藏 引用
重庆理工大学学报(自然科学) 2022年 第1期36卷 120-127页
作者: 帖云 程慧杰 靳聪 李小兵 齐林 郑州大学信息工程学院 郑州450001 中国传媒大学信息与通信工程学院 北京100024 中央音乐学院 北京100031
传统的视频情感识别工作主要集中在面部表情、人体的动作行为等,忽略了场景和对象中包含大量的情感线索及不同对象之间的情感关联。因此,提出了一个基于视觉关系推理和模态信息学习的音视频特征融合网络模型用于预测视频情感。模型主... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于自然语言的视频时刻检索算法研究
基于自然语言的视频时刻检索算法研究
收藏 引用
作者: 平申 湖南大学
学位级别:硕士
随着社交网络和移动通信技术的飞速发展,人们能够在任何时间、任何地点拍摄并上传各种视频。与文本和静态图像相比,视频传达的信息更加丰富。然而,随着视频时长的不断增长,人们希望能够在视频中快速定位到自己感兴趣的片段,视频时刻检... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
多源图像的显著性目标检测算法研究
多源图像的显著性目标检测算法研究
收藏 引用
作者: 吴然万 东北石油大学
学位级别:硕士
多源图像的显著性目标检测(如:RGB-D和RGB-T显著性目标检测)是近年来计算机视觉领域中的研究热点之一,旨在利用多模态数据(如:RGB图像和深度图像或RGB图像和热红外图像)在给定区域中识别出最显著的目标。其中,多源数据是对同一场景的不... 详细信息
来源: 同方学位论文库 同方学位论文库 评论