咨询与建议

限定检索结果

文献类型

  • 5 篇 期刊文献
  • 5 篇 学位论文

馆藏范围

  • 10 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 10 篇 工学
    • 8 篇 机械工程
    • 4 篇 计算机科学与技术...
    • 4 篇 软件工程
    • 1 篇 控制科学与工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 10 篇 密集视频描述
  • 3 篇 视频描述
  • 2 篇 多特征融合
  • 2 篇 自然语言处理
  • 2 篇 视频理解
  • 2 篇 深度学习
  • 1 篇 t5模型
  • 1 篇 transformer
  • 1 篇 集合预测
  • 1 篇 遗忘度
  • 1 篇 前馈神经网络
  • 1 篇 视听融合
  • 1 篇 事件边界增强
  • 1 篇 图卷积网络
  • 1 篇 视频上下文
  • 1 篇 特征金字塔
  • 1 篇 多模态融合
  • 1 篇 多模态意图识别
  • 1 篇 潜在主题感知
  • 1 篇 多模态

机构

  • 2 篇 武汉科技大学
  • 2 篇 大连民族大学
  • 2 篇 智能信息处理与实...
  • 2 篇 天津理工大学
  • 1 篇 东北师范大学
  • 1 篇 中国民航大学
  • 1 篇 北京工商大学
  • 1 篇 杭州电子科技大学

作者

  • 2 篇 盘晓芳
  • 2 篇 杨大伟
  • 2 篇 刘茂福
  • 2 篇 毛琳
  • 1 篇 张佳玉
  • 1 篇 崔园园
  • 1 篇 常志
  • 1 篇 张汝波
  • 1 篇 张煜杨
  • 1 篇 陈劭武
  • 1 篇 胡慧君
  • 1 篇 李兰婷
  • 1 篇 南瑞环
  • 1 篇 王馨宇
  • 1 篇 刘瑞军
  • 1 篇 黄先开
  • 1 篇 王晓川
  • 1 篇 刘鹏飞

语言

  • 10 篇 中文
检索条件"主题词=密集视频描述"
10 条 记 录,以下是1-10 订阅
排序:
基于事件最大边界的密集视频描述方法
收藏 引用
中国科技论文 2024年 第2期19卷 169-177页
作者: 陈劭武 胡慧君 刘茂福 武汉科技大学计算机科学与技术学院 武汉430065 智能信息处理与实时工业系统湖北省重点实验室(武汉科技大学) 武汉430081
针对基于集合预测的密集视频描述方法由于缺乏显式的事件间特征交互且未针对事件间差异训练模型而导致的模型重复预测事件或生成语句雷同问题,提出一种基于事件最大边界的密集视频描述(dense video captioning based on event maximal m... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于双向特征金字塔的密集视频描述生成方法
收藏 引用
中国科技论文 2024年 第2期19卷 200-208页
作者: 张煜杨 刘茂福 武汉科技大学计算机科学与技术学院 武汉430065 智能信息处理与实时工业系统湖北省重点实验室(武汉科技大学) 武汉430081
针对当前方法普遍存在较为严重的细节结构信息丢失与事件间重叠的问题,提出一种基于双向特征金字塔的密集视频描述生成方法(dense video captioning with bilateral feature pyramid net,BFPVC)。BFPVC通过带有自底向上、自顶向下、横... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
密集视频描述研究方法综述
收藏 引用
计算机工程与应用 2023年 第12期59卷 28-48页
作者: 黄先开 张佳玉 王馨宇 王晓川 刘瑞军 北京工商大学计算机学院 北京100048
密集视频描述视频理解的重要分支之一,也是计算机视觉与自然语言处理领域交叉的热点研究方向。其主要目的是对包含丰富事件的视频进行针对内容的事件定位,并将其描述为人类日常沟通所用的自然语言。与生成单句描述文本的传统视频描述... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
改进的密集视频描述Transformer译码算法
收藏 引用
计算机工程与应用 2023年
作者: 杨大伟 盘晓芳 毛琳 张汝波 大连民族大学机电工程学院
针对Transformer应用于密集视频描述时,历史文本特征会对后续文本生成产生干扰,难以捕捉视频动态信息从而影响描述的连贯性和准确性。为保持上下文一致性的同时又能缓解历史文本干扰,提出改进的密集视频描述Transformer译码算法(D-Uf... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
密集视频描述中单词级遗忘度优化算法
收藏 引用
大连民族大学学报 2022年 第3期24卷 218-225页
作者: 盘晓芳 杨大伟 毛琳 大连民族大学机电工程学院 辽宁大连116605
针对密集视频描述在文本生成过程中存在部分单词错误和缺失的问题,提出密集视频描述中单词级遗忘度优化算法(WFO)。通过调整遗忘度曲线斜率优化Transformer解码器中多头注意力输出的权重和文本序列,增强文本向量中局部语义信息的关注度... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于潜在语义增强的端到端密集视频描述
基于潜在语义增强的端到端密集视频描述
收藏 引用
作者: 崔园园 中国民航大学
学位级别:硕士
密集视频描述是指以未修剪的长视频为输入,首先定位视频中包含的所有事件,包括事件的起始时间与结束时刻,最后为这些事件生成自然语言描述。该任务因其在视频监控、AI体育解说、婴儿早期教育等方面存在巨大的潜在应用价值而成为近年来... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于Transformer的多模态密集视频描述方法
基于Transformer的多模态密集视频描述方法
收藏 引用
作者: 南瑞环 杭州电子科技大学
学位级别:硕士
密集视频描述的主要任务是从一段未经剪辑的视频中定位所有出现的事件,并为这些事件生成对应的文本描述。这一任务同时涉及了多个不同的领域,是一个典型的多模态学习任务。密集视频描述任务在视频理解、人机交互等方面有着广阔的应用前... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
视频时序动作定位和描述方法研究
视频时序动作定位和描述方法研究
收藏 引用
作者: 刘鹏飞 天津理工大学
学位级别:硕士
时序动作定位任务的研究内容是识别出视频中的动作,并预测出这个动作开始和结束时间。密集视频描述任务的研究内容是使用自然语言连贯的描述视频中的多个事件。使用图卷积网络可以处理非欧式空间数据与过滤无关背景信息,因此本文使用图... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于深度学习的多特征多模态视频描述方法研究
基于深度学习的多特征多模态视频描述方法研究
收藏 引用
作者: 常志 天津理工大学
学位级别:硕士
随着深度学习技术的不断发展和神经网络强大的学习能力,视频描述作为一项连接计算机视觉和自然语言处理的新型跨模态任务,引起了国内外学者的广泛关注,并且取得了越来越多具有权威性的突出成果。视频描述的目标是为给定的视频片段自动... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
面向人机交互的意图识别方法研究
面向人机交互的意图识别方法研究
收藏 引用
作者: 李兰婷 东北师范大学
学位级别:硕士
意图识别作为对话系统的核心模块之一,其主要作用是基于用户话语判断对话中的真实意图。准确识别用户意图对于实现有效、流畅的人机对话至关重要。然而自然人机交互场景的复杂性和人类意图表达方式的灵活多样性,给意图识别领域带来了巨... 详细信息
来源: 同方学位论文库 同方学位论文库 评论