视频运动向量和片段时序行为的弱监督感知方法研究-南通市图书馆

文献详情 >视频运动向量和片段时序行为的弱监督感知方法研究收藏

视频运动向量和片段时序行为的弱监督感知方法研究

作者：黄晓萍

作者单位：华南理工大学

学位级别：硕士

导师姓名：马丽红

授予年度：2021年

学科分类：08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]

主题：时序行为检测弱监督学习非平衡自监督约束时序行为类条件概率估计片段度量学习

摘要：时序行为检测是海量视频信号内容分析的关键技术,它往往需要大量带有行为起止时间和行为类别标注的视频样本来训练,而获得这些标注数据的代价极高。为减少标注成本,弱监督时序行为检测(WTAD)只利用粗粒度的视频行为类别标签进行训练,并推断未剪辑视频信号内部每个行为片段的开始时间、结束时间及行为类别。其中主要的挑战有:行为边界标注的缺失增加了准确检测每个行为片段的难度;主流的弱监督时序行为检测算法大都基于“由分类器定位动作的思想,即先训练视频行为分类器,再对视频片段分类,实现动作定位。但以视频行为分类器来分类信息有限的视频片段,识别精度难以保证。针对行为边界信息缺失和视频片段准确分类问题,本文完成了以下工作:1、提出了运动传播向量感知和非平衡自监督的弱监督行为推断算法,利用时序视觉变化推断缺失的行为边界信息。首先,基于构造的视频残差运动传播向量(MPV)和时序运动感知网(TAP),学习“时序变化——片段关注度的映射关系,解决弱监督下视频内部动作的感知问题;然后提出非平衡自监督的关注度调整函数(USSL),通过激活次显著动作区域,和增大“背景——动作片段关注度的差异,解决TAP的侧抑制和缓慢动作捕捉失败的问题。在THUMOS14数据集上,相比于未利用时序变化信息的STPN,本文的运动感知算法的行为检测准确率至少提高2%m AP;在Activity Net-v1.2数据集上,比用时序信息直接剪辑视频的UNT,提高20.8%m AP(t Io U=0.5)。2、提出了一个弱监督下视频片段行为类别的迭代求解模型,实现片段级行为检测的近似监督学习。它借助两步交替迭代训练,获得模型的稳定解。第一步,估计时序行为类条件概率(T-CAP),并根据T-CAP产生每个视频片段的行为伪标签;第二步,在行为类别空间下,学习在伪标签下同类片段的视觉特征共性,和背景片段与动作片段的差异性。通过三元组损失和直接中心损失增大背景与动作片段的分离度,以及同类数据的聚集度,从而降低片段的分类不确定性,最终提高T-CAP的可靠性。在THUMOS14数据集上,对比基于视频级行为分类器的W-TALC,视频片段类别迭代求解方法的平均行为检测精度提高了2.5%m AP。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

视频运动向量和片段时序行为的弱监督感知方法研究

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

视频运动向量和片段时序行为的弱监督感知方法研究

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：