一种视频中时空动作检测的交互关系建模方法
An Interactive Relationship Modeling Method for Spatio-temporal Action Detection in Video作者机构:西南交通大学计算机与人工智能学院四川成都611756
出 版 物:《信息与电脑》 (Information & Computer)
年 卷 期:2022年第34卷第8期
页 面:6-8页
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
摘 要:目前,在时空动作检测任务中,很少有方法明确提出使用优化动作交互关系特征来提升检测的准确性。笔者提出基于多头注意力的交互特征增强方法,包括人物视觉、人的时序、全局背景和空间位置的特征增强,采用串行融合策略连接增强块,有效提升了时空动作检测的准确性。模型在自建Unload-Actions数据集上的帧级mAP达到27.93%,并在消融实验中证明了交互特征增强块和串行融合策略的有效性。