多尺度子群体交互关系下的群体行为识别方法
Group Activity Recognition under Multi-scale Sub-group Interaction Relationships作者机构:石油数据挖掘北京市重点实验室北京102249 中国石油大学(北京)信息科学与工程学院/人工智能学院北京102249 北京大学计算机学院北京100871
出 版 物:《电子与信息学报》 (Journal of Electronics & Information Technology)
年 卷 期:2024年第46卷第5期
页 面:2228-2236页
核心收录:
学科分类:1305[艺术学-设计学(可授艺术学、工学学位)] 0711[理学-系统科学] 13[艺术学] 07[理学] 081104[工学-模式识别与智能系统] 08[工学] 080401[工学-精密仪器及机械] 0804[工学-仪器科学与技术] 080402[工学-测试计量技术及仪器] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程]
基 金:北京市自然科学基金(L233002) 中国石油科技创新基金(2022DQ02-0609)
摘 要:群体行为识别旨在识别包含多个个体的群体行为。在现实场景中,群体行为通常可以被视为从群体到子群体再到个人的层次结构。然而,以前的群体行为识别方法主要侧重于对个体之间的关系进行建模,缺乏对子群体之间关系的深度研究。从该角度出发,该文提出一种基于多尺度子群体交互关系(MSIR)的多层次群体行为识别框架。除对个体关系进行建模外,重点关注了子群体之间的多尺度交互特征。具体优化如下:设计子群体划分模块,通过个体外观特征和其空间位置来聚合可能存在关联的个体,再进一步利用语义信息动态地生成不同尺度大小的子群体;设计子群体交互特征提取模块,通过构建不同子群体之间的交互矩阵以及图神经网络的关系推理能力,提取更具判别力的子群体特征。实验结果表明,与现有12种方法在排球数据集和集体活动数据集这两个群体行为识别基准数据集上对比,该文方法都取得最好的性能结果。作为一个易于扩展和优化的群体行为识别框架,该算法在不同数据集上都具有较好的泛化能力。