三维注意力增强的暴力场景检测算法
Three-dimensional attention-enhanced algorithm for violence scene detection作者机构:山东工商学院信息与电子工程学院山东烟台264005
出 版 物:《西安电子科技大学学报》 (Journal of Xidian University)
年 卷 期:2024年第51卷第1期
页 面:114-124页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(61876100,62072286,61572296) 山东省高等学校青创科技支持计划(2019KJN041,2020KJN005) 山东省研究生教育创新计划(SDYAL21211)
主 题:暴力检测 深度学习 注意力机制 模式识别 P3D 3D-DenseNet
摘 要:为了提升互联网多媒体内容安全检测能力,有效过滤不良信息,提出了一种基于三维注意力增强的视频暴力内容检测算法。该算法以3D-DenseNet为骨干网络,首先利用P3D提取低层次的时空特征信息;其次引入SimAM注意力模块计算通道-空间注意力,增强帧画面重点区域信息;然后设计了时域注意力加强的过渡层突出重点时序信息,如此形成通道-空间-时间三维注意力,提升暴力场景检测性能。实验结果显示,算法在内容单一的小规模暴力行为检测数据集Hockey和Movies上准确率分别达到了98.75%和100%,在内容多样的大规模数据集RWF-2000上达到了89.25%,综合性能优于同类算法,验证了算法的有效性;在长视频的暴力内容定位实验中,算法在VSD2014数据集上相较同类算法也取得了更好的检测效果,证明了算法在暴力内容检测方面的泛化能力。