结合混合卷积和多尺度注意力的视频异常检测算法
Video anomaly detection algorithm combining mixed convolution and multi-scale attention作者机构:沈阳理工大学信息科学与工程学院辽宁沈阳110159
出 版 物:《液晶与显示》 (Chinese Journal of Liquid Crystals and Displays)
年 卷 期:2024年第39卷第8期
页 面:1128-1137页
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
基 金:辽宁省自然科学基金面上项目(No.2022-MS-276) 国家自然科学基金青年项目(No.62102272)
主 题:上下文信息 跳跃连接 混合卷积 多尺度注意力 结构相似性
摘 要:基于U-net风格的无监督视频异常检测模型有着较好的检测效果,但由于普通卷积运算使用固有的局部特性,使U-Net风格的编码器无法有效地提取全局上下文信息,并且使用简单的跳跃连接无法获得有效的特征信息,使用的L2损失函数是仅考虑了像素级别的差异而无法捕捉图像的结构特征。对此提出了结合混合卷积和多尺度注意力的视频异常检测算法,并加入结构相似性损失函数(SSIM)优化模型。具体来说,在编码器最后一层添加混合卷积模块,混合空间和位置的特征来提取全局上下文信息。在编码器和解码器之间的跳跃连接中添加多尺度注意力模块,使模型能提取更有价值的特征,实现有效的跳跃连接。使用参数约束结构相似性损失函数与L2损失函数的权重,从而更准确地优化模型。实验结果表明,所提算法在UCSD-Ped2和CUHK Avenue公开数据集上的AUC指标达到96.7%和86.1%,与改进前的模型相比提高了1.6%和1.4%,证明了所提模型的有效性。