咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于双流特征增强网络的视频行为识别 收藏

基于双流特征增强网络的视频行为识别

作     者:赵晨 冯秀芳 董云云 温昕 曹若琛 

作者机构:太原理工大学软件学院 

出 版 物:《太原理工大学学报》 (Journal of Taiyuan University of Technology)

年 卷 期:2023年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:山西省重点研发计划项目(202102020101007) 国家自然科学基金资助项目(6226196) 山西省基础研究计划项目(202203021212207) 

主  题:行为识别 双流网络 时间位移 光流 帧差 

摘      要:【目的】双流卷积网络主要通过融合视频的空间流特征和时间流特征以达到较高的识别精度,传统双流卷积使用光流或者时间位移模块来提取时间特征,使用光流的缺点在于光流抽取工作量繁重,而使用时间位移模块的缺点在于会破坏原本视频帧的空间特征和通道特征。【方法】提出一种双流特征增强网络Two-stream Feature Enhancement Network(TFEN)解决上述问题,针对时间位移导致的特征破坏问题,提出了空间增强时间位移模块Spatial Enhancement- Temporal Shift Module(SE-TSM)和通道增强时间位移模块Channel Enhancement - Temporal Shift Module(CE-TSM),在每次时间位移后进行特征增强以改善特征受损。针对光流问题提出了融合基于帧差的时间流网络,相较于光流,使用帧差耗时短易操作。针对帧差运动信息微弱问题,提出了运动增强模块Sports Improvement Module(SIM)增强运动特征以提高性能。【结果】本文网络在公开视频数据集UCF101和HMDB51上分别达到了96.1% 和75.7% 的精度,优于目前主流网络。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分