基于深度特征的特殊视频内容检测算法研究
作者单位:中央民族大学
学位级别:硕士
导师姓名:宋伟
授予年度:2018年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:随着视频传输和转码技术的不断进步,网络流量视频化成为新的发展方向,各种暴力、恐怖等非法特殊视频在互联网中频频出现,严重影响广大网民的身心健康,成为社会公共安全隐患。面对大规模视频,如何实现特殊视频内容的有效检测成为当前计算机视觉领域的一个重要研究课题。近几年,随着深度学习的兴起,诸如HOG、SIFT等传统的特征描述子被逐渐取代,深度特征逐渐成为主流的特征表征方法。采用深度特征刻画音频、图像、视频、文字等内容不仅在表征效果上优于传统方法,在处理能力上也具有巨大的优势,同时在性能上还有很大的提升空间。因此,高效地利用深度特征解决计算机视觉问题是当前及未来应当重点探讨的课题,具有深远意义。本文研究了如何有效利用深度特征进行视频暴力内容检测的问题,主要基于三维卷积网络展开研究,主要工作有以下几个方面:(1)研究了基于三维卷积网络的端到端检测算法,分析了输入视频数据帧长对检测效果的影响。(2)研究了三维卷积网络的数据预处理方法,提出了一种改进的帧采样方法。(3)探索了三维卷积网络和不同分类器结合的算法框架,提出了基于三维卷积网络和极限学习机的特殊视频检测算法,对比了三维卷积网络端到端、三维卷积网络结合支持向量机、三维卷积网络结合极限学习机的检测效果。