基于深度学习与分形分析的纹理分类研究
作者单位:华南理工大学
学位级别:硕士
导师姓名:许勇
授予年度:2021年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:纹理分类是模式识别中的一个重要的核心问题,极具挑战性。近年来,随着深度学习研究的蓬勃发展,基于深度卷积神经网络的复杂纹理分类方法成为了主流的纹理分类方法。尽管普通的卷积神经网络在实践中能有效地学习出极具区分性的图像特征,但对于纹理图像,如何充分利用卷积神经网络得到一个鲁棒且具区分性的整体纹理特征表示,仍然是一个关键问题。本文基于分形几何和统计自相似性,提出两种有效的纹理分类深度学习方法。本文第一个工作利用多重分形频谱来为解决纹理图像全局不变性特征问题,提出了一种可训练分形池化模块用于生成空间无序但信息丰富的全局纹理表示,并利用该模块提出了可端到端学习的深度重分形频谱网络。分形池化模块对经典的重分形频谱分析流程进行了离散松弛,使其可端到端融入深度学习的反向传播过程。与现有的基于深度卷积神经网络的纹理分类方法比,深度重分形频谱网络有效的刻画了图像的纹理特征或基元的全局空间排列规律。本文第二个工作着眼于将多层卷积特征聚合为一个鲁棒性强且判别力强的特征表示,提出了一种新的特征聚合模块,称为跨层统计自相似性聚合模块。该模块提取输入纹理图像不同层卷积特征中的统计自相似性,将其刻画为一个沿着网络深度方向的动态过程。该模块使用跨层特征张量的局部差分盒维数特征的软直方图分布来刻画跨层统计自相似性。生成的特征表示编码了输入图像的跨层动态过程和统计自相似性,从而在全局平均池化之外提供了辅助的识别信息。通过将该模块集成到深度残差网络主干结构中,提出了一种新的用于纹理分类的深度网络模型——深度跨层统计自相似性聚合网络。本文所提出的两个深度网络均通过大量实验进行性能评估。实验结果验证了所提出方法的有效性。本文的研究表明,把传统的基于统计的纹理分类方法与深度学习结合,能获得明显的性能提升。这能为现有的相关研究提供新思路。