基于联想记忆神经网络的视觉图像分类方法研究
作者单位:中国石油大学(华东)
学位级别:硕士
导师姓名:王延江
授予年度:2021年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:视觉图像分类是计算机视觉和模式识别领域的一个基础性工作,长期以来都是研究的热点。目前的图像分类方法层出不穷,但是依然无法像人类一样快速地对复杂的视觉图像进行理解和分类。人类之所以能够对海量的视觉信息进行有效表达、存储和识别,是因为人脑可以将同一事物的不同特征信息相互关联后形成联想记忆,并能根据部分特征联想起完整的事物信息。因此,对人脑的联想记忆机制进行研究,并将其与视觉图像分类相结合,具有重要的理论和应用价值。为此,本文将基于人脑记忆的神经生物学和认知神经科学的研究成果对联想记忆神经网络进行研究,并将其用于视觉图像的联想与分类。本文主要工作如下:1.对人脑联想记忆的神经生物学基础和记忆信息的编码、存储和提取过程进行了研究,并总结了三种典型联想记忆神经网络的结构和建模过程等相关理论,为将人脑联想记忆机制应用于视觉图像分类奠定了理论基础。2.提出了一种基于自联想记忆神经网络的视觉图像分类算法。该算法采用类Hebb局部联想学习规则将图像特征与其类别之间的关联信息存储于网络的突触连接中,突破了原始模型只能处理二进制信息的局限性。在四个基准图像库上进行了图像分类实验,并和传统的支持向量机(Support Vector Machine,SVM)、BP神经网络(Back Propagation Neural Network,BPNN)以及其他联想记忆模型进行了对比,结果验证了本文所提算法的有效性。此外,所提算法还可以实现十个大写英文字母图像数据的模式补全。3.提出了一种基于双向模式联想记忆神经网络的视觉图像分类算法。将改进的时域差分Hebbian联想学习规则和k WTA(k-winners-take-all)函数引入Hebbian学习机制中,克服了原始模型只能单向传输的局限性和Hebbian学习中权值可能无限增长的缺点,因此网络可以学习成对图像的信息和图像特征与其类别标签编码的关联信息。在十对“人脸-服装图像数据上的实验表明所提算法能够实现图像间的联想记忆。另外,在三个多类别图像库上的分类实验结果表明所提算法和SVM、BPNN以及其他联想记忆模型相比有更高的分类准确率。