基于深度哈希的分层图像检索方法研究
作者单位:安徽大学
学位级别:硕士
导师姓名:陈思宝
授予年度:2023年
学科分类:081203[工学-计算机应用技术] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:随着信息化的发展,计算机视觉领域中的传统方向——图像检索面临巨大的挑战。大数据时代下,互联网在提供便利的同时,也在时刻产生海量数据。其中,图像数据占据了大量的份额。针对海量图像数据的检索任务,图像哈希技术通过将图像特征压缩到低维空间并利用汉明距离完成度量,能够有效减少存储成本并增强检索效率。针对如何进一步加快图像检索速度并提高检索精度进行分析与研究,提出了两种基于深度哈希的分层图像检索算法,主要贡献如下: (1)基于深度哈希的分层极化网络的图像检索算法研究: 提出了一个分层极化网络(Hierarchical Polarized Network,HPN)用于学习精确的层次化的哈希码。该网络可以生成精确的超类特征和与超类对应的子类特征,检索时通过分层检索的方式加快检索速度。同时用一个可微分的多级极化损失函数来优化网络,以使图像特征输出更偏离零,该损失函数不用成对或三元组的数据,可以使网络模型学习哈希码的过程更简单。为了进一步提高哈希码的辨别能力,提出了分步更新、自适应更新和三元赋值三种策略。大量的实验表明,提出的HPN可以很好地学习到高辨别能力的哈希码,提高图像检索精度的同时也极大加快了检索速度。该算法在CIFAR-100、miniImageNet和DeepFashion三个公开数据集上的检索精度和速度均优于现有的基于哈希和分层的图像检索方法。 (2)基于多级软伪标签的无监督哈希分层图像检索算法研究: 提出了一个基于多级软伪标签的无监督哈希分层图像检索算法(Multi-level Soft Pseudo-label-based Unsupervised Hierarchical Hashing,MSPL-UHH),用于生成图像的多级软伪标签,学习多级哈希码。由于HPN中使用的分层检索技术需要用到数据集的多级语义信息,而通常的数据集仅有单一的标签,如果手工划分多级标签需要耗费大量的人力,因此本文使用无监督的方法来为图像数据生成多级标签。而为了使生成的多级标签更符合图像本身的语义,我们采用软伪标签类型,因为软伪标签可以表示不同的类间距离,同时类内距离可以用局部相似度矩阵描述,比单一的独热标签包含更多的语义信息。通过大量的实验,验证了在没有标签的情况下,基于多级软伪标签的无监督哈希分层图像检索也能取得不错的效果。