咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向图像分类的特征编码方法研究 收藏
面向图像分类的特征编码方法研究

面向图像分类的特征编码方法研究

作     者:张智猗 

作者单位:南京邮电大学 

学位级别:硕士

导师姓名:龙显忠

授予年度:2023年

学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 

主      题:图像分类 特征编码 深度学习 对比自监督学习 

摘      要:现如今各行各业的信息化程度不断加深,信息资源呈现出井喷式增长态势,如何有效处理海量数据资源已成为一个各界关注的焦点。图像分类作为计算机视觉领域中一个基础的研究方向,在处理图像资源时起着至关重要的作用。在图像分类框架中,特征编码扮演着承前启后的角色,对分类的精度和时间都有着重要的影响。本文主要研究面向图像分类的特征编码技术,具体研究工作如下:(1)考虑到面对人脸识别问题时,稀疏表示算法耗时严重,而协同表示算法在面对噪声、遮挡等干扰时的鲁棒性较差,本文提出一种面向人脸识别的奇异向量编码方法。该方法将未知样本视为所有已知样本的线性组合,通过对每个类别的已知样本进行奇异值分解得到奇异向量,借助奇异向量进行特征编码得到图像表示。在三个常见的人脸数据集上的实验结果表明,新方法有较高的识别精度和良好的鲁棒性,并且计算耗时远少于稀疏表示算法。(2)针对硬编码策略在编码过程中可能造成的量化误差,以及软编码策略难以为特征描述符选择最佳数量的视觉单词问题,本文提出一种面向场景图像分类的改进局部聚合描述符向量(Vector of Locally Aggregated Descriptors,VLAD)编码方法。新方法对传统的软编码策略进行了拓展,通过计算每个描述符的近邻视觉单词的距离方差来确定视觉单词数量,并利用显著性思想为这些视觉单词分配权重。本文在三个基准数据集上进行了相关实验,证明了与原有的VLAD方法对比,改进后的VLAD有更好的分类性能,并且在计算时间上没有明显变化。(3)针对当前对比自监督学习方法中训练任务复杂度较低、负样本不充分的问题,本文提出一种面向大规模图像分类的多网络对比学习方法。该方法尝试使用三条网络进行两两对比学习来增加任务的复杂度,通过整合同批样本集合与动量编码器维护的样本库以提供尽可能多的负样本。本文在三个常见的深度学习数据集上的进行了相关实验,证明所提出的两点改进措施都有助于模型的性能提升,新方法的分类性能优于现有的基线方法。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分