面向图像分类的特征编码方法研究-南通市图书馆

文献详情 >面向图像分类的特征编码方法研究收藏

面向图像分类的特征编码方法研究

作者：张智猗

作者单位：南京邮电大学

学位级别：硕士

导师姓名：龙显忠

授予年度：2023年

学科分类：08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]

主题：图像分类特征编码深度学习对比自监督学习

摘要：现如今各行各业的信息化程度不断加深,信息资源呈现出井喷式增长态势,如何有效处理海量数据资源已成为一个各界关注的焦点。图像分类作为计算机视觉领域中一个基础的研究方向,在处理图像资源时起着至关重要的作用。在图像分类框架中,特征编码扮演着承前启后的角色,对分类的精度和时间都有着重要的影响。本文主要研究面向图像分类的特征编码技术,具体研究工作如下:(1)考虑到面对人脸识别问题时,稀疏表示算法耗时严重,而协同表示算法在面对噪声、遮挡等干扰时的鲁棒性较差,本文提出一种面向人脸识别的奇异向量编码方法。该方法将未知样本视为所有已知样本的线性组合,通过对每个类别的已知样本进行奇异值分解得到奇异向量,借助奇异向量进行特征编码得到图像表示。在三个常见的人脸数据集上的实验结果表明,新方法有较高的识别精度和良好的鲁棒性,并且计算耗时远少于稀疏表示算法。(2)针对硬编码策略在编码过程中可能造成的量化误差,以及软编码策略难以为特征描述符选择最佳数量的视觉单词问题,本文提出一种面向场景图像分类的改进局部聚合描述符向量(Vector of Locally Aggregated Descriptors,VLAD)编码方法。新方法对传统的软编码策略进行了拓展,通过计算每个描述符的近邻视觉单词的距离方差来确定视觉单词数量,并利用显著性思想为这些视觉单词分配权重。本文在三个基准数据集上进行了相关实验,证明了与原有的VLAD方法对比,改进后的VLAD有更好的分类性能,并且在计算时间上没有明显变化。(3)针对当前对比自监督学习方法中训练任务复杂度较低、负样本不充分的问题,本文提出一种面向大规模图像分类的多网络对比学习方法。该方法尝试使用三条网络进行两两对比学习来增加任务的复杂度,通过整合同批样本集合与动量编码器维护的样本库以提供尽可能多的负样本。本文在三个常见的深度学习数据集上的进行了相关实验,证明所提出的两点改进措施都有助于模型的性能提升,新方法的分类性能优于现有的基线方法。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

面向图像分类的特征编码方法研究

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

面向图像分类的特征编码方法研究

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：