基于深度学习的样本不平衡问题研究-南通市图书馆

文献详情 >基于深度学习的样本不平衡问题研究收藏

基于深度学习的样本不平衡问题研究

作者：郑宇

作者单位：重庆理工大学

学位级别：硕士

导师姓名：徐传运

授予年度：2022年

学科分类：12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 0811[工学-控制科学与工程]

主题：深度学习数据不平衡长尾分布图像分类目标检测

摘要：数据是深度学习不可或缺的因素之一,在各种视觉任务场景中都依赖着相应的数据集。训练分类器的基本假设是:基于所研究数据集不同类别中的样本数量大致平衡。现代深度学习方法在均匀分布上表现良好,然而在长尾的自然世界中样本数量是不平衡的,这种不平衡给基于深度学习的模型训练和实际应用带来了巨大的挑战。对于近年来备受关注的样本不平问题,本文定义了几种常见的不平衡形式,采用相关开源数据集对其进行重构作为研究对象。在计算机视觉中的样本不平衡问题上,利用重加权的思想对深度学习在图像分类和目标检测上展开研究。本文主要研究工作包括:（1）首先在图像分类中研究了现有工业上常用的对于不平衡数据集的处理方法。对现有的重采样,重加权方法进行了详细的比较分析。使用Res Net18模型在CIFAR-10,CIFAR-100,Image Net-Tiny这三个基准数据集上展开相关实验。通过实验发现重加权方法在处理样本不平衡问题上优于更具稳定性。（2）由于重加权方法在样本不平衡问题上的优秀表现,本文针对重加权方法展开了研究。考虑类别数量,样本数量,类别不平衡度这三个因素对重加权结果的影响。在以往的研究中,权重的设置只与类别样本的数量有关,在敏感的加权方法中,仅依靠类样本个数的信息来确定权重的大小是非常粗略地。通过三个数据集自身的属性来改进现有的有效样本计算方法,从而对现有的有效样本损失的优化。实现了自适应的有效样本加权方法。在构造的长尾CIFAR数据集中证明了我们方法的有效性。（3）同时对于在目标检测中的难易样本不平衡问题,本文提出了一种基于Cascade R-CNN的级联优化的策略。逐步优化训练过程中建议区域的质量同时平衡正负样本,并且通过回归损失来对难易样本在边框回归中产生的梯度进行平衡,从而达到平衡检测器训练过程中的难易样本。在SKU-110K和MS-COCO2017数据集上对本文的方法进行了验证,通过实验证明方法有效地提高了检测器的检测精度。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于深度学习的样本不平衡问题研究

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于深度学习的样本不平衡问题研究

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：