基于深度学习的口罩佩戴检测算法研究
作者单位:西安工业大学
学位级别:硕士
导师姓名:陈忠孝
授予年度:2024年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:口罩佩戴检测 深度学习 注意力机制 轻量化 YOLOv4
摘 要:随着生活水平的提高,人们也越来越关注食品卫生问题,国家有关部门发布公告称从事一些食品加工制作的人员需要佩戴清洁的口罩。此外,医院、海关、无尘实验室等场所也要求工作人员必须佩戴口罩,但人们往往会因为侥幸心理和环境因素不能自我约束,引发安全问题。因此,本文利用深度学习技术对一些场景下工作人员口罩佩戴情况进行检测,以此来达到监督和警示的目的。本文的主要工作如下: 1)对人脸口罩佩戴情况进行分析,定义了口罩佩戴的三种类别,阐述了影响检测结果的内外因素。对主流目标检测算法进行总结,说明了本文所选取的基准模型。通过线上搜集和线下拍摄的方式来收集图片,最后利用数据增强技术构建了一个4500张图片的口罩数据集。 2)对于YOLOv4参数多、计算量大、对小目标检测能力不强等问题,本文对其进行优化改进。首先采用Efficient Net-B0作为YOLOv4的主干网络来实现模型结构轻量化;然后在原颈部结构的基础上引入权重机制并使用跨尺度连接的方式来平衡各尺度的特征信息;将EVC(Explicit Visual Center)模块置于主干网络的末端,使模型具有提取全局信息的能力;接着使用全维动态卷积(Omni-Dimensional Dynamic Convolution,ODConv)重新设计了三层卷积块和五层卷积块,并将其称为Convblock_3和Convblock_5;每次采样之后嵌入注意力机制来增强各尺度特征的融合能力,使模型更加关注戴口罩的人脸区域。最后在本文的数据集上设计了对比实验和消融实验来验证模型改进的有效性。 3)对Tiny-YOLOv4特征提取能力不足而产生的漏检误检问题进行优化改进。首先采用简化后的Efficient Net-B0替换其主干网络来保持结构轻量化;然后使用路径聚合网络(Path Aggregation Network,PAN)重新设计颈部结构,增强不同尺度特征融合;接着在模型中融入轻量级注意力机制捕获方向感知和位置敏感信息,使模型更准确的定位和识别戴口罩人脸的区域;最后使用迁移学习来提高模型的检测性能。在本文数据集上进行实验,结果显示改进的算法有效改善了误检漏检的情况。与同类别的轻量级算法进行对比并在公共口罩数据集和PASCAL VOC数据集上进行检验均取得了不错的检测结果,验证了模型改进的有效性和泛化性。