咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度卷积神经网络的图像分类和语义自动标注研究 收藏
基于深度卷积神经网络的图像分类和语义自动标注研究

基于深度卷积神经网络的图像分类和语义自动标注研究

作     者:夏元天 

作者单位:云南师范大学 

学位级别:硕士

导师姓名:徐天伟

授予年度:2020年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:图像识别 卷积神经网络 GPU并行计算 图像语义自动标注 

摘      要:随着互联网技术以及移动终端设备的不断发展,图像资源成几何倍数与日俱增,庞大的图像资源对当前的图像识别分类等计算机视觉技术提出了迫切的要求。很长一段时间,图像识别主要通过基于文本的方式进行,但是由于图像所包含信息的复杂性及“语义鸿沟的存在,仅仅依靠基于文本的方式还无法达到高识别准确率的要求,面对这些难题,图像自动分类和图像语义自动标注技术应运而生,而如何能够有效地提高图像识别效率及准确率成为了该技术的关键。为此,本文主要做了如下工作:(1)本文采用深度卷积神经网络技术以及GPU并行计算技术,实现对目标图像的分类识别。通过在不同规模大小的数据集上进行实验,详细分析对比了当前较为经典的深度卷积神经网络模型的识别效率及识别准确率。(2)本文通过对比分析当前网络模型后,针对其存在的学习效率低、识别准确率差等问题,提出了一种改进的深度卷积神经网络模型。通过在ImageNet、Cifar-10和Mnist数据集上进行实验证明,相比传统的CNN网络模型,本文所提出的改进网络模型能够以更小的网络深度和更高的执行效率大幅提高分类的准确率。(3)本文在基于改进的深度卷积神经网络模型的基础上,继续对改进的模型进行进一步的优化和调整,使其能够适应多标签分类问题,对目标图像实现快速精准的多分类识别。通过在Corel5k和PASCAL VOC 2012数据集上的实验表明,基于改进网络模型在多标签分类中具有较高的准确率,可以有效实现对目标图像的自动语义标注。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分