基于卷积神经网络的日漫饮食文化元素特征分析
作者单位:长春大学
学位级别:硕士
导师姓名:王玉英;李念峰
授予年度:2022年
学科分类:12[管理学] 1303[艺术学-戏剧与影视学] 13[艺术学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:DenseNet网络 图像分类 自动识别 日漫饮食文化元素
摘 要:随着学科交叉融合理念的提出,利用先进的科学技术解决文化研究中存在的问题的相关方法逐渐开始出现。动漫作为当代青年最喜爱的休闲娱乐方式之一,其具备良好的传播媒介属性,利用动漫进行文化的传播隐蔽性强而且具有很强的渗透力。作为饮食大国的中国,如何避免外来文化的入侵以及进行本土文化的传承与传播,已经成为当下的热门研究课题之一。传统的研究方法主要依赖于文化学者相关的研究,在研究过程中研究者需要观看大量的动漫视频、进行动漫图像的收集与分类,最后进行文化的分析,这样的方式不仅需要耗费研究者大量的时间成本与人工成本,而且收集与分类的图像具备主观性与不可控性,最终使得处理与分析的效率降低。卷积神经网络是机器学习领域研究的一个热门话题,在图像处理、图像分类等方面都具有着广泛的应用前景和重要的经济发展价值。因此,将卷积神经网络模型应用于动漫中饮食图像分类的工作会为相关学者提供便利。目前,卷积神经网络的现实食物图像识别与分类的工作一直在稳步进行,且取得较好的成果,但由于动漫中呈现的食物图像依赖于漫画作者的主观创造性、具备非客观性、抽象程度大等特点,将传统卷积神经网络模型应用于动漫食物图像上的分类工作效果并不是很好。为此,本文研究基于DenseNet网络模型,提出相对应的高效分类算法,论文主要创新工作如下:1.鉴于目前并没有专门用于图像分类的日漫饮食数据集。本文构建了一个包含常见11类的日漫饮食图像数据集JA food-1100;为了提高模型的鲁棒性,本文提出了一个包含非饮食类食物的常见12类的日漫图像数据集JA photo-1200。2.为了提高模型对日漫饮食图像数据集分类的准确率,在详细比较了几种经典的卷积神经网络模型后,本文提出了一种基于DenseNet网络的ADenseNet5网络模型。算法的思想是:(1)在DenseNet网络的密集层中引入卷积核大小为5×5的卷积操作,扩大算法的感受野,增强网络模型的深度;(2)在DenseNet网络的密集层后引入卷积注意力机制模块,优化图像的特征表示,选择和关注比较重要的图像特征,进一步提取图像中更深层次的信息。实验结果表明,ADenseNet5网络模型相较于其他经典卷积神经网络模型在本文提出的两种数据集中都提高了分类准确率,并且在本文提出的测试数据集中也取得了比较好的效果。