改进注意力模型的食品图像识别方法
Method for Recognition of Food Images Based on Improved Attention Model作者机构:南京理工大学泰州科技学院江苏泰州225300
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2024年第60卷第12期
页 面:153-159页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:江苏省高等学校自然科学研究面上项目(19KJB520038) 江苏省“333人才”项目
主 题:食品图像 细粒度图像识别 局部注意力 自监督预训练 ISIA Food-500数据集
摘 要:随着人们对健康饮食需求的日益增加,各种饮食评估辅助软件应运而生,食品图像识别问题受到越来越多的关注。食品图像识别属于细粒度图像识别问题,较其他图像识别难度更大。目前主流的食品图像数据集,如ISIA Food-500、ETH Food-101、Vireo Food-172等所包含的图像数量偏少,难以很好地训练图像识别系统,进一步增大了图像识别难度。提出一种基于注意力机制的图像识别方法,该方法在自注意力的基础上引入局部注意力的概念,用于描绘图像细粒度特征,提高图像识别的准确率。此外,还提出一种图像自监督预训练算法,缓解食品图像训练样本不足的问题。实验结果表明,所提方法在ISIA Food-500数据集的Top-1和Top-5准确率分别达到65.58%和90.03%,性能优于现有的其他算法。