基于拉曼光谱和机器学习的百合分类识别
Classification and Recognition of Lilies Based on Raman Spectroscopy and Machine Learning作者机构:兰州大学信息科学与工程学院甘肃兰州730000
出 版 物:《光谱学与光谱分析》 (Spectroscopy and Spectral Analysis)
年 卷 期:2023年第43卷第1期
页 面:183-189页
核心收录:
学科分类:081704[工学-应用化学] 07[理学] 08[工学] 0817[工学-化学工程与技术] 070302[理学-分析化学] 0703[理学-化学]
基 金:国家自然科学基金项目(61405083) 甘肃省自然科学基金项目(20JR5RA265) 兰州大学中央高校基本科研业务费专项资金项目(lzujbky-2021-sp68)资助
摘 要:百合鳞茎,百合科百合属多年生草本球根植物生长的肥厚鳞片构成的地下变态茎,是一种典型的药食同源作物,含有丰富营养成分的同时还具有抗肿瘤、抗抑郁、降血糖、提高免疫力等保健作用。不同产地百合鳞茎的市场价格差异较大,依赖于人工经验感官的传统评测方法主观性强、确定性差,难以广泛推广在现代生产环节。以化学检验法为主的先进检测方法耗时长、费用高,而且难以满足产地鉴别这一要求。针对百合鳞茎现场快速地产地判断和品质评价的需求,提出了一种使用拉曼光谱和机器学习的百合鳞茎检测方法。拉曼光谱是一种基于非弹性散射的振动光谱,能够做到快速准确的无损检测,将拉曼光谱与机器学习算法相结合,建立了我国分布最为广泛的三种百合鳞茎(兰州百合、宜兴百合和龙牙百合)的产地分类模型,着眼于基质光谱上479,870,942和1606 cm^(-1)等特征峰,提出了一种基于拉曼光谱的成分含量判断产地和评价百合鳞茎品质的无损检测方法。首先采集百合鳞茎样本的光谱,经过光谱数据预处理后,使用人工先验法提取百合鳞茎代表物质并确定特征峰,再使用主成分分析和t-分布随机邻域嵌入方法降维提取光谱数据特征。并将获得的数据特征分别应用于支持向量机、决策树和随机森林算法。实验结果显示,这些分类模型在同一个测试集上均表现出较为理想的分类准确率,其中基于主成分分析和决策树算法的模型准确率可达91.7%,基于t-分布随机邻域嵌入和支持向量机的模型分类准确率为93.7%,基于主成分分析和随机森林算法的组合模型,准确率高达95.8%。综上,该方法可以实现现场快速识别和鉴定百合鳞茎的产地,提高现代生产过程中质量评估环节的准确性,为现代化生产的产地鉴别和百合鳞茎质量分析提供参考。