基于改进随机森林算法的薏苡仁产地溯源研究
Research on geographical origin traceability of Coix seed based on a modified random forest algorithm作者机构:中南林业科技大学理学院/应用化学研究所湖南长沙410004 湖南工业大学生命科学与化学学院湖南株洲412007 湖南大学化学化工学院/化学生物传感与计量学国家重点实验室湖南长沙410082 中国中医科学院道地药材国家重点实验室培育基地国家中药资源中心北京100700
出 版 物:《轻工学报》 (Journal of Light Industry)
年 卷 期:2023年第38卷第6期
页 面:70-77页
学科分类:0832[工学-食品科学与工程(可授工学、农学学位)] 08[工学] 083201[工学-食品科学]
基 金:湖南省高新技术产业科技创新引领计划项目(科技攻关类)(2020SK2029) 湖南省教育厅科研优秀青年项目(22B0579)
主 题:薏苡仁 随机森林算法 激发-发射矩阵荧光光谱 产地溯源
摘 要:以9个产地的薏苡仁为研究对象,通过将激发-发射矩阵(EEM)荧光光谱与改进的随机森林算法结合以实现薏苡仁产地的溯源分析。其中,随机森林算法的改进主要包括两方面:一是通过主成分分析(PCA)方法降低EEM荧光光谱的维度;二是利用网格筛选法找出PCA降维过程中最优保留主成分数及判别模型超参数。结果表明:基于薏苡仁的EEM荧光光谱数据构建的改进随机森林模型(加入标准差标准化和PCA降维模块)可以对9个产地薏苡仁样本进行准确预测,最佳模型由100棵最大深度为3、叶节点最小样本数为1个的决策树结合16个主成分数(PCs)构建,其对验证集和测试集(共108个样品)的准确度均为100%,优于偏最小二乘法构建的PLS-DA模型(96%)。