咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >特征波长选择对近红外光谱建模的影响分析及应用 收藏
特征波长选择对近红外光谱建模的影响分析及应用

特征波长选择对近红外光谱建模的影响分析及应用

作     者:梁小娟 

作者单位:陕西科技大学 

学位级别:硕士

导师姓名:郭拓

授予年度:2023年

学科分类:0831[工学-生物医学工程(可授工学、理学、医学学位)] 07[理学] 08[工学] 070302[理学-分析化学] 0703[理学-化学] 

主      题:近红外光谱 中药 波长选择 稀疏主成分分析 可扩展的自表示学习 

摘      要:近红外分析技术是一种快速、无损、高效、可靠的分析方法,已被广泛应用于食品、药品、化工和农业等领域,尤其在中药领域有着重要的应用价值。近红外光谱分析技术能够实现中药材产地、等级的判别以及药物成分的含量检测。但近红外光谱数据是典型的高维小样本数据,数据的特征维数远大于数据样本数,光谱数据中会不可避免地含有冗余信息和干扰变量,导致所建模型复杂度增大,计算量提高,预测效果降低。因此,筛选出有效的波长变量在近红外光谱分析中至关重要。本文针对近红外光谱数据中存在的冗余信息和干扰变量问题,探究了不同特征波长选择算法对近红外光谱建模的影响,主要内容如下:(1)设计数据采集实验,搭建数据采集平台,利用SupNIR-2700近红外光谱仪对山楂叶和何首乌光谱数据进行采集。(2)针对近红外光谱产地判别模型数据样本量小、维度高、类别不平衡特性,研究了 一种基于稀疏主成分分析特征选择(Sparse Principal Compo-nent Analysis for Feature Selection,SPCAFS)与支持向量机(Support Vector Machine,SVM)建模的定性分析方法(SPCAFS-SVM)。该方法对数据进行稀疏表示,利用特征向量的稀疏性来剔除数据中的冗余信息,并采用SVM建立山楂叶近红外产地判别模型,实现了山楂叶南北产地判别。与传统的主成分分析方法不同,SPCAFS通过L1正则化来增强特征向量的稀疏性,并引入约束条件,增强特征向量之间的独立性,从而提升样本之间的区分度。模型以准确率、精确度和灵敏度作为评价标准,并与连续投影(Successive Projections Algorithm,SPA),正则化自表示(Regularized self-representation,RSR)和稀疏子空间聚类(Sparse Subspace Clustering,SSC)3种特征选择算法进行对比,在山楂叶南北产地的判别实验中验证了 SPCAFS的有效性。(3)针对近红外光谱含量检测模型数据样本量小、维度高和局部线性整体非线性特性,研究了一种基于可扩展的自表示学习波段选择算法(Scalable One-Pass Self-Representation Learning,SOP-SRL)与决策树偏最小二乘法(Decision Tree-Partial Least Squares,DT-PLS)建模的定量分析方法(SOP-SRL-DT-PLS)。该方法为每个样本的损失函数分配适当的权重,以强调样本中的差异,同时增加了一个基于图的正则化项,通过测量由所选波段构建的样本之间的局部相似性来提高波段的代表性。为了解决何首乌数据局部线性,整体非线性的问题,使用了 DT-PLS建模算法。选用何首乌二苯乙烯苷和蒽醌类含量为研究对象,通过综合对比分析,选择出合适的预处理方法、样本选择方法和特征选择方法,并分别针对二苯乙烯苷和蒽醌类含量,建立了两种何首乌含量检测模型。结果表明,SOP-SRL-DT-PLS在所用方法中表现最佳。(4)为了检验SPCAFS和SOP-SRL在中药检测中的实际应用能力,分别设计了基于SPCAFS和SOP-SRL的PLS定量分析模型。以安胎丸指标含量阿魏酸、黄芩苷和汉黄芩苷为研究对象,分别通过SPCAFS和SOP-SRL选取代表性特征波段,之后采用PLS建立近红外光谱回归模型,并与CCBS、RSR和SSC3种特征波长选择算法的建模结果进行对比。结果表明,SPCAFS和SOP-SRL可有效提取安胎丸指标含量阿魏酸、黄芩苷和汉黄芩苷的特征波段,并实现阿魏酸、黄芩苷和汉黄芩苷含量的准确检测。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分