三七化学指纹图谱及产地溯源研究
作者单位:云南中医药大学
学位级别:硕士
导师姓名:徐福荣;王元忠
授予年度:2023年
学科分类:1008[医学-中药学(可授医学、理学学位)] 1006[医学-中西医结合] 100602[医学-中西医结合临床] 10[医学]
摘 要:目的:三七作为药食同源的中药材品种而深受消费者喜爱,其产业优势也作为云南省发展乡村振兴的重要抓手。目前,随着市场需求的不断增加,其资源短缺问题日益严峻。然而,栽培过程中连作障碍等因素导致播种面积有限。另一方面,三七商品供不应求,常出现以次充好、以假乱真现象。因此,三七品质差异已成为目前值得关注的关键问题。其中,采集地点与三七的有效成分含量和市场价格有关,是三七产地溯源研究的重点。因此,拟采用具有快速、无污染、可揭示不同样品分子结构和化学性质的红外光谱(Infrared spectroscopy,IR)以及二维相关光谱图像结合传统的化学计量学和深度学习分析比较不同方法对三七产地溯源的结果,并结合高效液相色谱(High performance liquid chromatography,HPLC)对三七进行含量预测。以期建立高效、稳健、准确的三七产地溯源方法并证明可行性,为三七的质量评价、合理开发和利用提供科学依据。方法:1.通过查阅文献对目前中草药质量检测中常用的指纹图谱和化学计量学方法进行总结分析;2.采集光谱和高效液相色谱信息,基于质量标志物理论,利用网络药理学(有效性研究)、HPLC(可测试性研究)、衰减全反射傅里叶变换红外光谱(Attenuated total reflectance flourier transform infrared spectroscopy,ATR-FTIR)和近红外光谱(Near-infrared spectroscopy,NIR)(鉴别和预测研究)结合化学计量学方法对云南省4个产地182批三七主根样品进行分析;3.采集云南省5个产地429批三七样品的ATR-FTIR和NIR光谱信息,将预处理后的光谱数据转化为不同类型的二维相关光谱图像。通过与传统光谱结合化学计量学方法(Partial least squares discriminant analysis,PLS-DA、Extreme learning machine,ELM、Random forest,RF)对比,分析二维相关光谱图像结合残差神经网络(Residual convolutional neural network,ResNet)在三七产地鉴别研究中的优势和特点;4.采集4个不同区级和镇级229批三七样品的ATR-FTIR、NIR和HPLC数据。采用HPLC结合主成分分析(Principal component analysis,PCA)模型分析不同区级和镇级三七样品的差异性。构建相关性分析和偏最小二乘回归(Partial least squares regression,PLSR)模型,探讨不同产地三七主要成分含量累积与气候因子的相关性。此外,将原始光谱数据转换为二维相关光谱图像并结合ResNet验证该模型在三七产地鉴别中的可行性和优越性。结果:1.近年来,化学指纹图谱与化学计量学方法相结合已成为中草药质量控制的首选方法。但在建立有效模型时,需注意其性能可能会受到预处理、特征选择、特征提取以及建模方法的影响。对于不同应用范围和目的,质量控制过程应包括适当的分析技术、数据预处理工作流程和化学计量学方法。在基于整个框架标准化和验证的基础上,为进一步扩大中草药质量认证研究提供参考;2.三七皂苷R、人参皂苷Rg、人参皂苷Rb和人参皂苷Rd 4种皂苷类成分可作为三七质量标志物的潜在来源范围,通过24个核心靶点调节通路达到治疗疾病的目的。不同产地三七样品组间成分含量存在较大差异。基于二阶导数(Second derivative,SD)预处理后ATR-FTIR和NIR的低级数据融合策略是三七产地鉴别和含量预测的有效方法;3.二维相关光谱图像结合ResNet模型比传统模式识别模型(PLS-DA、ELM、RF)更适合三七产地鉴别研究。该模型不受样本量差异的影响,不需要复杂的数据处理过程。同步二维相关光谱图像结果明显优于异步和综合二维相关光谱图像;4.较低的年平均气温和年温差有利于三七中4种主要皂苷类成分含量累积。年降水量大、湿度大,适合三七皂苷R、人参皂苷Rg和人参皂苷Rb的含量累积,而人参皂苷Rd则相反。基于同步二维相关光谱图像的ResNet模型性能和鲁棒性高,且无过拟合现象,不受波段和采样点间距的影响,证明了深度学习模型在三七产地鉴别研究中的可行性。结论:化学指纹图谱,如色谱、光谱和质谱等可以提供有关植物次生代谢产物的全面信息。与传统模式识别方法相比,二维相关光谱图像结合ResNet模型在三七产地鉴别研究中具有绝对优势。同步二维相关光谱图像结果明显优于异步和综合二维相关光谱图像,更适用于复杂混合体系中草药的鉴定和分析。该模型不受样本量、波段和采样点间距的影响,不需要复杂的数据处理过程(如特征提取和数据融合等),更专注于简单的数字图像处理问题,比