蒙特卡洛交叉验证用于偏最小二乘建模数据质量的评价(英文)
Evaluation of calibration data for partial least squares modeling by using Monte Carlo cross validation作者机构:云南中烟工业有限责任公司技术中心云南昆明650231 南开大学化学学院分析科学研究中心天津300071 喀什大学化学与环境科学学院新疆维吾尔自治区喀什844000
出 版 物:《计算机与应用化学》 (Computers and Applied Chemistry)
年 卷 期:2015年第32卷第12期
页 面:1530-1536页
学科分类:081704[工学-应用化学] 07[理学] 070304[理学-物理化学(含∶化学物理)] 08[工学] 0817[工学-化学工程与技术] 0703[理学-化学]
基 金:supported by National Natural Science Foundation of China(No.21475068) the major project of China National Tobacco Corporation(Ts-03-20110020)
主 题:近红外光谱 偏最小二乘回归 蒙特卡洛交叉验证 奇异样本 噪声
摘 要:基于蒙特卡洛交叉验证(MCCV)建立了一种用于近红外光谱偏最小二乘建模数据质量的评价方法。该方法首先通过蒙特卡洛交叉验证计算交叉验证均方根误差(RMSECV),同时计算交叉验证中建模样本的预测误差,记为建模样本的均方根误差(RMSECVc)。如果数据中部存在奇异样本、噪声、非线性相应等干扰因素,RMSECV和RMSECVc随因子数的变化应该保持一致,否则,二者的变化趋势将不同。因此,利用RMSECV和RMSECVc随因子数的变化趋势即可对数据的质量进行评价。采用模拟数据和12组实际样品的数据对该方法进行了考察,并对四组实际数据中的奇异样本进行分析,说明了方法的效果。本文为偏最小二乘建模方法提供了一种数据质量的评价方法。