咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >中红外光谱双重校验异常样本检测方法研究 收藏

中红外光谱双重校验异常样本检测方法研究

Research on the Twin Check Abnormal Sample Detection Method of Mid-Infrared Spectroscopy

作     者:张朱珊莹 张若静 顾瀚文 谢勤岚 张献文 撒继铭 刘繄 ZHANGZHU Shan-ying;ZHANG Ruo-jing;GU Han-wen;XIE Qin-lan;ZHANG Xian-wen;SA Ji-ming;LIU Yi

作者机构:中南民族大学生物医学工程学院湖北武汉430074 认知科学国家民委重点实验室湖北武汉430074 医学信息分析及肿瘤诊疗湖北省重点实验室湖北武汉430074 临沂格莱普园林机械有限公司山东临沂276700 武汉理工大学信息工程学院湖北武汉430070 武汉理工大学机电工程学院湖北武汉430070 

出 版 物:《光谱学与光谱分析》 (Spectroscopy and Spectral Analysis)

年 卷 期:2024年第44卷第6期

页      面:1546-1552页

核心收录:

学科分类:07[理学] 070302[理学-分析化学] 0703[理学-化学] 

基  金:国家自然科学基金项目(61501526 61178087)资助 

主  题:红外光谱 异常样本 双重校验 自适应阈值 

摘      要:中红外吸收光谱法目前最有前途的无创血糖检测技术之一。中红外吸收光谱的血糖浓度检测结果准确性与光谱信号的可靠性密切相关。采集中红外光谱信号的过程易受环境或人为等因素的影响而产生包含大量干扰信息的异常光谱。异常样本存在会降低预测模型的有效性和可靠性,故异常样本的检测和剔除至关重要。本研究提出双重校验异常样本检测法能够将异常样本准确筛选出来并剔除。本算法分为两个阶段,首先利用蒙特卡洛交叉验证异常样本检测,初步筛选异常样本,提高光谱样本集的稳定性;其次以马氏距离平方近似服从卡方分布为理论基础,自适应确定最优阈值,对剩余数据集进行异常样本再识别。以64份包含葡萄糖、白蛋白、尿素、乳酸、果糖、胆固醇在内的葡萄糖混合仿体溶液样本为研究对象。双重校验法首先利用预测误差平方和对异常样本敏感的特性对光谱数据集中的异常样本进行初步判定,共检测出3个异常样本,从光谱数据集中剔除检测出的异常样本后建立PLS校正模型,该模型的相关系数为0.91,RMSECV为60.17 mg·dL^(-1)。其次,双重校验法以马氏距离平方近似服从卡方分布为理论基础,实现异常样本自适应识别。共检测出了12个异常样本,剔除全部异常样本后构建的PLS模型性能得到了提升,相关系数达到0.99,RMSECV达到57.77 mg·dL^(-1)。通过与无异常样本剔除、PCA-MD法、蒙特卡洛法相比较双重校验法结果最优,证明了本算法在异常样本检测上的优越性。与未剔除异常样本时的PLS模型相比,相关系数从0.86上升到了0.99,RMSECV从67.51 mg·dL^(-1)降低至57.77 mg·dL^(-1),分别提升了15.12%、14.42%。本研究针对异常样本检测方法中易受阈值影响而出现正常样本误检或异常样本漏检的问题给出了很好的解决策略,该方法能够准确检测并剔除异常样本,进而提高预测模型的精度和预测性能。为中红外光谱数据集异常样本的准确剔除提供了一种思路。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分