XGBoost算法在轻度认知障碍人群阿尔兹海默病发病预测中的应用
Application of XGBoost algorithm in predicting Alzheimer′s disease in patients with mild cognitive impairment作者机构:潍坊医学院公共卫生学院卫生统计学系山东潍坊261053
出 版 物:《郑州大学学报(医学版)》 (Journal of Zhengzhou University(Medical Sciences))
年 卷 期:2022年第57卷第6期
页 面:751-756页
学科分类:1004[医学-公共卫生与预防医学(可授医学、理学学位)] 100401[医学-流行病与卫生统计学] 10[医学]
基 金:国家自然科学基金项目(81803337,81872719) 国家统计局课题(2018LY79) 山东省自然科学基金项目(ZR2019MH034) 山东省高等学校青创人才引育计划(2019-6-156,Lu-Jiao) 潍坊医学院博士启动基金项目(2017BSQD51)
主 题:阿尔茨海默病 轻度认知障碍 XGBoost算法 机器学习
摘 要:目的:探索极限梯度增强(XGBoost)算法模型在轻度认知障碍(MCI)向阿尔茨海默病(AD)转化中的预测性能。方法:从AD神经影像学计划数据库中选取370例MCI患者,收集随访数据。通过无放回随机抽样将样本分为包含70%样本量的训练集和包含30%样本量的测试集。以第1次随访后10 a内是否患AD为因变量,采用XGBoost算法筛选特征变量,构建AD预测模型,同时构建Logistic回归、BP神经网络和支持向量机模型,评价模型预测AD的效能。结果:经XGBoost特征选择,临床痴呆评分总和量表(CDR-SB)得分、社会活动功能量表(FAQ)得分、简易精神状态检查量表得分、听觉语言学习测试得分、BMI、舒张压、缬氨酸、白蛋白、年龄、葡萄糖、教育水平得分、糖蛋白-N-乙酰(GlycA)被纳入预测模型。基于最佳超参数组合建立的XGBoost模型的预测性能优于其他模型,其准确率、敏感度、特异度、Kappa值和AUC(95%CI)分别为0.935、0.962、0.862、0.833和0.921(0.858~0.985)。所构建的XGBoost模型中,CDR-SB得分和FAQ得分重要性最大,占74.91%。结论:基于XGBoost算法构建的预测模型可用于AD患病风险的预测;在MCI人群中,CDR-SB得分和FAQ得分为重点关注指标。