咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >ICU心梗患者的预后重要特征选取及模型研究——基于MIMIC... 收藏
ICU心梗患者的预后重要特征选取及模型研究——基于MIMIC-Ⅳ数据库

ICU心梗患者的预后重要特征选取及模型研究——基于MIMIC-Ⅳ数据库

作     者:任思玥 

作者单位:西南大学 

学位级别:硕士

导师姓名:王开发

授予年度:2023年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 1002[医学-临床医学] 081104[工学-模式识别与智能系统] 08[工学] 100201[医学-内科学(含:心血管病、血液病、呼吸系病、消化系病、内分泌与代谢病、肾病、风湿病、传染病)] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 10[医学] 

主      题:心梗预后 特征评分 机器学习 模型评价 MIMIC-Ⅳ数据库 

摘      要:心梗即急性心肌梗死,该疾病主要是由于人体内心肌细胞长期缺血、缺氧,或冠状动脉阻塞引发心脏血液供应不足,导致心肌缺血坏死,严重时会诱发心源性休克甚至猝死。心梗的治疗与疾病预后是当今临床医学界面临的一大挑战,截至目前,心梗预后研究的主要方法有两种:1、从医学角度进行生存分析或建立的传统心脏类疾病预后评分模型,通过引入评分模型所需特征变量及对应的数据,计算获得疾病预后评分;2、从统计及计算机科学的角度,建立机器学习预后模型。但上述研究中尚存在:利用患者医疗信息不全面、研究样本较少、对数据缺失没有进行有效处理等不足之处,这些问题无不限制了模型预后性能的提升。因此,在学习了大量已有的相关研究并了解文章的建模机理之后,为解决上述问题,本文将基于麻省理工2022年最新发布的Medical Information Mart for Intensive Care Ⅳ(MIMIC-Ⅳ v2.0)数据库进行心梗类疾病患者的预后分析。首先,编写SQL语言,提取得到心梗患者在院期间产生的用药信息、实验检测项目、治疗时长、血液检测等类别的92个医疗字段及对应的3078个样本数据,并针对原始数据集中存在的问题进行数据预处理,使用描述性统计的分析方法来研究数据集中各个变量的分布特征,利用箱线图对自变量与患者生存结局类别之间的关系进行可视化分析。之后,通过建立Logistic回归、GBDT、随机森林模型进行变量的重要性评分并依次排序,综合3个模型的输出结果,得到了22个重要预后特征。基于筛选出的预后变量,利用Logistic、SVM、K近邻、随机森林及XGBoost等机器学习算法建立心梗预后模型,针对本文研究数据集的建模实际情况,在原始算法的基础之上进行模型组合及模型优化。最后,使用准确度、精确度、F1得分、AUC值等分类模型评估指标进行综合评价,选出性能较优的心梗患者预后模型。最终输出结果表明:在心梗患者的预后方面,XGBoost算法基于筛选出的变量所构建的模型AUC值为0.9306,性能最佳且稳定性强,随机森林次之,而Logistic-SVM组合模型F1得分大于0.8,提升了模型的鲁棒性,相较于单一模型具有更好的预后效果。将本文筛选出的重要特征和最优预后模型与现有的研究结论进行比照,验证了研究方法及思路的合理性与有效性。因此,本次研究实现了对已有心梗预后研究的进一步补充目标,拓展了MIMIC数据库在疾病预后中的应用方向,为临床医生在心梗诊疗中准确评估心梗患者未来的疾病走势,作出精准的预后,制定科学合理的治疗方案提供了重要的数据支持与理论依据。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分