基于SHOX2和RASSF1A甲基化水平的机器学习算法预测早期肺腺癌病理类型
作者机构:南通大学附属医院临床研究中心南通大学医学院 北京大学第三医院胸外科 南通大学附属医院病理科 南通大学附属医院胸心外科
出 版 物:《中国胸心血管外科临床杂志》 (Chinese Journal of Clinical Thoracic and Cardiovascular Surgery)
年 卷 期:2024年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 1002[医学-临床医学] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 100214[医学-肿瘤学] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 10[医学]
摘 要:目的 探讨基于SHOX2和RASSF1A甲基化水平的机器学习算法预测早期肺腺癌病理类型的准确性。方法 回顾性分析2021年1月—2023年1月在南通大学附属医院接受肺部肿瘤切除手术患者的石蜡包埋(formalin-fixed paraffin-embedded,FFPE)标本。使用LungMe试剂盒通过甲基化特异性PCR(MS-PCR)测量FFPE标本的SHOX2和RASSF1A甲基化水平。以SHOX2和RASSF1A的甲基化水平为预测变量,采用机器学习算法(包括逻辑回归、XGBoost、随机森林、朴素贝叶斯)预测不同的肺腺癌病理类型,并构建网络服务器供临床使用。结果 共纳入272例患者,根据肿瘤的病理学分类,将患者分为三组:良性肿瘤/原位腺癌(benign tumor/adenocarcinoma in situ,BT/AIS)组、微浸润性腺癌(micro-invasive adenocarcinoma,MIA)组和浸润性腺癌(invasive adenocarcinoma,IA)组。BT/AIS组、MIA组和IA组患者的平均年龄分别是57.97岁、61.31岁和63.84岁;女性患者占比分别为55.38%、61.11%和61.36%。基于SHOX2和RASSF1A甲基化水平建立的早期肺腺癌预测模型中,随机森林与XGBoost模型在预测各病理类型时表现良好。随机森林模型的C统计量在BT/AIS组、MIA组和IA组分别为0.71、0.72和0.78。XGBoost模型的C统计量在BT/AIS组、MIA组和IA组分别为0.70、0.75和0.77。朴素贝叶斯模型仅在IA组表现较为稳健,C统计量为0.73,具有一定的预测能力。逻辑回归模型在各组中的表现最差,对各组均无预测能力。通过决策曲线分析,随机森林模型在BT/AIS和MIA病理类型的预测中展示了较高的净收益,表明其在临床应用中具有潜在价值。结论 基于SHOX2和RASSF1A甲基化水平的机器学习算法预测早期肺腺癌病理类型具有较高的准确性。