加权共表达网络分析与机器学习识别类风湿关节炎滑膜中的关键基因
Weighted gene co-expression network analysis and machine learning identification of key genes in rheumatoid arthritis synovium作者机构:苏州大学附属第二医院江苏省苏州市215000 宁阳县第一人民医院山东省泰安市271000
出 版 物:《中国组织工程研究》 (Chinese Journal of Tissue Engineering Research)
年 卷 期:2025年第29卷第2期
页 面:294-301页
学科分类:0831[工学-生物医学工程(可授工学、理学、医学学位)] 1002[医学-临床医学] 100210[医学-外科学(含:普外、骨外、泌尿外、胸心外、神外、整形、烧伤、野战外)] 08[工学] 1010[医学-医学技术(可授医学、理学学位)] 100215[医学-康复医学与理疗学] 0836[工学-生物工程] 10[医学]
主 题:加权基因共表达网络 机器学习算法 类风湿关节炎 关键基因 预测模型
摘 要:背景:类风湿关节炎是一种全身的免疫相关性疾病,主要病理特点是关节滑膜炎性增生及关节软骨的破坏,其发病机制目前尚不明确,迫切需要发现新的具有高度敏感性和特异性的诊断标志物。目的:联合使用生物信息学技术及计算机学习算法,识别并筛选类风湿关节炎患者滑膜中的关键基因,构建类风湿关节炎预测模型并进行验证。方法:从基因表达综合数据库中下载3个包含类风湿关节炎患者滑膜的数据集(GSE77298、GSE55235、GSE55457),GSE77298和GSE55235作为训练集,GSE55457作为测试集,共纳入66个样本,其中类风湿关节炎患者滑膜样本39个,正常滑膜样本27个。应用R语言筛选训练集中的差异基因,然后使用加权共表达网络将训练集中的基因模块化,选出关键模块中的特征基因,将差异表达基因和特征基因取交集,交集基因进入下一步机器学习。采用3种机器学习方法:最小绝对值收敛和选择算子算法、支持向量机-递归特征消除和随机森林算法对交集基因进一步分析获得枢纽基因,将枢纽基因再次相交即得到类风湿关节炎滑膜中的关键基因。以关键基因为变量构建预测类风湿关节炎的列线图模型,推测患者发生类风湿关节炎的危险程度,使用受试者工作特征曲线确定类风湿关节炎预测模型及其关键基因的诊断价值。结果与结论:①通过差异分析,训练集中共筛选出差异基因730个,加权共表达网络分析得到特征基因185个,两者交集基因159个;②最小绝对值收敛和选择算子发现枢纽基因4个,支持向量机-递归特征消除发现枢纽基因11个,随机森林发现枢纽基因5个,取交集后获得关键基因2个(TNS3、SDC1);③基于2个关键基因,在训练集及测试集种构建列线图,其校准预测曲线与标准曲线贴合较好,且预测类风湿关节炎发生的临床效能良好;④上述结果证实,基于生物信息及机器学习算法获得的TNS3和SDC1有可能成为类风湿关节炎诊断和治疗的关键靶点。