HLA单体型和HLA位点基因型预测模型的建立与验证
Establishment and validation of prediction models for human leukocyte antigen haplotypes and human leukocyte antigen genotypes作者机构:苏州大学附属第一医院江苏省血液研究所HLA配型实验室,苏州215031 中国造血干细胞捐献者资料库管理中心,北京100010
出 版 物:《中华医学杂志》 (National Medical Journal of China)
年 卷 期:2024年第104卷第11期
页 面:834-842页
核心收录:
学科分类:0710[理学-生物学] 07[理学] 071007[理学-遗传学]
基 金:国家自然科学基金(82070180) 江苏高校血液学协同创新中心项目(SX21100121)
主 题:人类白细胞抗原 多态性保守区段 单体型 连锁不平衡 预测模型 转化应用
摘 要:目的建立人类白细胞抗原(HLA)单体型和HLA位点基因型预测模型,并验证预测模型的正确性。方法根据HLA单体型遗传及连锁不平衡规律,在获得发明专利和软件著作权的基础上,建立预测模型算法,主要包括:待预测数据预处理、与参考数据比对、预测结果过滤、概率计算和排序、置信度判断及预测结果输出。建立参考数据库包括HLA A-C-B-DRB1-DQB1高分辨单体型数据库、B-C和DRB1-DQB1连锁不平衡数据库,以及G组、NMDP Code等位基因对照表。选取已知A-C-B-DRB1-DQB1单体型和A、B、DRB1、C、DQB1高分辨基因型的数据进行预测,与已知结果比对,验证预测的正确性,分析正确性与预测结果概率分布、置信度的关系。结果建立了HLA单体型和HLA位点基因型预测模型,根据本研究技术路线建立完整的预测模型算法,包括根据HLA-A、B、DRB1、C、DQB1基因型预测A-C-B-DRB1-DQB1单体型;根据HLA-A、B、DRB1高分辨结果预测C、DQB1高分辨结果;根据HLA-A、B、DRB1中、低分辨结果预测A、B、DRB1和C,DQB1高分辨结果。“根据HLA-A、B、DRB1、C、DQB1基因型预测A-C-B-DRB1-DQB1单体型模型验证结果:在787份验证数据中,740份预测正确,34份预测错误,13份未给出预测结果,预测正确率为94.0%(740/787);847份数据的预测正确率为100%(847/847)。将787、847份数据预测产出的2411、2594组单体型组合按置信度分组,置信度为1时正确率均为100%(48/48、114/114),置信度为2时正确率分别为96.2%(303/315)、97.8%(409/418)。根据HLA-A、B、DRB1高、中、低分辨结果预测A、B、DRB1和C、DQB1高分辨结果模型验证结果,使用以上共计1634份数据的A、B、DRB1高分辨结果预测C、DQB1高分辨结果,经与已知分型结果比对,预测结果中包含正确结果的比例为89.3%(1459/1634),其中,正确结果落在预测概率(GPP)排序前2位的比例为79.2%(1156/1459),落在前10位的比例达到95.0%(1386/1459)。根据预测组合GPP值进一步分析,GPP≥90%、GPP为50%~90%时,预测正确率分别为81.3%(209/257)、72.8%(447/614)。使用中华骨髓库数据再次验证,根据A、B、DRB1高分辨结果预测C、DQB1高分辨结果的正确率为87.0%(20/23);根据A、B、DRB1中分辨结果预测A、B、DRB1、C、DQB1高分辨的正确率为70.0%(7/10);根据A、B、DRB1低分辨结果预测A、B、DRB1、C、DQB1高分辨的正确率为52.5%(21/40)。预测供患者是否可能HLA 10/10相合时,GPP排序前2位且≥50%的组合预测正确率为85.7%(6/7)。结论HLA-A、B、DRB1、C、DQB1基因型到单体型的预测,可参考置信度为1、2的结果;根据A、B、DRB1基因型预测C、DQB1基因型时,可参考GPP排序前10位的结果,优先参考GPP排序前2位且≥50%的结果。