染色体易位重组位点的自动识别方法研究
Automatic identification of recombination sites for translocated chromosome作者机构:西安交通大学数学与统计学院数学与生命科学交叉中心西安710049 西安交通大学生命科学与技术学院生物医学信息工程教育部重点实验室西安710049 西安交通大学医学部西安710061 河北燕达陆道培医院河北廊坊065201
出 版 物:《生物信息学》 (Chinese Journal of Bioinformatics)
年 卷 期:2021年第19卷第3期
页 面:159-169页
学科分类:0710[理学-生物学] 07[理学] 09[农学] 071007[理学-遗传学] 0901[农学-作物学] 090102[农学-作物遗传育种]
基 金:国家自然科学基金项目(No.11971375,11631012) 陕西省自然科学基础研究计划(No.2019JM-478)
主 题:染色体分类 异常染色体 重组位点 自动识别 深度学习
摘 要:染色体易位重组位点的识别对很多染色体遗传性疾病的诊断有着重要的意义。本文基于实际诊断中采集到的24类染色体数据和9号正常与异常染色体数据,构建了一套自动识别染色体易位重组位点的模型和方法。首先,对染色体图像进行预处理,得到了方向梯度直方图特征(HOG)和局部二值模式特征(LBP),构建了基于纹理特征的染色体24分类多通道网络模型,分类准确率达到了95.99%;再与ResNet18模型(分类准确率95.86%)进行模型融合,最终分类准确率达到97.08%。其次,将染色体密度谱作为正常和异常染色体的分类特征,采用投票的方法集成支持向量机、随机森林和XGBoost模型,构建了正常和异常染色体的集成分类器,正常和异常9号染色体的分类准确率达到了100%。最后,对于易位的异常染色体,我们提出了基于动态时间规划(DTW)的易位重组位点自动识别算法,在异常染色体的密度谱曲线上找到了重组位点,并映射至染色体G显带模式图,得到标准诊断结果,通过与临床专家的诊断结果进行比较说明了自动识别结果的有效性。本文设计的一套自动识别染色体易位重组位点的模型方法对临床辅助诊断有很大的帮助,有望完善成为一套软件系统应用于临床诊断,提升相关疾病的诊断效率和准确率。