咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于小样本血浆质谱数据的抑郁症分类预测及生物标志物发现 收藏
基于小样本血浆质谱数据的抑郁症分类预测及生物标志物发现

基于小样本血浆质谱数据的抑郁症分类预测及生物标志物发现

作     者:涂强强 

作者单位:东华大学 

学位级别:硕士

导师姓名:郭文静;朱立峰

授予年度:2023年

学科分类:1002[医学-临床医学] 08[工学] 081104[工学-模式识别与智能系统] 0811[工学-控制科学与工程] 100205[医学-精神病与精神卫生学] 10[医学] 

主      题:抑郁症 生物标志物 因果样本权重 小样本学习 

摘      要:抑郁症是一种常见的精神障碍,据临床研究统计约27%的人在一生中会出现抑郁症或与抑郁症发作类似的症状,抑郁症的早期诊断对抑郁症的治疗具有重要意义。传统的抑郁症诊断通常由临床医生依据患者的自述症状和量表检查结果进行判断,这种方法依赖于医生的临床经验和医疗知识,具有一定的主观局限性,容易发生误诊或漏诊。因此临床上急需一个客观的诊断方法来提高抑郁症疾病的诊断率。蛋白质组学技术在蛋白质组水平上研究蛋白质表达水平的变化,蛋白质组学技术对生物样品中的蛋白质表达进行分析,可以有效帮助我们提高对疾病病理生理机制的理解,有助于疾病临床诊断工具的开发。已有研究证明抑郁症患者的血浆蛋白质存在差异表达,因此本文基于血浆质谱数据进行抑郁症分类预测及生物标志物发现研究。使用液相色谱/串联质谱采集得到的质谱数据经过鉴定可以得到蛋白质组学数据,此类数据通常具有“大P,小N的特点,即特征数量多,而样本数量少,使用机器学习方式处理此类型数据时,往往效果不佳。因此本文从小样本学习的角度出发,提出了一种小样本血浆蛋白质组学数据的抑郁症分类预测模型。相比于传统机器学习模型,该模型的分类精度显著提升。生物标志物指的是通过客观测量生命状态的特征,发现抑郁症相关的生物标志物可以促使我们可以更好地理解抑郁症的发病机制,并为开发更加便捷有效的抑郁症诊断方法提供基础。因此本文提出了一种基于可解释的方法用于发现抑郁症的血浆蛋白质生物标志物。本文研究内容具体包括以下三个方面:(1)血浆质谱数据预处理及数据分析对受试者的血浆质谱数据进行了蛋白质鉴定,得到每个样本的蛋白质组学数据,包括每个样本的蛋白质定量信息,由于数据存在蛋白质污染、噪声信息和缺失值等问题,因此我们进行了进一步的预处理操作,得到最终的实验数据集,并基于该数据分析了抑郁症患者和健康人血浆蛋白质组学数据的相似性与差异性。(2)构建了基于小样本血浆蛋白质组学数据的抑郁症分类预测模型针对抑郁症蛋白质组学数据普遍具有特征维度高,而样本数量少的问题,本文提出了一种基于小样本血浆蛋白质组学数据的抑郁症分类预测模型。该模型以层次图卷积网络(Hierarchical Graph Convolution Network,HIGCN)和跳跃知识网络(Jumping Knowledge Networks,JKNet)为基础,引入了因果样本权重模块,以最小化特征相关性带来的影响,提高模型泛化能力。在训练模型时引入Drop Edge思想来缓解深度学习模型在小样本数据集上的过拟合问题,提高了模型的预测精度。最后在公开数据集通过实验验证了方法的有效性。(3)提出了一种基于模型可解释分析的抑郁症生物标志物发现方法本研究提出了一种基于模型可解释性的方法,用于发现抑郁症的血浆蛋白质生物标志物。首先,通过统计学分析方法筛选出在抑郁症患者和健康人群之间存在差异表达的蛋白质。然后,使用这些差异蛋白质作为特征训练分类模型。接着,采用模型无关的可解释性方法LIME和SHAP对模型预测结果进行了解释,根据蛋白质特征的对于模型的全局特征重要性排名,确定最终的抑郁症蛋白质生物标志物。研究还对找出的蛋白质生物标志物进行了统计学和生物学角度的分析,以验证其有效性和可靠性。最后,使用找出的蛋白质生物标志物作为特征训练分类模型,验证其分类能力。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分