咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于多网络集成嵌入的单细胞RNA-seq数据降维方法研究 收藏
基于多网络集成嵌入的单细胞RNA-seq数据降维方法研究

基于多网络集成嵌入的单细胞RNA-seq数据降维方法研究

作     者:肖雪松 

作者单位:厦门大学 

学位级别:硕士

导师姓名:吉国力

授予年度:2020年

学科分类:0711[理学-系统科学] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 07[理学] 

主      题:单细胞测序 降维 网络嵌入 细胞分型 

摘      要:单细胞RNA测序(single-cell RNA sequencing,scRNA-seq)数据以高通量、高分辨率反映单个细胞内的基因表达信息,为细胞异质性的研究提供了有效途径。但目前测序技术的不完善,使高维的单细胞RNA-seq数据中存在随机噪声和数据缺失,为后续的计算分析带来了困难。降维作为处理高维数据的常用方法,是缩减维度、去除噪声的有效手段。然而,由于单细胞RNA-seq数据常具有复杂结构和数据缺失,以往的降维方法并不能适应其数据特点。本文提出了一个基于多网络集成嵌入的单细胞RNA-seq数据降维方法scLINE。scLINE依据数据在原空间和低维空间的概率分布,构建相似度模型并对其进行优化,使降维后的数据最大程度地拟合原数据结构分布。同时,该模型引入并参考相关的基因网络,补充基因间结构和功能关联信息,克服单细胞RNA-seq数据中的缺失问题。本文使用8个不同的单细胞RNA-seq数据集综合评估scLINE的算法效能。结果表明,在可视化效果、聚类指标以及参数稳定性方面,scLINE 比常用的数据降维方法PCA、t-SNE和Isomap相比具有更佳的效果。除此之外,引入外部参考信息的scLINE模型在样本聚类评估中显示出一定的辨识优势。scLINE是一个结合了网络嵌入和外部信息提取的非线性降维方法。该方法以数据网络的拓扑特征为驱动,适用于结构复杂多样的单细胞RNA-seq数据。通过该方法得到的低维数据不仅反映原数据特点,同时利用综合的生物学先验知识填补信息缺失,对于下游单细胞分析如细胞分型有显著的优化作用。此外,本文已经将scLINE开发为R语言工具包并将其上传至开源平台,方便用户实现单细胞RNA-seq数据的降维处理及可视化操作。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分