咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >保留非全长读段的ISO-seq数据转录组表达分析 收藏

保留非全长读段的ISO-seq数据转录组表达分析

Transcriptome Expression Analysis of ISO-seq Data with Non-Full-Length Reads Reserved

作     者:刘学军 瞿锡垚 张礼 Liu Xuejun;Qu Xiyao;Zhang Li

作者机构:南京航空航天大学计算机科学与技术学院南京211106 南京林业大学信息科学技术学院南京210037 

出 版 物:《数据采集与处理》 (Journal of Data Acquisition and Processing)

年 卷 期:2019年第34卷第4期

页      面:594-604页

学科分类:0810[工学-信息与通信工程] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(61802193)资助项目 江苏省自然科学基金(BK20170934)资助项目 

主  题:PacBio ISO-seq 转录组表达 第三代测序技术 新型异构体检测 多源映射 

摘      要:近年来,基于单分子测序技术的ISO-seq数据以其超长读段长度被越来越多地应用于转录组新型异构体预测研究,但目前大多数研究工作只用到全长读段数据,丢失了非全长读段数据中较多有用信息,因而数据没有得到充分利用。针对这一问题,本文在保留非全长读段的基础上提出了两个能同时预测异构体结构和计算其表达比例的模型基于狄利克雷采样的异构体探测与预测(Dirichletsampling for isoform detection and prediction,DSIDP)和基于马尔科夫链的异构体探测与预测(Markovchain for isoform detection and predition,MCIDP)。两个模型均从全长读段中建立异构体预测集,并采用全长读段和非全长读段计算异构体表达比例。DSIDP将所有读段比对至异构体预测集,并使用Dirichlet采样解决多源映射问题,MCIDP使用马尔科夫链模拟基因外显子之间的选择性剪切,该模型还能预测出数据中没有全长读段的异构体。本文采用模拟数据和真实数据验证了两个模型的有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分