基于RNA-Seq数据集的转录组从头拼接算法
De Novo Transcriptome Assembly Algorithm Based on RNA-Seq Datasets作者机构:天津师范大学计算机与信息工程学院天津300387
出 版 物:《计算机科学》 (Computer Science)
年 卷 期:2018年第45卷第12期
页 面:308-312页
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(61572358) 天津自然科学基金(16JCYBJC23600)资助
摘 要:转录组拼接是基因组测序与功能注解问题的一个重要组成部分。为了提高转录组拼接的精度和效率,文中提出了一种新的转录组从头拼接算法StepLink。该算法的主要创新点是提出了最左k-mer(长度为k的短序)和右k-mer的概念,并运用双重哈希表来存储相邻的每对k-mer,使得拼接更加迅速、准确。应用该算法对SRA数据库中人、狗和老鼠的测序数据分别进行拼接,结果表明该算法比其他已有算法更高效。