咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于转录表达谱数据的癌症特征基因提取及癌型识别研究 收藏
基于转录表达谱数据的癌症特征基因提取及癌型识别研究

基于转录表达谱数据的癌症特征基因提取及癌型识别研究

作     者:宋学坤 余孝奎 孙兰 王瑞霞 杨猛丽 王晓辉 杜娟 丁可可 皇白雪 杨淳谦 

作者单位:河南中医学院信息技术学院 

会议名称:《中国生物工程学会第十一届学术年会暨2017年全国生物技...》

会议日期:2017年

学科分类:1002[医学-临床医学] 100214[医学-肿瘤学] 10[医学] 

关 键 词:癌症基因表达谱 特征基因选择 癌型识别 Relief算法 两两冗余处理 

摘      要:在癌症组织或者细胞中只有少量基因决定着癌症的发生发展和其类型特征,无论是从诊断还是从治疗的角度看,都有必要通过数据挖掘技术将少数致病基因筛选出来,即机器学习中的特征选择问题。因此,挑选具有最佳分类能力的特征基因,即癌症标志基因,对于癌症的诊断、分型及预测及治疗等具有重要的意义。实验中组织样本数据包括乳腺癌、肺癌、肾癌、卵巢癌和胃癌5种癌型及其对照组共240例。首先,运用支持向量机,对癌症样本和正常样本的分类性进行了分析,证明了癌症和正常样本间、不同癌症样本间都有较好的可分类特性。在此基础上,针对4种不同癌型及对应正常组织,使用改进的Relief算法提取基因表达谱中的特征基因簇,应用于测试集样本后正确识别率可达到95%以上;然后设计利用两两冗余算法对特征基因簇实施去冗余处理,最终筛选出了具有较好分类效能的癌症标志基因,使得癌型识别率达到了100%。该工作找到了区分不同癌型的较好的分类方法及流程,同时显示此前不少方法提取的特征基因可能具有冗余性,提示在当前基因标志物的研究中需要注意基因表达的冗余性对最终结果带来的影响,这也是今后值得研究的重要问题之一。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分