利用进化模糊K近邻及其集成预测蛋白质亚核定位
Prediction of Protein Subnuclear Location Using Evolutionary Fuzzy K-Nearest Neighbors and Its Ensemble作者机构:济南大学信息科学与工程学院山东济南250022
出 版 物:《济南大学学报(自然科学版)》 (Journal of University of Jinan(Science and Technology))
年 卷 期:2010年第24卷第4期
页 面:376-379页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(60903099) 山东省高等学校科技计划(J09LG14)
主 题:蛋白质亚核定位 集成学习 进化模糊K近邻 粒子群优化算法 Jackknife验证
摘 要:针对从蛋白质原始序列中预测蛋白质定位及功能信息这个生物信息学中研究的热点问题,提出进化模糊K近邻算法(Evolutionary Fuzzy K-Nearest Neighbor,EFKNN)直接处理多分类问题的预测模型,用EFKNN及其集成直接从蛋白质序列中预测蛋白质亚核定位。采用5种特征提取算法从蛋白质序列中提取特征,训练了5个基于EFKNN的基分类器,并根据得票量大小原则集成每个基分类器的分类结果作为待测样本的输出。将蛋白质亚核定位预测中常用的数据集SNL9作为训练集,利用jackknife测试方法预测了数据集中每条单定位亚核蛋白,正确率为70.0%,表明该模型可以作为蛋白质亚核定位预测的工具或对现有预测模型和方法的补充。