基于快速多示例多标记学习的G蛋白偶联受体生物学功能预测
Predicting Biological Functions of G Protein-Coupled Receptors Based on Fast Multi-Instance Multi-Label Learning作者机构:南京邮电大学地理与生物信息学院南京210023 南京邮电大学通信与信息工程学院南京210003
出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)
年 卷 期:2018年第55卷第8期
页 面:1674-1682页
核心收录:
学科分类:12[管理学] 0810[工学-信息与通信工程] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 0808[工学-电气工程] 0839[工学-网络空间安全] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(81771478 61571233) 江苏省高等学校自然科学研究项目(17KJA510003) 南京邮电大学科研基金项目(NY218092)~~
主 题:G蛋白偶联受体 生物学功能预测 快速多示例多标记学习 结构域 混合特征
摘 要:G蛋白偶联受体(G protein-coupled receptors,GPCRs)是人类中最庞大的膜蛋白家族,也是很多药物的重要靶点,准确了解GPCRs生物学功能是理解它们参与的生物学过程及其药物作用机制的关键.以前的研究表明,蛋白质功能预测可抽象为多示例多标记学习(multi-instance multi-label learning,MIML)问题.设计了一种基于快速多示例多标记学习方法 MIMLfast的GPCRs生物学功能预测模型.该模型采用了一种新的混合特征,它考虑了GPCRs结构域的三联氨基酸、氨基酸关联、进化、二级结构关联、信号肽及无序残基等多种信息.实验结果证明,该模型获得了很好的性能,优于目前最优的多示例多标记学习、多标记学习的预测方法和CAFA蛋白质功能预测方法.