基于距离函数值和打分值的GBM算法预测酸根离子配体结合残基
Prediction of acid radical ion binding residues by GBM algorithm with characteristic parameters extracted by distance function and matrix scoring method作者机构:内蒙古工业大学理学院呼和浩特010051
出 版 物:《内蒙古工业大学学报(自然科学版)》 (Journal of Inner Mongolia University of Technology:Natural Science Edition)
年 卷 期:2021年第40卷第6期
页 面:420-427页
学科分类:0710[理学-生物学] 071011[理学-生物物理学] 07[理学]
基 金:国家自然科学基金项目(61961032) 内蒙古自然科学基金项目(2019BS03025)。
摘 要:在生命活动中,酸根离子是一种重要的蛋白质配体,蛋白质与其结合才能发挥重要功能.因此,识别蛋白质-酸根离子配体结合位点具有重要的意义.选用SO_(4)^(2-),PO_(4)^(3-),CO_(3)^(2-)和NO_(2)^(-)配体作为研究对象,采用距离函数和矩阵打分算法分别提取基础特征参数的组分信息和位置保守性信息,使用GBM算法对蛋白质-酸根离子配体结合残基进行预测.五交叉检验下得到较好的预测结果,其中CO_(3)^(2-)和NO_(2)^(-)配体结合残基识别要好于IonSeq方法的结果.为了进一步验证预测模型的实用性,我们选用了欠采样方法处理数据集,将同样的特征参数放入GBM算法中,独立检验结果好于随机森林算法和SMO算法的预测结果,也好于前人的预测结果.