一种二次投影识别蛋白质谱数据的新方法
A New Method for Recognition Proteomic Mass Spectrometry Data Using Double-Time Projections作者机构:西安电子科技大学计算机学院陕西西安710071 洛阳师范学院信息技术学院河南洛阳471022 华中科技大学控制科学与工程系湖北武汉430074
出 版 物:《中山大学学报(自然科学版)》 (Acta Scientiarum Naturalium Universitatis Sunyatseni)
年 卷 期:2009年第48卷第6期
页 面:27-32,37页
核心收录:
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
主 题:蛋白质谱 主分量分析 局部线性嵌入 最大边界准则 模式识别
摘 要:作为一种蛋白组学工具,质谱法的使用对疾病的早期诊断和治疗带来了革命性的变化。然而,由于面临维数灾难问题,大部分机器学习方法不能直接用于识别蛋白质谱数据,同时这些方法也面临着识别性能较低的问题。借鉴主分量分析(PCA)与局部线性判别嵌入(LLDE)在人脸识别方面取得的较好效果,提出了用于蛋白质谱数据识别的二次投影法(DTP)及改进的二次投影法(MDTP)。该方法先对数据去噪并用T检验降维,再提取均方误最小的第一次投影特征向量与可分性最好的第二次投影特征向量,最后将预处理过的数据先后在二次特征向量空间投影并分类。在卵巢癌蛋白质谱数据上的实验表明,二次投影及其改进方法识别性能较好,优于现有各方法。