基于迭代延长纠错输出编码的微阵列数据多分类方法
Microarray Data Multiple Classification Method Based on Iterative Extension Error Correct Output Code作者机构:厦门大学软件学院福建厦门361005
出 版 物:《厦门大学学报(自然科学版)》 (Journal of Xiamen University:Natural Science)
年 卷 期:2018年第57卷第3期
页 面:396-403页
核心收录:
学科分类:08[工学] 0804[工学-仪器科学与技术]
基 金:国家自然科学基金(61502402 61772023) 福建省自然科学基金(2016J01320 2015J05129)
主 题:微阵列 纠错输出编码 多分类算法 癌症基因 数据复杂度
摘 要:微阵列技术使快速大量检测基因成为可能,人们迫切需要利用该技术提高疾病诊断水平.因此,对微阵列数据的分析研究迅速发展,其中以数据多类分类研究尤为突出.但由于微阵列数据具有特征多、样本少的特点,使得传统统计学习方法分类效果欠佳.为了针对微阵列数据特点解决多类分类问题,提出了一种迭代延长纠错输出编码(iterative extension error correct output coding,IE-ECOC)的算法.在几个特征子集上,配合与特征相关的数据复杂度,利用一种基于二叉树的编码方法生成一个列池,并提出一种择列策略构造编码矩阵;然后,依据迭代验证结果延长矩阵.对癌症基因微阵列进行分类实验,结果显示,IE-ECOC对特征多、样本少的数据具有针对性,且与一些经典的ECOC算法相比,可以产生较好的结果,IE-ECOE算法效果也在实验中得到了验证.