基于标签关联性的分层分类共有与固有特征选择
Label-correlation-based Common and Specific Feature Selection for Hierarchical Classification作者机构:闽南师范大学计算机学院福建漳州363000 数据科学与智能应用福建省高校重点实验室(闽南师范大学)福建漳州363000 厦门大学人工智能系福建厦门361005 天津大学智能与计算学部天津300072
出 版 物:《软件学报》 (Journal of Software)
年 卷 期:2022年第33卷第7期
页 面:2667-2682页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
基 金:国家自然科学基金(62076116 61672272 61925602 61732011)
摘 要:在大数据时代,数据的样本数量、特征维度和类别数量都在急剧增加,且样本类别间通常存在着层次结构.如何对层次结构数据进行特征选择具有重要意义.近年来,已有相关特征选择算法提出,然而现有算法未充分利用类别的层次结构信息,且忽略了不同类节点具有共有与固有属性的特点.据此,提出了基于标签关联性的分层分类共有与固有特征选择算法.该算法利用递归正则化对层次结构的每个内部节点选择对应的固有特征,并充分利用层次结构分析标签关联性,进而利用正则化惩罚项学习各子树的共有特征.该模型不仅能够处理树结构层次化数据,也能直接处理更为复杂常见的有向无环图结构的层次化数据.在6个树结构数据集和4个有向无环图结构数据集上的实验结果,验证了该算法的有效性.