基于成对约束的偏标记数据消歧算法
Partial Label Data Disambiguation Algorithm Based on Pairwise Constraints作者机构:国家数字交换系统工程技术研究中心郑州450002
出 版 物:《自动化学报》 (Acta Automatica Sinica)
年 卷 期:2020年第46卷第7期
页 面:1367-1377页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:偏标记数据消歧是利用偏标记数据进行机器学习的基础.针对偏标记数据中广泛存在的数据不平衡问题,以及现有消歧算法对样本间约束信息利用不足的问题,本文提出一种基于成对约束的偏标记数据消歧算法.首先,基于低秩表示,推导出数据不平衡条件下样本低秩表示系数和样本相似度之间的关系;其次,基于推导结果,分别构建基于样本间正约束和负约束的图模型,通过最小化图模型的能量函数求解偏标记数据的标签.在5个公开数据集上的实验结果表明本文方法相对基准算法在消歧准确率上平均提高了2.9%~14.9%.