基于样本冗余度的主动学习优化方法
ACTIVE LEARNING OPTIMIZATION METHOD BASED ON SAMPLE REDUNDANCY作者机构:沈阳航空航天大学计算机学院辽宁沈阳110136 辽宁省大规模分布式系统实验室辽宁沈阳110136
出 版 物:《计算机应用与软件》 (Computer Applications and Software)
年 卷 期:2021年第38卷第3期
页 面:291-297页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:主动学习解决了因训练样本过大而导致需要大量人力物力的问题,核心问题是如何选择有价值的样本减少标注成本。以神经网络为分类器,大多数方法选择信息量大的样本并没有考虑所选择样本间的信息冗余问题。通过对冗余问题的研究,提出一种降低信息冗余的样本选择优化方法。用不确定性方法选出信息量大的样本构成候选样本集,同时用网络中计算的潜变量向量表示样本信息,利用该向量计算候选样本间的余弦距离选择出间隔距离大、信息冗余度低的子集。在Mnist、Fashion-mnist,以及Cifar-10数据集中与几种不确定性方法相比,在相同样本准确率下,该方法最低减少11%标记样本。