咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >针对数据标签噪声的自步半监督降维 收藏

针对数据标签噪声的自步半监督降维

作     者:古楠楠 

作者机构:首都经济贸易大学 统计学院 

出 版 物:《计算机工程》 (Computer Engineering)

年 卷 期:2023年

学科分类:08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0811[工学-控制科学与工程] 

基  金:首都经济贸易大学北京市属高校基本科研业务费专项资金资助(QNTD202109) 

主  题:降维 半监督降维 自步学习 稀疏表示 特征提取 

摘      要:对数据的类别进行标记是一项费时费力又枯燥的工作,且有时标记难度比较大,或需要专业知识背景,因此在实际中常出现数据标记错误的问题,这会导致错误的模型预测。该文基于自步学习机制,提出了一个对标签噪声稳健的自步半监督降维框架,它可以将由简单到复杂的样本逐步纳入训练中,得到一个越来越成熟的模型。在此框架下,该文提出了一种自步半监督降维算法,依据交替优化策略,该算法在更新降维映射函数与计算样本重要度之间交替迭代。一方面,该算法最小化低维有标签数据的加权类内分散程度,以及降维映射在再生核希尔伯特空间的复杂度正则化项,和降维映射关于数据稀疏结构图的光滑度正则化项,来得到降维映射。另一方面,算法依据自步学习机制,计算有标签数据的低维表示与其所在类的锚点之间的距离,来给定下次迭代时样本的重要度值。所提框架与算法对标签噪声具有较好的稳健性,自适应给出有标签样本的重要度值且不断更新,能够获得显性非线性的降维映射,且基于稀疏表示,使得所获的低维表示具有较强的可分性与判别性。该文针对5个标准数据集进行实验,将噪声标签所占比例分别设置为0, 10%,20%,30%,40%,实验结果验证了所提方法的有效性与稳健性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分