基于主动学习的深度半监督聚类模型
Deep active semi-supervised clustering model作者机构:贵州大学公共大数据国家重点实验室 贵州大学计算机科学与技术学院 贵州大学文本计算与认知智能教育部工程研究中心
出 版 物:《计算机应用研究》 (Application Research of Computers)
年 卷 期:2024年第41卷第10期
页 面:2955-2961页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目(62066007) 贵州省科技支撑计划项目(黔科合支撑【2022】一般277)
摘 要:深度半监督聚类旨在利用少量的监督信息达到更好聚类效果。然而,由于标注成本昂贵,监督信息的数量往往是有限的。因此,在监督信息有限的情况下,如何选择对聚类最有价值的监督信息变得至关重要。针对以上问题,提出了基于主动学习的深度半监督聚类模型(DASCM),该模型设计了一种主动学习方法,能够挑选出蕴涵丰富信息的边缘文本,并且进一步生成蕴涵边缘文本的高价值监督信息。该模型利用这些监督信息指导聚类,从而提升聚类性能。在5个真实文本数据集上的实验表明,DASCM的聚类性能有显著提升。这一结果验证了利用主动学习方法生成的涵盖边缘文本的监督信息对于提升聚类效果是有效的。