余弦距离下保护型迁移学习聚类算法
Protection-type transfer learning clustering algorithm with cosine distance metric作者机构:江南大学数字媒体学院江苏无锡214122 江阴职业技术学院江苏无锡214400
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2015年第51卷第23期
页 面:131-138,225页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:迁移学习 欧式距离 余弦距离 保护型 归一化约束 过维数
摘 要:以往研究者都从公式的合理性出发研究迁移学习和传统机器学习,但他们忽视了对问题的整体性考虑,致使在具体应用到文本分类问题时,无法实现彻底的分类。通过研究文本分类的整个过程,在k-均值算法中使用余弦距离,显著提高了实验结果;提出保护型迭代思想,同时弃用传统的词特征空间,采用隐空间作为特征向量空间,实施归一化约束。以CCI算法为例,结合提出的改进思想,产生改进算法PCCI,在降低计算复杂度的同时显著提高迁移学习的分类正确率。通过在数据集20-News Groups和Reuters-21578上测试并与现有其他迁移学习算法进行比较,证明了该改进算法的优越性。