QBC主动采样学习在垃圾邮件在线过滤中的应用
Method of spam filtering online based on QBC active sampling learning algorithm作者机构:池州学院数学与计算机科学系安徽池州247000 南京理工大学计算机科学与工程学院南京210094
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2014年第50卷第22期
页 面:170-174页
核心收录:
学科分类:08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:安徽省教育厅自然重点项目(No.KJ2012A211)
主 题:垃圾邮件过滤 版本空间 主动学习 投票熵 委员会投票算法
摘 要:针对垃圾邮件在线过滤的实际应用,在委员会投票算法采样学习的基础上,提出动态提升采样门槛,在无标签样本池中阶梯式获取高信息量训练样本的方法。该方法能够在稳定识别精度的前提下,进一步降低用于标注和学习的样本数量,压缩由此带来的时间成本。通过在UCI的Spambase数据集上仿真,证明了该方法在改善学习效率方面的有效性。