基于多粒度特征交叉剪枝的点击率预测模型
Multi-Granularity Based Feature Interaction Pruning Model for CTR Prediction作者机构:北京邮电大学计算机学院(国家示范性软件学院)北京100876 微信事业群开放平台基础部广州510220
出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)
年 卷 期:2024年第61卷第5期
页 面:1290-1298页
核心收录:
学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(62102038,61972047) 腾讯微信开放平台项目(S2021120)。
主 题:点击率预测 高阶特征交叉 多粒度 特征剪枝 特征降噪
摘 要:在推荐系统中,学习有效的高阶特征交互是提升点击率预测的关键.现有的研究将低阶特征进行组合来学习高阶交叉特征表示,导致模型的时间复杂度随着特征维度的增加呈指数型增长;而基于深度神经网络的高阶特征交叉模型也无法很好地拟合低阶特征交叉,影响预测的准确率.针对这些问题,提出了基于多粒度特征交叉剪枝的点击率预测模型FeatNet.该模型首先在显式的特征粒度上,通过特征剪枝生成有效的特征集合,保持了不同特征组合的多样性,也降低了高阶特征交叉的复杂度;基于剪枝后的特征集合,在特征元素粒度上进一步进行隐式高阶特征交叉,通过滤波器自动过滤无效的特征交叉.在2个真实的数据集上进行了大量的实验,FeatNet都取得了最优的点击率预测效果.