基于行为数据挖掘的视频APP用户流失预测
作者单位:华东师范大学
学位级别:硕士
导师姓名:孙蕾
授予年度:2023年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:我国在线视频行业历经将近二十年的发展,目前已步入存量博弈阶段,获客成本的上升使得各视频平台逐渐将提升现有客户留存价值作为用户运营策略的核心,而用户流失预测是提升留存的关键工作。如何从用户的海量行为数据中挖掘有效信息构建预测模型,对于视频平台提升运营效率具有重要意义。本文基于某视频APP用户行为数据集,分别构建机器学习模型和深度学习模型,对用户是否流失进行预测。首先,基于用户日志数据从登录行为、观看行为、用户兴趣三个维度进行特征提取,采用多种机器学习模型(随机森林、XGBoost、LightGBM和CatBoost)进行训练和参数调优,测试集上的预测结果表明XGBoost模型在AUC、召回率和F1指标上效果最优。其次,从日志数据中提取用户行为相关的时序特征,构建GRU与CNN的深度学习模型,基于用户时序特征与画像特征进行预测。结果表明基于单个CNN的模型以及GRU与CNN融合模型(DLCNN和GRU-CNN)的综合效果皆优于机器学习模型,其中本文构建的GRU-CNN模型采用并行融合方式有效结合了 GRU与CNN的优点,能够更充分地从用户时序信息中自动学习特征,融入注意力机制后又进一步增强了模型的表征能力,在深度学习模型中效果最优,较之机器学习模型中效果最好的XGBoost,AUC、召回率和F1值分别提升0.7%、13.7%和5.8%。最后,根据模型输出特征重要性排序并结合SHAP框架进行分析,经研究发现,用户兴趣特征、登录行为特征、观看视频行为特征、设备内存特征对用户是否流失有重要影响,该结论也可为视频平台制定用户运营策略提供一定参考。