在线广告中的点击率和转化率预估问题研究
作者单位:华南理工大学
学位级别:硕士
导师姓名:宋恒杰
授予年度:2018年
学科分类:050302[文学-传播学] 1305[艺术学-设计学(可授艺术学、工学学位)] 12[管理学] 13[艺术学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 05[文学] 0503[文学-新闻传播学]
摘 要:随着互联网和电子商务的发展,在线广告(Online Advertising)成为企业进行商品推广和获取收入的有效方法之一。在工业界,用户行为是反映在线广告效果的重要依据。因此,大量的科研工作者对用户行为开展了深入的研究。在用户行为研究中有两个基本问题,分别是广告的点击率(Click Through Rate)预估问题和广告的转化率(Conversion Rate)预估问题。广告的点击率预估在广告的精准投放过程中扮演了重要的角色,准确地预估点击率不仅关系到广告主和出版商的收益,还对用户的友好体验有着重要的影响,因此受到互联网企业的广泛关注。在线广告分为搜索广告、上下文广告和展示广告。与搜索广告和上下文广告不同,展示广告的特殊应用场景(没有直接反映用户偏好的查询关键字以及页面信息)使上述很多先进的方法无法被直接使用,因此展示广告的点击率预估问题依旧是一个很大的挑战。广告的转化率是一个反映在线广告投放效果的核心指标。在广告投放前,出版商和广告主商定一个特定的用户反馈行为(例如:加入购物车、收藏商品、购买商品等)作为投放效果的衡量标准,广告的转化率是指在广告投放过程中广告用户发生这个特定行为的整体比例。从这个角度出发,转化率量化描述了广告主最关心的问题,即广告用户的质量问题。因此,准确地预估转化率成为广告主合理地分配广告预算以及促进利润有效增长的重要手段之一。本文的主要工作分为两个方面:(1)首先针对展示广告的点击率预估问题,我们量化分析了隐藏在用户对下的相似度对点击率的影响,并提出了相似度方法SMUP(Similarity Method base on User Pair),这个方法使大多数模型可以很容易地加入隐藏在用户对下的相似度对点击率预估准确度的潜在影响,从而提高预估的准确度。通过在大规模的公开数据集(iPinYou数据集和Avazu数据集)上进行的实验,我们验证了SMUP的有效性。(2)其次针对在线广告的转化率预估问题,我们通过量化分析并利用传统模型所忽略的因素:广告创意(广告的外观,包括图片、视频)对转化率的潜在影响,从而提出了LR+(Logistic Regression Plus)模型。我们在两个公开数据集(REC-TMALL数据集和Taobao Clothes Matching数据集)上进行了实验和分析,最终验证了模型的有效性:在RMSE指标下,LR+模型相对LR模型、GBDT模型以及Linear SVR模型具备更高的预估准确度。