咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于联邦学习的推荐算法研究 收藏
基于联邦学习的推荐算法研究

基于联邦学习的推荐算法研究

作     者:荣先进 

作者单位:黑龙江大学 

学位级别:硕士

导师姓名:朱敬华

授予年度:2023年

学科分类:08[工学] 081104[工学-模式识别与智能系统] 081203[工学-计算机应用技术] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:推荐系统 联邦学习 非独立同分布 异构推荐 深度学习 

摘      要:5G时代,网络上的信息量以指数级的方式增长,这给用户带来了巨大的信息负担。推荐系统利用用户的历史交互数据,为用户提供个性化的推荐服务,成为缓解信息过载问题的有力工具。然而,传统的推荐模型需要集中存储数据并进行训练,这样会涉及到用户隐私问题。因此,不搜集用户数据而实现推荐的隐私保护策略显得更加合理。联邦学习是一种分布式的方法,它允许各客户端将数据保存在本地,同时协作训练一个全局模型。这种方法具有保护隐私数据、分布式计算和存储等优点。当推荐系统与联邦学习相结合时,联邦推荐算法可以始终将用户数据保留在客户端本地,在模型构建过程中保护用户隐私。然而,现有的联邦推荐架构并不适用于实际商业应用场景。实际上,用户行为数据分布在不同的应用平台上,广告商也可能在不同平台上投放相同的商品。这导致服务提供商在训练模型时不能喂入准确的用户和商品特征。此外,由于数据的稀疏性和分布存储,模型难以避免冷启动问题。为了解决这些问题,本文主要从两个方面进行研究。(1)三方合作的联邦推荐模型:本文对现实商业推荐场景进行了抽象归纳建立了相应的模型,并提出假设,认为一次精确的推荐,需要应用服务、用户和广告商之间的完美合作。因此,本文提出了一种基于用户(User)-应用服务(Server)-广告主(Advertiser)三方协作的联邦学习算法(FedUSA)。对于用户数据,该算法仅将用户特征存储在用户设备上,并在用户设备上进行用户嵌入(User Embedding)的聚合和训练,然后将用户嵌入发送给交互的应用服务。这样,服务商在不收集用户原始数据的情况下也能获得较为准确的用户嵌入表示。对于商品数据,广告主平台进行商品嵌入(Item Embedding)的聚合和训练,然后将商品嵌入发送给合作的服务商。这样,在受商业竞争和隐私保护条款限制的各服务商之间,在不交换商业数据的情况下也能获得较为准确的商品嵌入。当服务商同时收到用户嵌入和商品嵌入时更新模型,完成一次联合训练。FedUSA基于联邦合作的方式,在保证数据隐私的前提下,同时学习了用户特征和商品特征,使得模型可以学习到更为丰富的交互信息。本文在多个真实数据集上进行了多组对比实验,实验结果验证了本方法的有效性。(2)基于元学习的异构联邦推荐模型:在异构联邦推荐模型中,参与训练的三方的数据虽然相互独立,但是不服从同一采样方法,即存在非独立同分布(Non-IID)的情况。数据的异构性会导致模型的预测准确率下降。为了应对这种情况,本文在FedUSA联邦推荐模型框架下,提出了一种基于元学习思想的联邦元嵌入(Federated Meta Embedding,FedME)方法,旨在使模型适应异构数据的场景。该方法首先将异构数据划分为Hot ID或Cold ID,其中Hot ID表示数据实例数量较多,Cold ID表示数据实例数量较少。然后,推荐任务分为两个阶段:联邦阶段和元学习阶段。在联邦阶段中,目标是通过FedUSA的协作学习Hot ID的更丰富语义信息。在元学习阶段中,每个Cold ID被视为一个学习任务,使用联邦阶段学习的参数初始化元学习器(meta-learner),并继续训练Cold ID的嵌入。实验结果表明,FedME能够提高推荐的预测性能,特别是对于Cold ID的预测准确率有所提升。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分