基于多层次关系的时序集合预测研究
作者单位:吉林大学
学位级别:硕士
导师姓名:龙婷
授予年度:2024年
学科分类:12[管理学] 02[经济学] 0202[经济学-应用经济学] 020208[经济学-统计学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 07[理学] 0714[理学-统计学(可授理学、经济学学位)] 070103[理学-概率论与数理统计] 0701[理学-数学]
主 题:时序集合预测 协同信息 历史信息 图卷积神经网络 注意力机制
摘 要:时序集合是一种新的时间数据类型,它由顺序集组成,每个集合包含许多具有相同时间戳的元素。时序集合预测问题的目的是预测可能会出现在下一个集合中的元素。相比于每个时间点都只有一个元素的预测问题,时序集合预测往往更加复杂,因为加入了集合的概念,在建模用户的历史信息时需要额外考虑到集合间的关系。大多数现有的时序集合预测方法根据用户自身的序列对历史信息进行建模,包括元素之间的时序关系和相似性关系以及集合之间的时序关系等等。然而,这些方法忽略了不同用户序列之间的协同信息。虽然部分方法优先考虑了协同信息,但它们在建模历史信息时往往能力有限。此外,即使充分考虑了多层次的信息,如何更好地融合这些信息进行预测提高模型性能仍然是一个具有挑战性的问题。为了解决上述问题,本文提出了两种解决方案,通过对实验结果的对比与分析验证了本文提出的模型的有效性。具体来说,本文的主要内容和贡献如下: (1)本文提出了一种基于用户间交集数量的权重图信息融合方法,该方法主要由两个模块组成。首先,基于用户间元素交集数量的协同信息表示模块通过一种新的计算边权重的方法构建多个权重图来建模不同用户序列间的协同信息。然后,利用基于图卷积和注意力机制的历史信息学习模块在权重图上进行建模,利用图卷积捕捉元素之间的相似性关系,并使用注意力机制来建模集合间和元素间的时序关系,从而进行时序集合预测。该方法能够同时关注历史信息与协同信息,并进行了合理的信息融合以进行预测。 (2)本文提出了一种基于异构图的信息融合方法,该方法包含三个模块。首先,第一个模块使用方法一中的基于图卷积和注意力机制的历史信息学习模块,用于建模用户自身序列的历史信息。然而,由于方法一中的协同信息建模方法仅加强了多次同时出现在同一集合中的元素对之间的关系,而忽略了其他元素之间的相似性关系,因此方法二的第二个模块提出了一种新的建模不同用户序列间协同信息的方法,即基于多跳图信息聚合的协同信息学习模块。该模块通过将数据集中的所有用户和元素作为节点构建了一个图,并聚集分配了不同权重的多跳邻居信息来建模协同信息。最后,第三个模块是多层次信息融合模块,用于合理地融合历史信息与协同信息,以进行时序集合预测。 (3)通过与现有的时序集合预测方法进行对比实验分析,本文提出的两个解决方法都展现出了较高的性能。此外,本文还对提出的方法的不同模块进行了消融实验验证,并对不同方法中关键超参数的变化对结果的影响进行了实验与分析。在多个数据集上的实验证实了本文提出的方法一和方法二的有效性。