基于层次化循环神经网络的图生成模型研究
作者单位:吉林大学
学位级别:硕士
导师姓名:王英
授予年度:2022年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 07[理学] 081104[工学-模式识别与智能系统] 08[工学] 070104[理学-应用数学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0701[理学-数学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:图生成 最小深度优先搜索编码 边序列 领域无关 边级循环神经网络模块 元素级循环神经网络模块
摘 要:伴随着智能移动终端及其应用的迅速发展和普及,世界上大量终端设备在短时间内所产生的数据量是常人难以想象的。这些数据格式通常为图、图片、文本、语音和视频。但是,在某些情况下仍会存在数据不足或数据难以获得的问题。为了解决上述问题,需要对生成模型展开研究。生成模型要能够从真实数据中学习其概率分布,然后生成大量满足真实数据分布的人工数据。由此,一些深度生成模型诞生了并在此方面得到了外界的认可。然而,以往经典的深度生成模型的目标为生成与真实图像相似的图像。与图像不同,图属于非欧几里得结构数据,它的不同节点可以具有不同数量的邻接节点。并且,图的种类丰富,比如无标签图和有标签图。这些特点使得一般神经网络结构难以被直接地运用到图结构数据的研究中,自然也给图生成的研究与发展带来了挑战。然而,研究图生成是有意义的。图生成已经被广泛地应用到各种领域中,例如化学、物理和社交科学。经典的深度生成模型和神经网络结构经过巧妙的构思和设计后已经可以被运用到图生成当中,并且取得了巨大的成功。但是,目前图生成领域中仍存在一些问题亟待解决。第一,一些模型仅仅关注图的结构信息而忽略掉了图中重要的语义信息,从而不能够捕获真实的图数据分布。第二,大量现有模型的训练过程十分复杂并需要学习神经网络中的大量参数,导致其没有良好的可扩展性。第三,由于一些模型在图生成过程中需要设置确切领域的规则,所以这些模型的泛化性不足。为了提高模型的泛化性,本文利用最小深度优先搜索编码将图转换为独一无二的边序列并让模型在边序列中学习图数据的分布。因为边序列统一了多种图的表示形式,所以它可以提高模型的泛化性。为了捕获图中的结构信息和语义信息,本文提出了基于层次化循环神经网络的领域无关的图生成模型GHRNN,其利用边级循环神经网络模块和元素级循环神经网络模块分别学习图的全局结构和语义信息。并且,元素级神经网络模块具有固定且少量的时间步,可以有效提升GHRNN的可扩展性。最后,在不同种类的图数据集上使用11种不同的评价指标以全面地检测各个模型所生成图的质量,以此评价模型的性能。大量实验结果表明,与几个基线模型相比较,GHRNN能够捕获图中复杂的依赖并生成最真实和种类丰富的图。