图神经网络作为一种基于深度学习的图表示技术,可以对具有已知关系和对象的多种数据类型进行建模,在很多任务中都表现出了优越的性能,引起了学者们广泛的研究兴趣。然而,文本分类作为图神经网络中的一种基础任务,一些基于人工神经网络的文本分类方法对于非连续词序列有时会忽略上下文的语义关系,导致学习效果不佳。而且对于异构图数据,在图神经网络中也没有充分考虑到包含不同类型节点和边的信息嵌入方式,异构数据丰富的语义信息给面向异构图设计的图神经网络带来了巨大的挑战。而膜计算作为一种生物计算模型,与图神经网络在结构上具有很多相似之处,所以将二者进行结合,利用P系统的极大并行性特点来改善上述问题并提高运算效率,主要内容如下。本文首先将类细胞P系统和类组织P系统相结合,引入分层细胞结构,提出了一种新的分层混合P系统(LHP),并采用分层计算的模式,使信息可以在细胞间逐层传递运输。整个分层混合P系统分为三层,分别为输入层,隐藏层和输出层,在隐藏层内又根据具体的网络流程分为多层。其混合细胞分为内层细胞和外层细胞,细胞内的进化规则也按照层级顺序先后执行,利用分层混合P系统的极大并行性,可将其与神经网络结合,提高计算性能和效率。然后改进了两种图神经网络算法,分别为门控特征提取图神经网络(GFEGNN)和双层注意力图神经网络(DAGNN)。在GFEGNN中,采用注意力门控循环单元来自动提取文本数据节点的特征表示,聚合邻居信息捕获上下文语义关系,有效缓解非连续词的长期依赖问题。之后为得到更加具有区分性的分类节点,引入注意力机制来提取关键字节点聚合成子图表示,得到更精准的文本分类结果。在DAGNN中,为处理不同节点和边类型的异构数据,首先将不同特征空间的节点信息投影到同一空间维度内,然后采用双层注意力机制,不仅在节点级聚合局部特征信息,还在元路径上聚合了全局结构信息,获得更全面的上下文语义关系。对两个图神经网络算法分别与LHP系统相结合,构造适用于各自网络的LHP系统,分别为LHP-GFEGNN和LHP-DAGNN,并详细阐述系统的定义和运算流程。最后将LHP-GFEGNN系统应用于新闻文本分类问题中,以解决爆炸性新闻信息的涌入带给读者、新闻工作者以及研究者们的困扰,在Tag My News和BBC新闻数据集上的实验证明了此系统可以有效缓解新闻文本信息获取难的问题。另外将LHP-DAGNN应用于电影的偏好预测中,在Movielens和DOUBAN两个在线电影平台观影数据集上的应用结果验证了模型确实可以预测用户是否对电影感兴趣,具有较强现实意义。
暂无评论