一种基于深度学习的源代码摘要生成模型
Deep Learning Approach for the Source Code Summary Generation作者机构:信息工程大学网络空间安全学院郑州450001 数学工程与先进计算国家重点实验室郑州450001
出 版 物:《小型微型计算机系统》 (Journal of Chinese Computer Systems)
年 卷 期:2022年第43卷第11期
页 面:2449-2455页
学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划基金项目(2019QY1300)资助。
主 题:源代码摘要 注意力机制 抽象语法树 BERT LSTM网络
摘 要:源代码摘要是一段用自然语言描述的有关源代码的简介.源程序和自然语言之间存在着巨大的差异,计算机程序生成的摘要很难满足实际的需要.本文提出了一个基于深度学习的代码摘要生成模型At-ComGen,该模型基于混合的注意力机制设计,使用编码器-解码器结构的神经网络搭建.为了保持源代码的文本和结构信息,At-ComGen模型在源代码编码过程中同时使用独立的词汇编码器和语法树编码器.At-ComGen的解码器中还创新性地引入了BERT预训练模型技术提高生成摘要的描述能力.实验结果表明,At-ComGen模型在BLUE、METEOR等评价指标上均优于目前流行的代码摘要生成模型.