科研论文的可比性评估与比较性引文生成方法
作者机构:南京邮电大学计算机学院 江苏省大数据安全与智能处理重点实验室(南京邮电大学)
出 版 物:《计算机应用》 (Journal of Computer Applications)
年 卷 期:2024年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金青年科学基金项目(62102192)
主 题:比较性引文 可比性评估 引文生成 文本生成 文本分类 比较对象抽取
摘 要:针对比较性引文生成中面临的两大挑战——如何准确判定论文间的可比性及如何生成具有比较性的句子,本文提出了科研论文的可比性评估与比较性引文生成方法。该方法构建了三个核心模块:可比性评估模块用于判断两篇论文是否具备可比性;比较对象提取模块负责从论文与参考文献中抽取出具体的比较对象;比较引文生成模块则生成相应的比较性引用句子。首先,利用SciBERT(Scientific BERT)模型处理输入的两篇文章,通过可比性评估模块进行可比性评估。其次,对于被判定为可比的文章,采用比较对象提取模块识别并提取出关键的比较对象。最后,借助比较引文生成模块生成包含这些比较对象的比较性引文。实验结果显示,在可比性评估阶段,本方法在平均倒数排名(MRR)指标上达到了0.732,在召回率@10(R@10)指标上达到了0.537,较之前的SciBERT-FNN方法在各个数据集上均有提升。在比较引文生成实验中,本方法在ROUGE-1、ROUGE-2和ROUGE-L得分分别为31.52、11.25和27.38,明显高于Bart-Large等基线方法。此外,实验结果还证实了科学文献自动化比较与分析技术对于引文句子生成任务具有重要意义,特别是在提高比较信息的可追溯性和确保引用句子信息的全面性方面,展现出极大的实用价值。