软件问答社区的问题删除预测方法
Prediction Method for Question Deletion in Software Question and Answer Community作者机构:北京航空航天大学计算机学院北京100191
出 版 物:《软件学报》 (Journal of Software)
年 卷 期:2022年第33卷第5期
页 面:1699-1710页
核心收录:
学科分类:0711[理学-系统科学] 08[工学] 0835[工学-软件工程] 0701[理学-数学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:科技创新2030-“新一代人工智能”重大项目(2018AAA0102304) 国家自然科学基金(62177003) 中央高校基本科研业务费(YWF-20-BJ-J-1018)
主 题:问题删除预测 问题质量 问题分类 软件问答社区 Stack Overflow
摘 要:Stack Overflow是最受欢迎的软件问答社区之一,用户可以在该网站发布问题并得到其他用户的回答.为了保证问题质量,网站需要尽快发现并删除低质量或者不符合社区主题的问题.当前,Stack Overflow主要采用人工检查的方式发现需要被删除的问题.然而这种方式往往不能保证问题被及时发现、删除,而且加重了社区管理员的负担.为了快速发现需要删除的问题,提出了自动化预测问题删除的方法MulPredictor.该方法提取问题的语义内容特征、语义统计特征和元特征,使用随机森林分类器计算问题会被删除的概率.实验结果表明:与现有方法DelPredictor和NLPPredictor相比,MulPredictor的准确率在平衡测试集上分别提升了16.34%和12.78%,在随机测试集上分别提升了12.38%和14.14%.此外,分析了影响问题删除的重要特征,发现代码段、问题的标题和正文第1段的特征对问题删除有重要的影响.