咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >多标签分类对社区异味共现的影响性分析 收藏
多标签分类对社区异味共现的影响性分析

多标签分类对社区异味共现的影响性分析

作     者:郭迪 

作者单位:上海师范大学 

学位级别:硕士

导师姓名:吴海涛

授予年度:2022年

学科分类:08[工学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 081202[工学-计算机软件与理论] 

主      题:社区异味 多标签 共现性 社群技术一致性 信息增益 

摘      要:社区异味(Community Smell)是软件开发社区中较差的组织结构和社群技术问题,而这些特征导致软件开发社区成员沟通与合作的内聚性降低,给软件系统造成额外的开发和维护成本,同时对软件系统的可维护性、可理解性和可测试性产生负面影响。开源软件社区中广泛存在的社区异味,且可以由一系列的社群技术指标进行评估与预测。然而这些社群技术指标都是面向单个社区异味去量化,没有考虑多重社区异味共现的复杂情况。本文针对社区异味共现的复杂问题,提出了一种基于机器学习的多标签分类(Multi-Label Classifier,MLC)算法模型,用以量化和分析社群技术指标对多重社区异味共现的影响。该模型以多标签算法标签集为基础,对比4种基础机器学习分类算法,对多重社区异味共现及强度进行分类预测。实验针对6个开源社区中243个项目版本,关注18种社群技术指标和4种社区异味,研究社区项目版本变化的过程中多重社区异味共现和强度变化的情况,并通过多标签评价指标对模型性能进行评估。结果表明基于决策树的模型对多重社区异味共现及强度的预测性能最好,均达到80%以上。本文利用信息增益(Information Gain)算法和shap解释性工具,对社群技术指标预测社区异味共现及强度的模型进行影响性分析,其中包括计算特征的熵减变化得到的特征贡献值和计算特征的边际收益得到的shap-value。并通过特征贡献值分析出每种社群技术指标对社区异味共现的影响,并使用SK-ESD校验对贡献结果进行排名。而shap-value分析每种社群技术指标对预测结果的正负相关性,且从大到小给出边际收益的贡献图。在贡献值和shap-value中都排名第一的社群技术一致性证实了该特征对社区异味共现影响的重要性。本文探究了对社区异味共现贡献值和解释性最高的特征——社群技术一致性,探究了其随着项目版本变化的趋势,并对社群技术一致性和社区的未来成功走向标志进行关联。通过相关性分析发现两者具有强关联性,且随着版本的变化,社群技术一致性稳定且有提升的社区,项目在未来有更高的成功率,反之社群技术一致性波动较大的社区,项目在未来的失败率会更高。本文通过两者相关性结果的分析,验证了社群技术一致性对预测项目成功走向影响的阈值,证明当社群技术一致性达到0.5以上时,项目往往是成功的,且通过结果证实了方法的有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分