咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >Github开源软件(OSS)项目中多种社交关系的挖掘与分析 收藏
Github开源软件(OSS)项目中多种社交关系的挖掘与分析

Github开源软件(OSS)项目中多种社交关系的挖掘与分析

作     者:Hiba Abu Ahmad(赫巴) 

作者单位:哈尔滨工业大学 

学位级别:硕士

导师姓名:王忠杰

授予年度:2016年

学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:GitHub 软件仓库挖掘 社交网络项目 社交网络分析 

摘      要:近年来,互联网在全球范围内对人们的交流方式产生了巨大影响,新型的合作方式也随之出现。随着开源软件(OSS)的蓬勃发展,身处世界各地的众多开发者都通过互联网参与到了开源软件项目的协作开发中,这些项目同时也成为开发者们分享、存档和交换信息的地方。GitHub作为当前最具代表性的社交编程及代码托管网站,将众多开源软件项目及其开发者都聚集到了一个虚拟的协作平台当中。在这个平台中,不仅开发者之间由于协同工作而存在社交关系,久而久之,各种项目由于共享同样的开发者或者存在互相调用等协作关系也会形成某种形式的社交网络。研究GitHub平台上软件仓库(项目)之间存在的社交关系可能帮助开发者提升协作开发的效率,这是本研究的意义所在。但是,如何从这些软件仓库中提取出有用的信息以组织项目之间的协作,是一个极富挑战性的问题,本文针对这个挑战研究了GitHub上的项目之间可能存在的社交关系。本文提出了3种模型,用于刻画GitHub中项目之间可能存在的3类社交关系(基于开发者的、基于复刻的和基于源代码的社交关系),并分别提出了抽取对应社交关系的3种算法。为了支持本文的研究工作,我们使用包含108718个项目和499485个用户数据的MSR2014数据集构建了基于开发者的和基于复刻的两种项目之间的社交网络。此外,我们基于Apache许可协议用自行开发的程序下载了GitHub上的421个开源项目的代码,解析源代码构建这些项目之间基于源代码的社交网络。之后,本文在两个层面对已构建的3种项目之间的社交网络(PSN)进行了实证分析:(1)从复杂网络的常用度量指标(如规模密度、度分布、直径等)层面分析PSN的性质;(2)从复杂网络结构的层面对3种PSN进行了对比分析。本论文的研究工作可以帮助深入理解OSS项目之间是如何协同配合的,并帮助理解OSS项目之间的相关性。同时也为如何建议开发者组织开源软件的协作工作和探究软件功能演变的因素打下了一定的基础。此外本文的研究工作对形式化开源软件项目的组织协作也有着基奠意义。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分