在线社会网络中社区发现技术及其应用研究
作者单位:中南大学
学位级别:硕士
导师姓名:王国军
授予年度:2012年
学科分类:08[工学] 080402[工学-测试计量技术及仪器] 0804[工学-仪器科学与技术]
主 题:在线社会网络 社区发现 用户紧密度 社区影响力 影响能力
摘 要:随着Web2.0的飞速发展,在线社会网络OSNs (Online Social Networks)作为其中一种实用的、新兴的交友模式已经成为人们生活和工作中不可或缺的一部分。在线社会网络中的人们通过各种关系相互联系在一起,形成了一个个内容丰富、关系复杂的社区。面对商业领域的实际应用,目前对社区的研究面临两大挑战。一是,由于在线社会网络的虚拟性和开放性,如何自动发现其中的社区成为一个亟待解决的问题。二是,社区作为一个新的营销领域,如何有效评估用户在社区中的社会影响力也成为一个备受关注的焦点问题。 本论文首先介绍了基于节点属性相似性的社区发现算法(简称为NAS算法)和基于共有邻居相似性的社区发现算法(简称为CNS算法),并针对这些算法中的缺点,基于在线社会网络的独有特性,提出了用户紧密度的概念,设计了一种基于用户紧密度的社区发现算法(简称为UTCD算法)。该算法首先对所有边计算用户紧密度,然后用层次聚类算法对其进行处理,以便发现社区。最后通过模块度测试和正确率测试来验证算法的有效性。实验结果表明,本文所提出的算法比NAS算法和CNS算法发现的社区凝聚度更高,正确率更高。 另外,本论文通过分析在线社会网络社区的独特结构及其中的人际互动行为,发现朋友数量和质量以及社区标签是影响用户影响力的三大主要因素。为了更有效地评估用户在社区中的社会影响力,提出了影响能力和社区标签的概念,设计了一种用户社区影响力UCI(User Community Influence)的评估模型。本论文的初始模型是基于PageRank而建立,然后通过计算得到的任意两个用户间影响能力来改进该初始模型。实验结果表明,本文提出的模型比传统的评估模型评估的用户影响力有更高的效率和更好的合理性。 总之,本论文既解决了大规模在线社会网络中自动发现社区的问题,也解决了在线社会网络社区应用于营销领域评估用户影响力的问题。这些研究成果将被应用到实际中,希望能够改变在线社会网络社区“研究多、应用少的现状。