多层异质网络的协同排名算法及其期刊排名问题的应用
作者单位:清华大学
学位级别:硕士
导师姓名:白峰杉
授予年度:2017年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 07[理学] 070105[理学-运筹学与控制论] 0701[理学-数学]
主 题:协同排名算法 PB-index 宏观信息 微观结构 多尺度
摘 要:自从Eugene Garfield提出了影响因子,期刊的引文分析已经成为最为流行的文献计量分析方法之一。本文,我们首先分析了PageRank算法,HITS算法和随机Co-Ranking模型三种排名方法的原理和优劣。在此基础上,本文结合期刊排名这一问题背景,提出了针对多层异质网络的多尺度协同排名算法。协同排名算法借鉴了HITS算法中根集与扩展集的方法,采用局部属性指标PB-index筛选出引文子网络,即局部网络。在宏观层面,算法利用PageRank得到宏观节点的PR值;在微观层面,采用PR值修正微观节点的转移矩阵,并用微观节点的pr值修正宏观节点的排名。由此,算法既保留了宏观尺度的信息,又利用微观信息对宏观层的排名结果进行了局部修正。算法性质方面,我们发现在无标度网络中协同排名算法的局部修正效果显著。另外,算法的收敛结果依赖于根集选取路径,但是结果之间的差别几乎可以忽略。此外,协同算法在对作弊行为的惩罚上比PageRank具有显著的优越性。通过在高能物理引文网络进行数值实验,我们发现协同排名算法和PageRank算法两者的排名结果总体上一致;但是在局部排序上,协同排名算法的结果更符合我们对于高能物理领域期刊排名的认识。最后,我们探讨了算法在其他多层异质网络,如学者-论文网络、文本-语句网络和基因-位点网络等多层异质网络上的推广应用。此外,本文只是根据期刊排名这一应用场景提出了协同排名算法,对于其他场景算法仍有改进的空间。