基于多中心模型的网络热点话题发现算法
Network Hotspot Topic Detection Algorithm Based on Multi-center Model作者机构:哈尔滨工程大学信息安全研究中心黑龙江哈尔滨150001
出 版 物:《南京理工大学学报》 (Journal of Nanjing University of Science and Technology)
年 卷 期:2009年第33卷第4期
页 面:422-426,431页
核心收录:
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家"973"计划项目(2007CB311100) 哈尔滨工程大学基础研究基金(002060260735)
摘 要:为了有效消除网络话题相关报道内容侧重点变化对网络话题发现准确性的影响,提出了网络话题多中心模型。将报道内容之间的关联关系层次化,提高了对网络话题的描述能力。提出了基于多中心模型的网络热点话题发现算法,利用话题中心判别新出现的报道是否属于已有网络话题,算法基于单遍聚类思想,通过引入话题中心的策略优化了算法的计算开销。实验结果表明:该算法可以全面、准确地发现网络热点话题,同时具有较为理想的性能,可应用于大规模网络动态流式数据环境下的热点话题发现。