基于突发词H指数的微博突发事件检测算法研究
Micro-blog Emergencies Detection Approach Based on the H-index of Burst Words作者机构:东北林业大学信息与计算机工程学院哈尔滨150040
出 版 物:《情报杂志》 (Journal of Intelligence)
年 卷 期:2015年第34卷第2期
页 面:37-41页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:中央高校基本科研业务费专项资金项目"基于社会网络特征提取的群体性突发事件预警方法研究"(编号:2572014DB05) 国家自然科学基金"群体性突发事件预警的超网络方法研究"(编号:71473034) 中国博士后科学基金面上基金"考虑科技动态演化特征的热点技术领域预测研究"(编号:2012M520711)
摘 要:从微博中准确而高效地检测突发事件是近年来的研究热点。在综合考虑词的突发性和其对文档覆盖度的基础上,提出突发词H指数的概念,用于抽取有效表征突发事件的突发特征。构造突发词-文档矩阵,结合凝聚式层次聚类算法对突发微博文本进行聚类,并借助微博原文对事件进行描述。在新浪微博数据集上的实验表明,该方法可以有效地检测出微博突发事件。