咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于文本重构的网络话题检测模型研究 收藏

基于文本重构的网络话题检测模型研究

Research of Network Topic Detection Model Based on Text Reconstruction

作     者:周雪梅 闫用杰 程山英 刘逸哲 ZHOU Xue-mei;YAN Yong-jie;CHENG Shan-ying;LIU Yi-zhe

作者机构:江西科技师范大学数学与计算机科学学院南昌330038 上海电机学院上海201306 

出 版 物:《南昌航空大学学报(自然科学版)》 (Journal of Nanchang Hangkong University(Natural Sciences))

年 卷 期:2015年第29卷第3期

页      面:32-37页

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:江西省教育厅项目(GJJ14585) 江西省社会科学研究规划项目(14TQ07) 江西省高校人文社会科学研究项目(JC1428) 

主  题:网络舆情 SinglePass 话题检测 文本重构 

摘      要:Single Pass聚类算法是话题发现中最常用的文本聚类算法,且广泛地用于话题检测和跟踪中。但它的聚类结果并不理想,此外,Single Pass在对报道与话题进行相似度匹配时导致了处理速度的降低。基于这2个问题,本研究提出了一种文本重构思想。即通过对论坛或网页信息的再组织,将和话题相关的主要信息集中在一起形成主题块,其余的部分形成细节块。在此基础上,对Single Pass聚类算法进行了改进。实验结果证明:改进的Single Pass聚类算法有效地解决了文本特征矩阵稀疏的问题,并能够准确并及时地识别网络中的热点话题,同时展示话题的层次性结构。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分