咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Single-Pass的网络舆情热点发现算法 收藏

基于Single-Pass的网络舆情热点发现算法

An Internet Public Opinion Hotspot Detection Algorithm Based on Single-Pass

作     者:格桑多吉 乔少杰 韩楠 张小松 杨燕 元昌安 康健 GESANG Duoji;QIAO Shao-jie;HAN Nan;ZHANG Xiao-song;YANG Yan;YUAN Chang-an;KANG Jian

作者机构:西藏大学藏文信息技术研究中心拉萨850000 西南交通大学信息科学与技术学院成都610031 西南交通大学生命科学与工程学院成都610031 电子科技大学大数据研究中心成都611731 广西师范学院科学计算与智能信息处理广西高校重点实验室南宁530023 

出 版 物:《电子科技大学学报》 (Journal of University of Electronic Science and Technology of China)

年 卷 期:2015年第44卷第4期

页      面:599-604页

核心收录:

学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(61100045 61165013) 高等学校博士学科点专项科研基金(20110184120008) 中国博士后科学基金特别资助项目(201104697) 教育部人文社会科学研究青年基金(14YJCZH046) 中央高校基本科研业务费专项资金(2682013BR023) 科学计算与智能信息处理广西高校重点实验室开放课题资助(GXSCIIP201407) 四川省教育厅资助科研项目(14ZB0458) 

主  题:舆情分析 single-pass 文本聚类 话题发现 

摘      要:考虑网络事件的时间距离,基于半结构化网页中不同位置特征项重要程度的不同,提出改进的single-pass文本聚类算法single-pass*,优势在于对Web文本不同位置特征项的加权处理,仅需计算新文档与同类别种子文档间的相似度。实验结果表明,相比single-pass,改进算法极大减少了漏检率和错检率,降低了由于新文本流内文档进行相似度计算导致系统性能的下降,平均提高Web文本聚类效率40%。将聚类后的Web文本应用于网络舆情分析,进行主题关注度分析和话题热度特性分析。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分