咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于字符串相似性聚类的网络短文本舆情热点发现技术 收藏

基于字符串相似性聚类的网络短文本舆情热点发现技术

Online Public Opinion Hotspot Detection and Analysis Based on Short Text Clustering Using String Distance

作     者:杨震 段立娟 赖英旭 

作者机构:北京工业大学计算机学院北京100124 

出 版 物:《北京工业大学学报》 (Journal of Beijing University of Technology)

年 卷 期:2010年第36卷第5期

页      面:669-673页

核心收录:

学科分类:0810[工学-信息与通信工程] 08[工学] 0805[工学-材料科学与工程(可授工学、理学学位)] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家'九七三'计划资助项目(2007CB311100) 北京市自然科学基金资助项目(4102012 4102013) 北京市教育委员会科技发展计划面上资助项目(KM200810005030) 北京工业大学青年科学基金资助项目 

主  题:舆情分析 短文本处理 层次聚类 

摘      要:将每个短文本文档看成一个由文字、数字和标点构成的字符串,并基于字符串自身的特性直接计算其相似性,在此基础上进行短文本层次化聚类,进而发现网络舆情热点.由于这种方法免去特征提取和文本表示过程,在一定程度上避免了传统方法在短文本表示时特征向量稀疏的不足,有效解决了短文本内容聚类问题.实验结果表明,本文提出方法有效.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分