基于密度峰值优化K-means聚类算法的微博舆情分析
Public Opinion Analysis of Weibo Based on K-means Clustering Algorithm with Peak Density Optimization作者机构:江苏科技大学计算机学院镇江212003
出 版 物:《计算机与数字工程》 (Computer & Digital Engineering)
年 卷 期:2022年第50卷第4期
页 面:726-729,735页
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:通过自行开发的爬虫脚本,抓取新浪微博上不同的关键词组成文本数据集,对数据信息进行中文分词、去停用词、权重计算等预处理,然后利用改进的聚类算法对文本聚类分析。针对K-means算法存在随机选取的初始聚类中心导致后期易收敛不能保证全局最优的问题,提出改进的密度峰值算法优化的K-means聚类算法。实验结果表明,与传统的K-means算法相比较,改进后的算法聚类更加有效稳定,提高了微博舆情发现的准确度和效率。