基于多维小波聚类的空间文本数据情感分布分析
Analyzing Sentiment Distribution with Spatial-textual Data of Multi-dimensional Clustering作者机构:南京大学信息管理学院南京210046 大阪大学大学院情报科学研究科大阪565-0871
出 版 物:《数据分析与知识发现》 (Data Analysis and Knowledge Discovery)
年 卷 期:2019年第3卷第7期
页 面:14-22页
核心收录:
学科分类:1205[管理学-图书情报与档案管理] 12[管理学] 120502[管理学-情报学] 0701[理学-数学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:【目的】构建基于多维小波聚类的空间文本数据情感分析模型,实现文本情感和空间位置的综合分析。【方法】将Yelp数据集进行整合以构建空间文本数据库,使用基于词典的情感分析方法构建特征向量。提出使用多维小波聚类的混合算法和文本–空间算法两种模型并进行分析。【结果】实验结果验证了使用db2和bior2.2小波基函数的多维小波聚类算法比DBSCAN和K-means算法在空间文本数据挖掘中能识别出更精确的聚类集合,且在十万级至千万级数据聚类中速度最佳。【局限】情感分析部分使用一元语言模型,缺乏对语句层面意义的分析。【结论】本文所提文本–空间算法模型能有效挖掘多维空间文本数据的情感倾向分布;混合算法模型为空间文本数据推荐系统提供了同时计算空间接近性和情感相似性的有效方案。