基于改进特征提取及聚类的网络评论挖掘研究
Research on Network Review Mining Based on Improved Feature Extraction and Clustering作者机构:重庆邮电大学经济管理学院重庆400065
出 版 物:《现代情报》 (Journal of Modern Information)
年 卷 期:2018年第38卷第2期
页 面:68-74页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目"基于群体智能的多Agent协作模型与适应性研究"(项目编号:60905066/F030707) 重庆邮电大学自然科学基金资助项目"时间序列数据挖掘技术应用研究"(项目编号:A2009-03) 电子商务与现代物流重庆市高校市级重点实验室重点项目"基于多主体博弈的供应链契约选择与协调控制机制研究"(项目编号:ECML201403)
主 题:Apriori算法 特征提取 PMI算法 K-means算法 语义相似度
摘 要:[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79.07%。在特征聚类阶段,本文提出的改进K-means算法相对传统算法具有更优的挖掘性能。