咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于差分进化粒子群算法的电商评论数据挖掘研究 收藏
基于差分进化粒子群算法的电商评论数据挖掘研究

基于差分进化粒子群算法的电商评论数据挖掘研究

作     者:贾咪雪 

作者单位:华中师范大学 

学位级别:硕士

导师姓名:谈国新

授予年度:2021年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081203[工学-计算机应用技术] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:数据采集 中文分词 Word2Vec 差分进化粒子群算法 

摘      要:随着我国互联网技术的进步和飞速发展,线上购物已然逐渐成为当下一种最主流的购物方式,给现代社会人们的日常生活和工作方式都带来巨大的改变,同时也使得现代社会人们的日常生活和工作都更加的方便快捷。但线上商品的品种样式繁多,令人眼花缭乱,且不能切身去感受和体验商品,致使消费者难以做出购买抉择。电商平台中的用户评论信息,是已购买商品的消费者亲自体验后对商品的主观感受,能够为潜在用户提供一定的参考。然而,电商用户群体越发庞大,商品评论信息量骤增且平台评论信息显示策略不合理及其他一些原因,使得用户很难从中提取到对自己有利用价值的信息。本文主要研究内容如下:第一,数据采集及预处理。这一部分介绍了现阶段常用的爬虫技术,利用这种技术收集电商平台中故宫文创产品的评论文本数据,并经过数据清洗、主观句子提取、中文分词、去除停用词等一系列技术对评论文本执行了相关的预处理操作,提高了数据的有效性,为后面的聚类分析工作做了充分的准备。第二,利用Word2Vec模型获取词向量。短文本数据因其含有的词项较少导致了特征提取难度大等问题。应用传统文本聚类模型对短文本进行聚类分析,常常得不到理想的簇类结构,不利于后续的应用研究。Word2Vec词向量模型通过中心词项的上下文内容可以将中心词项转换为一个词空间中的词向量,它在训练词向量时相较于传统的向量空间模型考虑了语义环境对训练结果的影响,具有一定的优势。Word2Vec词向量模型的思想是,上下文相似的词的语义也应该相似,这样语义相似的词空间中对应的词向量就更接近了。第三,利用特征词聚类结果以及情感标签实现商品特征及情感维度的构建,从特征和情感两个角度挖掘消费者所关注的商品的特点以及自身的主观感受,该维度体系为用户做出购买决策提供了客观有效地参考标准,并通过实验验证了本文方法的可行性及有效性。实验结果表明,本文基于个体间聚类中心向量相似度矩阵的自适应调整聚类中心向量排列顺序的方法来改进的算法,对短文本数据的处理上提高了准确率,并在特征词聚类方面加以应用,比传统的聚类算法更具优势。与传统算法相对比本文通过改进后的算法聚类效果更佳,同时算法的收敛速度也是更快的。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分