Word2vec和支持向量机的POI自动分类方法
POI automatic classification method based on Word2vec and support vector machine作者机构:江苏海洋大学海洋技术与测绘学院江苏连云港222000 中国测绘科学研究院北京100036 西南交通大学地球科学与环境工程学院成都611756
出 版 物:《测绘科学》 (Science of Surveying and Mapping)
年 卷 期:2022年第47卷第6期
页 面:195-203页
核心收录:
学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:中国测绘科学研究院基本科研业务费项目(AR2011) 自然资源部专项业务项目(A2101) 国家自然科学基金项目(41806117)
主 题:POI分类 Word2vec 支持向量机 TF-IDF
摘 要:针对兴趣点(POI)数据名称文本特征稀疏以及语义关系简单所导致的POI数据管理困难等问题,该文提出一种基于词向量计算工具Word2vec和支持向量机的POI分类方法。首先对POI名称进行分词、去停用词等预处理;然后通过Word2vec模型生成词向量,并引入词频-逆文档频率(TF-IDF)权重进行加权求和实现名称文本的向量表示;最后,在对支持向量机分类器训练的基础上,实现POI数据自动分类。为了验证方法的有效性,该文选取百度地图的6类POI数据进行试验,结果表明,该文方法在6个类别中总体正确率达到94.43%,优于目前常用的机器学习分类方法。