顾及通名语义的汉语地名相似度匹配算法
Matching Algorithm for Chinese Place Names by Similarity in Consideration of Semantics of General Names for Places作者机构:河南理工大学矿山空间信息技术国家测绘地理信息局重点实验室河南焦作454000 河南理工大学测绘与国土信息工程学院河南焦作454000 信息工程大学测绘与科学技术博士后流动站河南郑州450052
出 版 物:《测绘学报》 (Acta Geodaetica et Cartographica Sinica)
年 卷 期:2014年第43卷第4期
页 面:404-410,418页
核心收录:
学科分类:081603[工学-地图制图学与地理信息工程] 081802[工学-地球探测与信息技术] 07[理学] 081203[工学-计算机应用技术] 08[工学] 070503[理学-地图学与地理信息系统] 0818[工学-地质资源与地质工程] 0705[理学-地理学] 0816[工学-测绘科学与技术] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(41001226 41340034) 河南省高等学校骨干教师计划(2012GGJS-055) 河南省教育厅自然科学研究计划(2010B170006) 国家测绘地理信息局重点实验室开放课题(KLM201202) 数字制图与国土信息应用工程国家测绘地理信息局重点实验室开放基金(GCWD201002) 河南理工大学博士基金(B2010-9)
摘 要:地名匹配是地理信息检索、多源地理空间数据集成及更新中的关键技术问题。本文根据规范汉语地名构词特点,依据地名通名与地名类型的关系,建立规范地名通名语义知识库,并将由其提供的地名语义作为地名相似度匹配的重要指标。针对基于字面和空间数据的地名匹配方法存在的不足,面向规范地名提出一种综合了地名专名字面相似度和地名通名语义相似度两种因素的复合相似度匹配算法模型。该模型模拟人的认知习惯,根据通名语义相似度程度,通过单调函数关系动态设置专名和通名相似度各自的权重值,利用动态加权方法求得复合地名相似度指标。在上述模型基础上,本文提出汉语地名匹配策略和流程,利用通名蕴含的语义增强汉语地名匹配算法的理论基础和完备性,提高了地名匹配算法准确率。试验结果表明该模型符合认知习惯,验证了该方法的合理性和有效性。