多策略相似度整合的XML模式匹配方法
XML Schema Matching Based on Multi-Strategy Similarity Integration作者机构:北京大学信息科学技术学院北京100871 北京大学软件工程国家工程研究中心北京100871
出 版 物:《计算机科学与探索》 (Journal of Frontiers of Computer Science and Technology)
年 卷 期:2016年第10卷第1期
页 面:14-24页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金~~
主 题:数据交换 模式匹配 可扩展标记语言(XML) 相似度度量 多策略组合
摘 要:模式匹配用于发现不同数据源中概念之间的语义对应关系,已成为数据集成、数据交换等领域的研究热点。研究者提出了大量的基于XML模式匹配方法,从而可以识别XML中数据的语义对应关系。XML模式匹配存在着一些挑战,例如如何将节点和结构匹配进行综合考虑,如何有效拟合多种相似度等。面对如上问题,针对XML节点和结构两方面进行相似度计算,得到相似度矩阵后整合这两个方面的相似度。随后通过多种策略组合和优化算法进行拟合,以得到优化的匹配结果。最后,通过基准测试平台对比,该方法相比于经典的模式匹配方法具有较高的精确率和召回率。