基于Nearest Pair的XML关键词检索算法
An XML Keyword Retrieval Algorithm Based on Nearest Pair作者机构:北京大学信息科学技术学院智能科学系北京100871
出 版 物:《软件学报》 (Journal of Software)
年 卷 期:2009年第20卷第4期
页 面:910-917页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:北京大学-富士通青年基金~~
摘 要:随着大量数据以XML格式保存,针对XML文档的关键词检索技术已经成为信息检索和数据库等相关领域的研究热点.以树的杜威编码为基础,分析并证明了XML关键词检索中核心概念SLCA(smallest lowest common ancestor)的两个重要性质,并在其基础上提出了Nearest Pair算法.该算法采用二分迭代查找技术寻找最邻近点,将求解中间结果的次数降低了一个量级.实验结果表明,该算法的性能在绝大多数情况下优于现有主流算法.