八邻域网格聚类的多样性XML文档近似查询算法
Approximate Query Algorithm Based on Eight-Neighbor Grid Clustering for Heterogeneous XML Documents作者机构:西安交通大学电子与信息工程学院西安710049 陕西省人工影响天气办公室
出 版 物:《西安交通大学学报》 (Journal of Xi'an Jiaotong University)
年 卷 期:2007年第41卷第8期
页 面:907-911页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点基础研究发展规划资助项目(2004CB719401) 国家自然科学基金资助项目(60542004)
摘 要:提出了一种基于八邻域网格聚类的多样性XML近似查询算法.首先给出了支持XML文档间语义距离计算的3种编辑操作代价模型,再利用XML文档间的语义距离建立XML文档的向量模型并设计基于八邻域网格的XML文档聚类算法,进而利用聚类过程中得到的物理和逻辑聚类中心对静态有序选择算法的查询评估策略进行优化,这样做只需定位聚类中心所在组群的局部范围,并在该范围内进行目标查询,而无需遍历整个XML数据库,从而快速返回满足用户需求的查询结果.经汽车外形智能化设计实验表明,所提算法的查询速度比静态有序选择算法平均提高了3~4倍.