一种改进的基于树路径匹配的网页结构相似度算法
An Improved Web Structure Similarity Based on Matching Algorithm of Tree Paths作者机构:西南交通大学信息科学与技术学院成都610031
出 版 物:《吉林大学学报(理学版)》 (Journal of Jilin University:Science Edition)
年 卷 期:2012年第50卷第6期
页 面:1199-1203页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(批准号:61152001:61170111) 中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题基金(批准号:20110102) 中央高校基本科研业务费专项基金(批准号:SWJTU11ZT08)
摘 要:提出一种改进的基于树路径匹配的网页结构相似度算法,该算法定义了树路径的序列相似度和位置相似度,找出网页的树路径集合,通过网页间的最佳树路径匹配计算结构相似度.实验结果表明,用改进后的算法计算网页结构相似度比传统树路径匹配方法更符合实际,更合理有效.