基于相似URL的深层网数据区域识别
Deep Web Data Region Identification Based on Similar URL作者机构:江苏大学计算机科学与通信工程学院江苏镇江212013
出 版 物:《计算机工程》 (Computer Engineering)
年 卷 期:2012年第38卷第2期
页 面:48-50页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:针对深层网查询结果页面中噪音信息对数据区域识别的干扰问题,提出一种自动识别深层网查询结果数据区域的方法。该方法利用网页的重复结构和相似URL,将页面划分成不同的语义块,依据不同页面块之间URL的相似性识别出数据区域。实验结果表明,该方法能够提高数据区域识别的召回率和准确率。