基于网页结构的网站检测研究
Web site testing research based on webpage structure作者机构:哈尔滨工业大学计算机科学与技术学院哈尔滨150001
出 版 物:《高技术通讯》 (Chinese High Technology Letters)
年 卷 期:2015年第25卷第10期
页 面:912-918页
学科分类:08[工学] 080402[工学-测试计量技术及仪器] 0804[工学-仪器科学与技术]
基 金:国家自然科学基金(61170262 61371177)资助项目
摘 要:为了准确检测出仿冒网站,提出了一种基于网页结构的页面相似度计算方法。该方法首先将网页分块并进行合理的筛选,其次通过初步比对确定相似节点群,最后将网页数据量化并计算出网页是否相似。试验表明,该方法可以有效地检测出网页相似情况,对于仿冒网站的镜像尤其明显,误报率及漏报率均不超过10%。