咨询与建议

限定检索结果

文献类型

  • 13 篇 学位论文
  • 11 篇 期刊文献

馆藏范围

  • 24 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 24 篇 工学
    • 14 篇 计算机科学与技术...
    • 13 篇 软件工程
    • 10 篇 仪器科学与技术
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 24 篇 网页消重
  • 7 篇 搜索引擎
  • 3 篇 lucene
  • 2 篇 向量空间模型
  • 2 篇 近似网页
  • 2 篇 最大正文块
  • 2 篇 特征串
  • 2 篇 编辑距离
  • 1 篇 url消重
  • 1 篇 机器码向量
  • 1 篇 网页特征码
  • 1 篇 成员搜索引擎
  • 1 篇 md5
  • 1 篇 聚类
  • 1 篇 特征词群
  • 1 篇 网络爬虫
  • 1 篇 词性分类
  • 1 篇 签名
  • 1 篇 体系架构
  • 1 篇 web服务

机构

  • 4 篇 武汉理工大学
  • 3 篇 北京交通大学
  • 2 篇 西北工业大学
  • 1 篇 华东交通大学
  • 1 篇 湖南化工职业技术...
  • 1 篇 中南民族大学
  • 1 篇 北京邮电大学
  • 1 篇 成都信息工程学院
  • 1 篇 昆明理工大学
  • 1 篇 中国石油大学
  • 1 篇 河南大学
  • 1 篇 吉林大学
  • 1 篇 电子科技大学
  • 1 篇 华南理工大学
  • 1 篇 东华大学
  • 1 篇 江苏科技大学
  • 1 篇 菏泽学院
  • 1 篇 东北大学

作者

  • 2 篇 李先国
  • 1 篇 程芃森
  • 1 篇 张元丰
  • 1 篇 熊前兴
  • 1 篇 董守斌
  • 1 篇 党春辉
  • 1 篇 祁琛
  • 1 篇 姚漫
  • 1 篇 宋美娜
  • 1 篇 王祖析
  • 1 篇 冯海波
  • 1 篇 宋伟城
  • 1 篇 朱凤芳
  • 1 篇 牛娟娟
  • 1 篇 杜海刚
  • 1 篇 潘昊
  • 1 篇 刘觉夫
  • 1 篇 陈晓志
  • 1 篇 范小源
  • 1 篇 蔡敏

语言

  • 24 篇 中文
检索条件"主题词=网页消重"
24 条 记 录,以下是1-10 订阅
排序:
网页消重技术的研究与实现
网页消重技术的研究与实现
收藏 引用
作者: 祁琛 电子科技大学
学位级别:硕士
随着Internet的发展及其广泛应用,网络信息呈爆炸式增长,互联网已经成为了人们获取信息的要来源。为了能帮助人们快速找到所需要的信息,于是便有了搜索引擎技术。方便了人们查找信息,节省了时间,已经成为了人们经常使用的一项网... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
网页消重和聚类算法在高校搜索引擎中的研究与应用
网页消重和聚类算法在高校搜索引擎中的研究与应用
收藏 引用
作者: 党春辉 东华大学
学位级别:硕士
当前大部分搜索引擎都存在搜索结果有大量网页或者转载网页的问题,同时中文搜索引擎的网页聚类也处于刚刚起步阶段,很多技术都还不能应用到实际应用中去。随着中国高校的数目和规模逐年增加,高校搜索引擎技术的落后产生的弊端也浮... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于Map/Reduce的网页消重并行算法
收藏 引用
广西师范大学学报(自然科学版) 2007年 第2期25卷 153-156页
作者: 张元丰 董守斌 张凌 陈晓志 华南理工大学广东省计算机网络点实验室 广东广州510640
网页消重模块是搜索引擎系统的要组成部分,其作用是对搜索引擎的爬虫系统下载的网页进行过滤,去除复内容的网页,从而提高搜索引擎爬虫系统的性能和检索的质量。提出了一种网页消重的并行算法以及基于Map/Reduce的实现机制,并通过实... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于字集特征向量的网页消重改进算法
收藏 引用
计算机工程与应用 2017年 第2期53卷 53-57页
作者: 李洪奇 冯海波 张伟 杨中国 宋伟城 中国石油大学(北京)计算机系 北京102200
基于MD5算法计算数字指纹的网页消重算法简单而高效,在网页消重领域应用比较广泛。但是由于MD5算法是一种严格的信息加密算法,在文章内容变动很少的情况下得出的指纹结果完全不同,导致基于这种算法的网页消重技术召回率不是很高。提出... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
搜索引擎系统中网页消重的研究与实现
搜索引擎系统中网页消重的研究与实现
收藏 引用
作者: 牛娟娟 河南大学
学位级别:硕士
随着计算机硬件软件和互联网技术的飞速发展,网络上的各种信息急剧增长,已经成为人类有史以来信息资源数量最多、信息资源种类最全、信息资源规模最大的一个综合信息资源库。然而,用户在互联网上查找需要信息的时候,只知道搜索的关键词... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于文本聚类的网页消重算法研究
基于文本聚类的网页消重算法研究
收藏 引用
作者: 姚漫 北京交通大学
学位级别:硕士
随着网络技术的迅速发展和互联网规模的不断扩大,互联网已经成为了全球最大、最广泛使用的信息库,人们能够获得的信息资源也日益丰富。网络信息的指数级膨胀给信息检索带来了巨大的困难,并且网络信息的易复制性使得网络中存在大量的... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于布隆过滤器算法的网页消重技术的实现与应用
基于布隆过滤器算法的网页消重技术的实现与应用
收藏 引用
作者: 王征 北京交通大学
学位级别:硕士
随着Internet的不断发展,网络信息呈指数级不断膨胀,这也给信息检索带来了很大的困难,因此对于网页操作也是十分有意义的。本文从理论和应用两方面对网页消重技术进行了研究,达到了以下目标:首先,针对特定的需求,设计与实现... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
搜索引擎系统网页消重的研究与实现
搜索引擎系统网页消重的研究与实现
收藏 引用
作者: 范小源 中南民族大学
学位级别:硕士
Internet的迅速普及和飞速发展,使人们面临着一个信息的海洋,快速从中获得真正要的信息变得至关要。搜索引擎(主要指全文搜索系统)即是提供这种功能的一种工具。然而在搜索引擎返回的检索结果中,存在大量的网页,它们主要来自网... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
布隆过滤器在网页消重中的应用
收藏 引用
软件 2015年 第12期36卷 166-170页
作者: 潘昊 鄂海红 宋美娜 北京邮电大学计算机学院 北京100876
随着互联网的发展,网络信息呈爆炸性的增长。大量的信息一方面给人们带来了更多的息来源,而另一方面也给人们搜索有用的信息带来巨大的负担。根据2015年11月的最新数据,互联网上活动网站的数量达到了902,997,800个。因此如何更有效的... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于网页内容的网页消重高效检测算法研究
收藏 引用
佳木斯大学学报(自然科学版) 2010年 第1期28卷 22-24页
作者: 王祖析 湖南化工职业技术学院 湖南株洲412004
在对现有主流网页消重技术分析的基础上,提出一种基于网页内容的改进的网页消重高效检测算法.该算法通过利用网页的标签树结构选取最大的多个文本块,将这些文本块连接在一起生成一个代表该网页的MD5指纹,对指纹进行比较,确认近似网页实... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论