咨询与建议

限定检索结果

文献类型

  • 67 篇 学位论文
  • 38 篇 期刊文献
  • 1 篇 会议

馆藏范围

  • 106 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 94 篇 工学
    • 78 篇 计算机科学与技术...
    • 69 篇 软件工程
    • 21 篇 仪器科学与技术
    • 5 篇 控制科学与工程
    • 4 篇 信息与通信工程
    • 3 篇 网络空间安全
    • 1 篇 机械工程
    • 1 篇 电子科学与技术(可...
    • 1 篇 农业工程
    • 1 篇 公安技术
  • 21 篇 管理学
    • 19 篇 管理科学与工程(可...
    • 2 篇 公共管理
    • 2 篇 图书情报与档案管...
    • 1 篇 工商管理
  • 5 篇 经济学
    • 5 篇 应用经济学
  • 3 篇 教育学
    • 3 篇 教育学
  • 2 篇 文学
    • 1 篇 中国语言文学
    • 1 篇 新闻传播学
  • 1 篇 法学
    • 1 篇 社会学
  • 1 篇 农学
    • 1 篇 植物保护
  • 1 篇 医学
  • 1 篇 艺术学
    • 1 篇 设计学(可授艺术学...

主题

  • 106 篇 分布式爬虫
  • 7 篇 大数据
  • 7 篇 搜索引擎
  • 6 篇 hadoop
  • 6 篇 情感分析
  • 5 篇 任务调度
  • 4 篇 scrapy
  • 4 篇 nutch
  • 4 篇 docker
  • 4 篇 文本分类
  • 4 篇 负载均衡
  • 3 篇 scrapy-redis
  • 3 篇 数据采集
  • 3 篇 hdfs
  • 3 篇 反爬虫
  • 3 篇 数据挖掘
  • 2 篇 django
  • 2 篇 网络爬虫
  • 2 篇 hadoop集群
  • 2 篇 map/reduce

机构

  • 13 篇 北京邮电大学
  • 8 篇 华中科技大学
  • 6 篇 南京邮电大学
  • 4 篇 哈尔滨工业大学
  • 4 篇 电子科技大学
  • 3 篇 北京交通大学
  • 3 篇 中国科学院大学
  • 3 篇 西安电子科技大学
  • 2 篇 江苏大学
  • 2 篇 武汉邮电科学研究...
  • 2 篇 浙江工业大学
  • 2 篇 华南理工大学
  • 2 篇 大连理工大学
  • 2 篇 山东青年政治学院
  • 2 篇 厦门大学
  • 2 篇 中国科学院计算机...
  • 2 篇 东北林业大学
  • 1 篇 中央民族大学
  • 1 篇 华南师范大学
  • 1 篇 国家计算机网络应...

作者

  • 2 篇 王攀
  • 2 篇 李新
  • 2 篇 金石
  • 2 篇 周逸
  • 2 篇 张露露
  • 2 篇 陈远平
  • 2 篇 方奇洲
  • 1 篇 曾学文
  • 1 篇 晋松
  • 1 篇 程亮
  • 1 篇 周尔宁
  • 1 篇 何西远
  • 1 篇 吕波
  • 1 篇 朱彬
  • 1 篇 张楠
  • 1 篇 任耀星
  • 1 篇 冯树荣
  • 1 篇 陈良锋
  • 1 篇 胡文涛
  • 1 篇 邰仕强

语言

  • 106 篇 中文
检索条件"主题词=分布式爬虫"
106 条 记 录,以下是1-10 订阅
排序:
基于资源感知的分布式爬虫任务调度方法
收藏 引用
现代电子技术 2024年 第9期47卷 86-90页
作者: 张军 魏继桢 李钰彬 东华理工大学信息工程学院 江西南昌330013
文中致力于开发一种基于资源感知的分布式爬虫任务调度方法,以优化分布式环境中各节点的系统资源利用,提升爬虫任务的执行效率。该方法通过引入资源感知调度算法和节点优先级管理,实现对节点中CPU、内存、网络等资源的监测,以便均衡调... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 博看期刊 评论
基于分布式爬虫的微博舆情监督与情感分析系统设计
收藏 引用
现代信息科技 2024年 第5期8卷 111-114,119页
作者: 何西远 张岳 张秉文 山东青年政治学院信息工程学院 山东济南250103
互联网的兴起使微博等自媒体平台成为网民表达意见的主要途径。同时,网络舆情的迅速传播使得网民舆论管理成为一个难题。针对传统方法在微博舆情管理上的局限性,文章设计一种基于分布式爬虫的微博舆情监测与情感分析系统,并借助情感分析... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
分布式爬虫任务调度策略的优化
收藏 引用
黑龙江大学自然科学学报 2016年 第5期33卷 671-675,701页
作者: 王霓虹 张露露 东北林业大学信息与计算机工程学院
针对当前分布式爬虫任务调度策略存在的节点任务分配不均、发生异常后引起的负载均衡问题,提出了一种基于SP-cycle算法的节点地址空间分配策略。通过该策略构造环形序列取代传统散列函数的节点地址空间映射方法,可使所有抓取服务器分配... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于双缓冲的分布式爬虫调度策略的设计与研究
收藏 引用
计算机与数字工程 2022年 第8期50卷 1686-1690页
作者: 卢照 师军 张耀午 王琦 运城学院数学与信息技术学院 运城044000 陕西师范大学计算机科学学院 西安710100
互联网的高速发展使得大数据的应用越来越广泛,使得分布式爬虫处于愈来愈重要的地位。目前主流开源爬虫框架在网络通信开销上优化甚少,缺乏一个有效的方案来减少网络开销问题。论文利用对等架构的爬行器既是任务的消费者又是任务的生... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
分布式爬虫下基于用户评论的商品标签提取
分布式爬虫下基于用户评论的商品标签提取
收藏 引用
作者: 周伟鹏 南京邮电大学
学位级别:硕士
随着网络新时代的到来,各种智能终端的不断普及,网上购物正越来越成为现代人们主流的购物方。在消费者进行网络购物的同时,也产生了海量的评论数据,而这些评论数据中蕴含着巨大的挖掘价值:对商品厂家来说,评论数据能够直观地反应出用... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
分布式爬虫的动态负载均衡方法研究
分布式爬虫的动态负载均衡方法研究
收藏 引用
作者: 付志辉 哈尔滨工业大学
学位级别:硕士
随着互联网的高速发展,搜索引擎成为互联网用户查找信息的第一入口,作为搜索引擎核心组件的网络爬虫用于在互联网上采集数据。现在网络信息正以指数级的速度不断膨胀,网页采集的完整性和实时性的难度越来越大,这给爬虫系统带来了巨大的... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
一种高效的分布式爬虫系统负载均衡策略
收藏 引用
计算机工程 2019年 第11期45卷 62-67页
作者: 张树涛 谭海波 陈良锋 吕波 中国科学院合肥物质科学研究院 合肥230039 中国科学技术大学研究生院 合肥230039
传统分布式爬虫系统负载均衡方法仅考虑少量的负载影响因素,未对各爬虫节点负载情况进行全面有效的评估,使得任务量的分配不合理。针对该问题,提出一种面向分布式爬虫系统的高效负载均衡策略。分析影响爬虫节点运行时间的因素,采用BP神... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
分布式爬虫任务调度与AJAX页面抓取研究
分布式爬虫任务调度与AJAX页面抓取研究
收藏 引用
作者: 李婷 电子科技大学
学位级别:硕士
随着互联网的迅速发展,数据呈现爆炸性增长,同时人们对数据的采集需求也与日俱增。网络爬虫作为数据获取的有效手段被广泛应用于各类系统中,诸如搜索引擎、舆情监控系统等。然而,面向中小规模系统的网络爬虫面临着两大难题:其一,单机爬... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
分布式爬虫技术研究与实现
分布式爬虫技术研究与实现
收藏 引用
作者: 马蕾 辽宁石油化工大学
学位级别:硕士
网络中的数据蕴藏着大量有价值信息,在实际的项目需求中,为了实现能够自动地对网页上大量数据信息的收集、解析、格化存储,提出了基于分布式的网络爬虫技术,探讨网络大数据的爬取和采集的实现方法和技术细节。通过分布式集群的搭建,将... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于GNP算法的分布式爬虫调度策略
收藏 引用
计算机应用研究 2010年 第2期27卷 446-449页
作者: 刘爽 姜春祥 张伟哲 李东 张鸿 哈尔滨工业大学计算机科学与技术学院 哈尔滨150001 国家计算机网络应急技术处理协调中心黑龙江分中心 哈尔滨150001 国家计算机网络应急技术处理协调中心 北京100029
针对分布式搜索引擎的任务调度及负载均衡问题,提出了基于GNP算法的分布式爬虫调度策略和负载均衡的方法。利用网络距离预估取代大规模的网络距离测量,不仅提高了系统的响应速度,还减少了系统对广域网造成的压力。通过在广域网上部署爬... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论