咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程

主题

  • 1 篇 自适应主题模型
  • 1 篇 用户定制主题爬虫
  • 1 篇 best-first策略
  • 1 篇 聚焦爬虫
  • 1 篇 k-means

机构

  • 1 篇 清华大学

作者

  • 1 篇 黄永峰
  • 1 篇 闵钰麟

语言

  • 1 篇 中文
检索条件"主题词=best-first策略"
1 条 记 录,以下是1-10 订阅
排序:
用户定制主题聚焦爬虫的设计与实现
收藏 引用
计算机工程与设计 2015年 第1期36卷 17-21页
作者: 闵钰麟 黄永峰 清华大学电子工程系信息认知与智能系统研究所 北京100084 清华大学信息科学与技术国家实验室 北京100084
传统的聚焦爬虫在主题未知或者缺少相应训练集的情况下无法完成主题爬行。为让聚焦爬虫具有更好的主题适应性,提出基于聚类算法的自适应主题模型,指导聚焦爬虫在只有少量相同主题(主题未知)初始url的情况下完成主题爬行。通过对初始页... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论