咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献
  • 1 篇 学位论文

馆藏范围

  • 2 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 2 篇 工学
    • 2 篇 仪器科学与技术

主题

  • 2 篇 标签树匹配算法
  • 1 篇 结构相似度
  • 1 篇 网页模板
  • 1 篇 web信息抽取技术
  • 1 篇 web聚类
  • 1 篇 树编辑距离
  • 1 篇 ctokens
  • 1 篇 web信息抽取

机构

  • 1 篇 华东师范大学
  • 1 篇 中山大学

作者

  • 1 篇 黄贵鹏
  • 1 篇 卢凤琴
  • 1 篇 聂卉

语言

  • 2 篇 中文
检索条件"主题词=标签树匹配算法"
2 条 记 录,以下是1-10 订阅
排序:
编辑距离在Web信息抽取中的应用与实现
收藏 引用
现代图书情报技术 2010年 第5期 29-34页
作者: 聂卉 黄贵鹏 中山大学资讯管理系 广州510275
引入编辑距离的概念,探讨如何构造标签,并利用标签树匹配算法来量化网页结构相似度。该算法被应用于Web信息抽取,通过URL相似度算法进行样本网页的粗聚类,进一步采用的相似度匹配算法实现细聚类,从而获取模板网页。在模板网页的基础... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
针对模板生成网页的数据自动抽取方法的探讨与应用
针对模板生成网页的数据自动抽取方法的探讨与应用
收藏 引用
作者: 卢凤琴 华东师范大学
学位级别:硕士
随着Internet的迅速发展,互联网已成为一个巨大的信息库,为了有效地利用互联网上的信息,各种Web信息抽取技术应运而生。目前,Web上的很多网页是网站根据用户请求从后台数据库中选取数据并嵌入到通用的模板中,并结合网站的特定需求而动... 详细信息
来源: 同方学位论文库 同方学位论文库 评论