咨询与建议

限定检索结果

文献类型

  • 2 篇 学位论文
  • 1 篇 期刊文献

馆藏范围

  • 3 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 3 篇 工学
    • 2 篇 仪器科学与技术
    • 2 篇 计算机科学与技术...
    • 2 篇 软件工程

主题

  • 3 篇 主数据区域
  • 2 篇 聚类算法
  • 2 篇 树编辑距离
  • 1 篇 局部模式
  • 1 篇 数据记录
  • 1 篇 web实体
  • 1 篇 全局模式
  • 1 篇 网页信息抽取
  • 1 篇 属性标签
  • 1 篇 web数据集成
  • 1 篇 数据记录抽取

机构

  • 2 篇 中国石油大学
  • 1 篇 山东大学
  • 1 篇 枣庄学院

作者

  • 1 篇 祝美莲
  • 1 篇 徐秀星
  • 1 篇 刘晓波
  • 1 篇 宫丽娜

语言

  • 3 篇 中文
检索条件"主题词=主数据区域"
3 条 记 录,以下是1-10 订阅
排序:
Web数据集成中全局模式构建方法研究
Web数据集成中全局模式构建方法研究
收藏 引用
作者: 徐秀星 山东大学
学位级别:硕士
随着计算机及互联网技术的快速发展,Web上的信息量也随之急剧的增长,使得Web成为巨大的分布广泛的数据源。随着各行业对信息的需求越来越高,而有效的整合Web上的海量的异构的数据是一件困难的事情,因而人们提出Web数据集成技术。Web数... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于树编辑距离的网页信息抽取
基于树编辑距离的网页信息抽取
收藏 引用
作者: 刘晓波 中国石油大学(华东)
学位级别:硕士
近年来,随着国际互联网的高速发展,电子商务行业得到极大扩展,国内的天猫、京东网以及亚马逊网的发展更为突出显著。电子商务网站的网页往往对商品的信息进行了描述,多数网页都提供用户查询的接口,并通过数据库将数据以列表的方式呈现... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于树编辑距离的聚类算法数据记录抽取
收藏 引用
赤峰学院学报(自然科学版) 2013年 第12期29卷 28-30页
作者: 宫丽娜 祝美莲 枣庄学院 山东枣庄277160 中国石油大学(华东) 山东青岛266580
本文研究了如何从列表页面中抽取数据记录.系统分为两个阶段:第一步采用三种启发式方法相结合的方法,识别主数据区域的根节点;第二步将数据记录分离,提出了一种新的基于树编辑距离的聚类算法,来减少候选分割方案的数量,然后根据公式计... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论