咨询与建议

限定检索结果

文献类型

  • 10 篇 期刊文献
  • 4 篇 学位论文

馆藏范围

  • 14 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 13 篇 工学
    • 10 篇 计算机科学与技术...
    • 8 篇 软件工程
    • 1 篇 仪器科学与技术
    • 1 篇 电子科学与技术(可...
    • 1 篇 信息与通信工程
    • 1 篇 控制科学与工程
    • 1 篇 水利工程
  • 4 篇 管理学
    • 4 篇 管理科学与工程(可...

主题

  • 14 篇 标签路径
  • 5 篇 信息抽取
  • 3 篇 聚类
  • 2 篇 特征融合
  • 1 篇 deepweb
  • 1 篇 标签路径的支持度
  • 1 篇 半结构化数据
  • 1 篇 k双拟结构索引
  • 1 篇 文本块密度
  • 1 篇 svm
  • 1 篇 文本块
  • 1 篇 xml
  • 1 篇 xml查询
  • 1 篇 网络爬虫
  • 1 篇 模式抽取
  • 1 篇 支持向量机
  • 1 篇 分类鉴定
  • 1 篇 网页分割
  • 1 篇 关键词
  • 1 篇 标签路径的目标集

机构

  • 2 篇 武汉邮电科学研究...
  • 1 篇 华中科技大学
  • 1 篇 南京烽火星空通信...
  • 1 篇 沈阳建筑大学
  • 1 篇 江苏大学
  • 1 篇 山西工程职业技术...
  • 1 篇 西安电子科技大学
  • 1 篇 吉林大学
  • 1 篇 豫章师范学院
  • 1 篇 中国海洋大学
  • 1 篇 安徽建筑大学
  • 1 篇 广东工业大学
  • 1 篇 辽宁大学
  • 1 篇 合肥工业大学
  • 1 篇 广东轻工职业技术...
  • 1 篇 东北大学

作者

  • 2 篇 谢馨庭
  • 1 篇 韩子扬
  • 1 篇 钱贵平
  • 1 篇 石硕
  • 1 篇 余宏
  • 1 篇 马汉达
  • 1 篇 沈轶
  • 1 篇 张宇超
  • 1 篇 宋宝燕
  • 1 篇 陈成
  • 1 篇 孙焕良
  • 1 篇 于戈
  • 1 篇 孙平
  • 1 篇 彭艳兵
  • 1 篇 曹瑞
  • 1 篇 刘云峰
  • 1 篇 张巍
  • 1 篇 胡晓蓉
  • 1 篇 李久仲
  • 1 篇 谈凤真

语言

  • 14 篇 中文
检索条件"主题词=标签路径"
14 条 记 录,以下是1-10 订阅
排序:
L(k)-index:一种支持标签路径的高效k双拟结构索引
收藏 引用
计算机学报 2014年 第8期37卷 1732-1742页
作者: 李晓光 宋宝燕 于戈 王大玲 辽宁大学信息学院 沈阳110036 东北大学信息科学与工程学院 沈阳110004
针对基于k双拟的结构索引创建和更新低效问题、查询结果重复验证问题以及标签路径不可获得性问题,提出了一种新的结构索引L(k)-index.L(k)-index通过引入标签路径,在创建时无须k次遍历原数据,并采取批量更新策略,大大提高索引创建和更... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于视觉信息和标签路径的数据抽取
收藏 引用
中国海洋大学学报(自然科学版) 2015年 第5期45卷 114-119页
作者: 张巍 邹晓明 谈凤真 中国海洋大学信息科学与工程学院 山东青岛266100
结合网页的视觉信息和DOM树结构,研究从Deep Web查询结果页面中抽取半结构化数据的问题。通过视觉块与整个网页的面积比定位数据区域。根据数据记录两两相邻等视觉特征找到包含数据记录的一组节点,并通过比较各节点的DOM树结构的相似度... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于标签路径聚类的文本信息抽取算法
收藏 引用
计算机工程 2010年 第12期36卷 83-84,87页
作者: 刘云峰 山西工程职业技术学院网络电教中心 太原030009
针对网页噪音和网页非结构化信息抽取复杂度高的问题,提出一种基于标签路径聚类的文本信息抽取算法。对网页噪音进行预处理,根据网页的文档对象模型树结构进行标签路径聚类,通过自动训练的阈值和网页分割算法快速判定网页的关键部分,根... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于标签路径的Web结构化数据自动抽取
收藏 引用
计算机科学 2013年 第6A期40卷 141-144,165页
作者: 李贵 陈成 李征宇 韩子扬 孙平 孙焕良 沈阳建筑大学信息与控制工程系
提出了一种基于标签路径的Web结构化数据自动抽取方法。该方法通过对网页DOM树的解析获取完整标签路径集合,并依据路径相似度测量方法来聚类标签路径,实现目标数据区域的定位,然后通过标签节点坐标位置的特性来分离各个数据项,过滤冗余... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于标签路径和关键词特征的Web新闻抽取方法研究与实现
基于标签路径和关键词特征的Web新闻抽取方法研究与实现
收藏 引用
作者: 张宇超 西安电子科技大学
学位级别:硕士
随着互联网与HTML技术的发展,网络新闻成为新闻传播的主要方式,而网页中的导航栏、广告、备案信息等冗余信息却影响了人们对新闻内容的获取。为了让用户可以获得纯净的新闻内容,就需要对网页内容进行信息抽取,即从包含冗余信息的网页中... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
结合块密度和标签路径特征的网页正文抽取方法研究
结合块密度和标签路径特征的网页正文抽取方法研究
收藏 引用
作者: 刘鹏程 合肥工业大学
学位级别:硕士
随着互联网的飞速发展,Web逐渐成为很多应用的重要信息来源。大多数网页除了正文信息外,还包括导航、广告、推荐链接、版权申明等与网页主题内容无关的噪声信息。这些噪声信息降低了搜索引擎、Web新闻聚合、Web信息检索等应用系统的性... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于文本块密度与标签路径等特征的正文提取
收藏 引用
广东工业大学学报 2018年 第2期35卷 51-56页
作者: 杨贤 唐超兰 李航 广东工业大学艺术与设计学院 广东广州510090 广东工业大学计算机学院 广东广州510006
为了解决网页中除正文信息外还包含网页导航、广告和免责声明等噪声信息的问题,本文提出一种基于标签路径等多特征和文本块密度的正文提取方法.首先根据文本块密度特征确定正文区域,然后在区域内使用标签路径等特征剔去噪音节点,最后抽... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于标签路径特征融合的电子档案自动分类鉴定系统
收藏 引用
自动化技术与应用 2024年 第11期43卷 209-212,216页
作者: 汪伟 安徽建筑大学档案馆 安徽合肥230601
针对传统分类系统存在的信息检索性能差的问题,基于标签路径特征融合过程,设计了一种电子档案自动分类鉴定系统。将文档对象化模型树作为电子档案的数据结构,利用档案标签的元素节点与连续文本信息的文本节点构建基本数据集内容,结合文... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
非结构化Deep Web信息的自动抽取
非结构化Deep Web信息的自动抽取
收藏 引用
作者: 钱贵平 吉林大学
学位级别:硕士
本文针对非结构化DeepWeb探查得到的响应页面,提出了一种基于Java和DOM技术的查询结果相关信息的自动抽取方法。 该方法将探查得到的响应页面作为样本,通过响应页面的比对,自动抽取查询结果的相关信息。首先,通过比对同一查询的两个响... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于单DOM树特征预分类的自适应Web信息抽取方法
基于单DOM树特征预分类的自适应Web信息抽取方法
收藏 引用
作者: 谢馨庭 武汉邮电科学研究院
学位级别:硕士
进入网络时代,人们习以为常地使用互联网介质来表达和传播自己对社会对生活和网络事件的热点、焦点所持有的情感、态度和观点,这些信息留在网络中的持续影响力,形成了大家通常说的“网络舆情”,即网络舆论动态,这些动态是政府部门了解... 详细信息
来源: 同方学位论文库 同方学位论文库 评论