咨询与建议

限定检索结果

文献类型

  • 17 篇 学位论文
  • 8 篇 期刊文献
  • 1 篇 会议

馆藏范围

  • 26 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 22 篇 工学
    • 15 篇 计算机科学与技术...
    • 13 篇 软件工程
    • 9 篇 仪器科学与技术
    • 1 篇 公安技术
  • 4 篇 管理学
    • 3 篇 管理科学与工程(可...
    • 1 篇 图书情报与档案管...
  • 1 篇 文学
    • 1 篇 新闻传播学

主题

  • 26 篇 网页信息提取
  • 2 篇 文本特征
  • 2 篇 结构相似性
  • 2 篇 网页分类
  • 2 篇 包装器
  • 2 篇 搜索引擎
  • 2 篇 垂直搜索引擎
  • 2 篇 卷积神经网络
  • 1 篇 解析dom树
  • 1 篇 结构特征
  • 1 篇 结构相似度
  • 1 篇 python语言
  • 1 篇 半结构化
  • 1 篇 长期趋势预测
  • 1 篇 匹配规则
  • 1 篇 特征选择
  • 1 篇 累积平均密度
  • 1 篇 分布式
  • 1 篇 房源信息服务
  • 1 篇 相连的簇

机构

  • 5 篇 大连理工大学
  • 3 篇 电子科技大学
  • 2 篇 复旦大学
  • 2 篇 北京邮电大学
  • 2 篇 贵州大学
  • 2 篇 浙江大学
  • 1 篇 华中科技大学
  • 1 篇 湖南大学
  • 1 篇 中国科学院大学
  • 1 篇 苏州机电高等职业...
  • 1 篇 哈尔滨理工大学
  • 1 篇 西北师范大学
  • 1 篇 贵州轻工职业技术...
  • 1 篇 西藏大学
  • 1 篇 中国互联网络信息...
  • 1 篇 重庆大学
  • 1 篇 北京大学
  • 1 篇 苏州大学
  • 1 篇 贵州省公共大数据...

作者

  • 3 篇 张瑞雪
  • 2 篇 李文立
  • 2 篇 宋明秋
  • 2 篇 翁彬月
  • 1 篇 谢修远
  • 1 篇 耿光刚
  • 1 篇 郑旭
  • 1 篇 何伟
  • 1 篇 吴晓彦
  • 1 篇 罗潘
  • 1 篇 李晓东
  • 1 篇 珠杰
  • 1 篇 田悦霖
  • 1 篇 顾轶灵
  • 1 篇 黄瑞章
  • 1 篇 吴新涛
  • 1 篇 汪建伟
  • 1 篇 李阳
  • 1 篇 胡博磊
  • 1 篇 郑骁庆

语言

  • 26 篇 中文
检索条件"主题词=网页信息提取"
26 条 记 录,以下是1-10 订阅
排序:
NEMTF:基于多维度文本特征的新闻网页信息提取方法
收藏 引用
计算机应用研究 2022年 第4期39卷 1043-1048页
作者: 翁彬月 秦永彬 黄瑞章 任丽娜 田悦霖 贵州大学计算机科学与技术学院 贵阳550025 贵州省公共大数据重点实验室 贵阳550025 贵州轻工职业技术学院 贵阳550025
目前主流的网页抽取方法存在两大问题:提取信息类型单一,难以获取多种类新闻信息;多依赖HTML标签,难以扩展至不同来源。为此提出一种基于多维度文本特征的新闻网页信息提取方法,利用新闻文本的写作特点划分出写作、语义和位置特征,通过... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于HTML Parser的网页信息提取技术研究
收藏 引用
西藏大学学报(社会科学版) 2010年 第3期25卷 41-44页
作者: 珠杰 罗潘 西藏大学工学院 西藏拉萨850000
在互联网上信息量激增,迫切需要一些自动化工具帮助人们在海量信息源中迅速找到真正需要的信息。文章基于开源项目HTMLParser包,以提取中关村笔记本频道产品信息的文本信息和图片信息为例,提出了信息提取系统设计方案,给出了文字信息和... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
视频下载及网页信息提取系统设计与实现
视频下载及网页信息提取系统设计与实现
收藏 引用
作者: 郑旭 大连理工大学
学位级别:硕士
随着我国视频网络的迅猛发展,涌现了大量的视频网站,为用户提供了丰富的视频资源。但由于我国视频用户的使用习惯和国内行业的发展状况,我国视频网站的发展正面临瓶颈,需充实视频源以扩大受众。本文以与中国某网络电视台合作的项目为基... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于文本特征的新闻网页信息提取方法研究
基于文本特征的新闻网页信息提取方法研究
收藏 引用
作者: 翁彬月 贵州大学
学位级别:硕士
新闻网页以简明扼要的文字,迅速及时地报道国内外新近发生的、有价值的事件信息,是广大互联网用户的信息来源之一。如何有效提取新闻网页信息受到越来越多的关注。近年来,随着用户对新闻数据质量要求的提高,以及网页新闻不断升级的多媒... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
融合样式布局特征的跨网站网页信息提取技术研究
融合样式布局特征的跨网站网页信息提取技术研究
收藏 引用
作者: 谢修远 华中科技大学
学位级别:硕士
网页信息提取旨在自动从网页提取指定的数据,是很多下游任务的数据源头。如何高质高效地从海量网站中提取信息是一直在研究的问题,早期方法通过对每个网站提供少量提取示例能达到很高的精度,但人工开销会随网站数增长。后来有研究利... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
一种基于显示属性的网页信息提取方法
一种基于显示属性的网页信息提取方法
收藏 引用
全国网络与信息安全技术研讨会
作者: 汪建伟 高军 王腾蛟 杨冬青 北京大学信息科学技术学院 北京大学信息科学技术学院 北京大学信息科学技术学院 北京大学信息科学技术学院
在目前的 Web 信息提取技术中,很多都是基于 HTML 结构的,由于 HTML 结构的经常变化, 使提取模板需要经常更新,而提取模板的更新需要很多领域知识。本文提出一种基于显示属性的 Web 信息提取方法,通过将网页文本按照其显示属性的不同进... 详细信息
来源: cnki会议 评论
一种新闻网页关键信息提取算法
收藏 引用
计算机应用 2016年 第8期36卷 2082-2086,2120页
作者: 向菁菁 耿光刚 李晓东 中国互联网络信息中心 北京100190 中国科学院大学计算机网络信息中心 北京100190
针对网页正文提取算法缺乏通用性,以及对新闻网页提取缺乏标题、时间、来源信息的问题,提出一种新闻关键信息提取算法news Extractor。该算法首先通过预处理将网页转换成行号和文本的集合,然后根据字数最长的一句话出现在新闻正文... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于网页信息自动提取的分布式爬虫系统设计与实现
基于网页信息自动提取的分布式爬虫系统设计与实现
收藏 引用
作者: 杨本栋 北京邮电大学
学位级别:硕士
数据爆发式增长,大数据时代到来,互联网每天产生难以计数且各式各样的数据。这些数据蕴含的信息具有巨大的研究价值和商业价值。学者及企业希望获取知识类、资讯类、政策法规类等文章型网页中有价值的信息,不仅要求数据量大、格式规范... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于网页列表的商品信息自动提取关键技术研究
基于网页列表的商品信息自动提取关键技术研究
收藏 引用
作者: 彭勇 浙江大学
学位级别:硕士
电子商务的普及使得利用电子商务进行购物的用户飞速增长,但随着网络上的商品信息越来越多,如何快速有效地从海量的商品信息中选择出用户需要的商品成为用户关心的重要问题。现有的互联网上商品信息大都是半结构化的数据,同时不同的网... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
网页正文信息抽取新方法
收藏 引用
大连理工大学学报 2009年 第4期49卷 594-597页
作者: 宋明秋 张瑞雪 吴新涛 李文立 大连理工大学系统工程研究所 辽宁大连116024
基于包装器的信息抽取方法只能处理一种特定的信息源,而且对网页结构的依赖性强.基于此提出了一种将中文标点符号和HTML树结构作为识别网页正文内容重要特征的网页分析方法,通过统计中文标点符号确定部分正文信息,然后根据正文信息在结... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论