咨询与建议

限定检索结果

文献类型

  • 14 篇 期刊文献
  • 8 篇 学位论文

馆藏范围

  • 22 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 22 篇 工学
    • 15 篇 计算机科学与技术...
    • 13 篇 软件工程
    • 12 篇 仪器科学与技术
    • 5 篇 控制科学与工程
    • 1 篇 网络空间安全
  • 6 篇 管理学
    • 6 篇 管理科学与工程(可...
  • 1 篇 艺术学
    • 1 篇 设计学(可授艺术学...

主题

  • 22 篇 垃圾网页检测
  • 4 篇 垃圾网页
  • 4 篇 支持向量机
  • 3 篇 随机森林
  • 3 篇 欠采样
  • 3 篇 搜索引擎
  • 2 篇 特征选择
  • 2 篇 特征提取
  • 2 篇 决策树
  • 2 篇 c4.5分类算法
  • 2 篇 协同训练
  • 2 篇 多视图分类
  • 2 篇 典型相关分析
  • 2 篇 集成学习
  • 2 篇 机器学习
  • 1 篇 排序算法
  • 1 篇 非信任值排序算法
  • 1 篇 id3算法
  • 1 篇 重构数据集
  • 1 篇 多类特征

机构

  • 6 篇 西南交通大学
  • 4 篇 山东师范大学
  • 3 篇 南昌大学
  • 3 篇 云南师范大学
  • 2 篇 江西理工大学
  • 2 篇 山东省分布式计算...
  • 2 篇 云南大学
  • 1 篇 元智大学
  • 1 篇 北京工业大学
  • 1 篇 大连理工大学
  • 1 篇 华北电力大学
  • 1 篇 宁德职业技术学院
  • 1 篇 北京邮电大学
  • 1 篇 中国石油大庆石化...
  • 1 篇 南昌市虚拟数字工...

作者

  • 5 篇 陈木生
  • 3 篇 卢晓勇
  • 3 篇 贾志洋
  • 3 篇 高爽
  • 2 篇 韦莎
  • 2 篇 李法良
  • 2 篇 房晓南
  • 2 篇 朱焱
  • 2 篇 夏幼明
  • 2 篇 李伟伟
  • 2 篇 吴俊华
  • 2 篇 高炜
  • 2 篇 张化祥
  • 1 篇 刘寒
  • 1 篇 曾俊东
  • 1 篇 谭博觉
  • 1 篇 朱华丽
  • 1 篇 高切
  • 1 篇 聂祥谦
  • 1 篇 刘楚骁

语言

  • 22 篇 中文
检索条件"主题词=垃圾网页检测"
22 条 记 录,以下是1-10 订阅
排序:
混合采样与遗传算法相结合的垃圾网页检测
收藏 引用
北京邮电大学学报 2019年 第6期42卷 111-117页
作者: 刘寒 北京邮电大学软件学院 北京100876 北京邮电大学可信分布式计算与服务教育部重点实验室 北京100876
垃圾网页检测存在数据不平衡、特征空间维度较高的问题,为此,提出一种基于随机混合采样和遗传算法的集成分类算法.首先,使用随机混合采样技术,通过随机抽样,减少多数类样本数量,用少数类样本合成过采样技术方法生成少数类样本,获得多个... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
垃圾网页检测的关键技术研究
垃圾网页检测的关键技术研究
收藏 引用
作者: 韦莎 西南交通大学
学位级别:硕士
网页作弊是指作弊者运用各种手段欺骗搜索引擎,使网页在搜索结果中获得高于其本身应得排名的行为。垃圾网页的泛滥严重危害了搜索引擎公司、合法网站和各类用户的利益,因此研究垃圾网页检测技术已成为一项艰巨而重要的任务。针对链接作... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于多视图典型相关分析的垃圾网页检测
收藏 引用
计算机应用研究 2013年 第3期30卷 810-813页
作者: 高爽 张化祥 房晓南 山东师范大学信息科学与工程学院 济南250014 山东省分布式计算机软件新技术重点实验室 济南250014
首先将垃圾网页特征分为两个不同的视图,即基于内容特征的视图和基于链接特征的视图,利用典型相关分析及其相关改进方法进行特征提取,生成两组新的特征;再对新生成的两视图特征采用不同组合方式产生单视图数据,并用这组数据作为训练数... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
集成PCA降维与分类算法的垃圾网页检测
收藏 引用
计算机应用与软件 2014年 第10期31卷 269-272页
作者: 李法良 朱焱 曾俊东 西南交通大学信息科学与技术学院 四川成都610031
针对垃圾网页的内容特征和链接特征,设计一种集成主成分分析PCA(Principal Component Analysis)与支持向量机分类算法的垃圾网页检测方法。该方法使用PCA来提取网页样本特征的主成分,使用主成分特征训练支持向量机(SVM)分类器。训练过... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
三种用于垃圾网页检测的随机欠采样集成分类器
收藏 引用
计算机应用 2017年 第2期37卷 535-539,558页
作者: 陈木生 卢晓勇 南昌大学信息工程学院 江西南昌330031 南昌大学软件学院 江西南昌330047
针对垃圾网页检测过程中轻微的不平衡分类问题,提出三种随机欠采样集成分类器算法,分别为一次不放回随机欠采样(RUS-once)、多次不放回随机欠采样(RUS-multiple)和有放回随机欠采样(RUS-replacement)算法。首先使用其中一种随机欠采样... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于独立成分分析和协同训练的垃圾网页检测
收藏 引用
山东大学学报(工学版) 2013年 第2期43卷 29-34,41页
作者: 高爽 张化祥 房晓南 山东师范大学信息科学与工程学院 山东济南250014 山东省分布式计算机软件新技术重点实验室 山东济南250014
垃圾网页检测具有重要意义,由于只有少量标记网页,所以可使用半监督协同训练方法检测垃圾网页。将网页特征分为两个视图,即内容视图与链接视图。首先使用独立成分分析分别提取两视图特征的独立成分,然后进行协同训练。实验结果表明,该... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
改进样本加权K近邻分类器用于垃圾网页检测
收藏 引用
重庆理工大学学报(自然科学) 2021年 第7期35卷 283-290页
作者: 吴俊华 谭博觉 高切 陈木生 江西理工大学软件工程学院 南昌330013
针对垃圾网页检测过程中的"维数灾难"和不平衡分类问题,提出一种融合最优Fisher特征选择的样本加权K近邻分类器用于垃圾网页检测。首先,针对训练数据集进行Fisher特征选择,按Fisher Score从大到小排序,依次选择Fisher Score更大的特征... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于随机森林和欠采样集成的垃圾网页检测
收藏 引用
计算机应用 2016年 第3期36卷 731-734页
作者: 卢晓勇 陈木生 南昌大学软件学院 南昌330047 南昌大学信息工程学院 南昌330031
为解决垃圾网页检测过程中的不平衡分类和"维数灾难"问题,提出一种基于随机森林(RF)和欠采样集成的二元分类器算法。首先使用欠采样技术将训练样本集大类抽样成多个子样本集,再将其分别与小类样本集合并构成多个平衡的子训练样本集;然... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于免疫克隆特征选择和欠采样集成的垃圾网页检测
收藏 引用
计算机应用 2016年 第7期36卷 1899-1903页
作者: 卢晓勇 陈木生 吴政隆 张百栈 南昌大学软件学院 南昌330047 南昌大学信息工程学院 南昌330031 元智大学资讯学院 台湾桃园32003
为解决垃圾网页检测过程中的"维数灾难"和不平衡分类问题,提出一种基于免疫克隆特征选择和欠采样(US)集成的二元分类器算法。首先,使用欠采样技术将训练样本集大类抽样成多个与小类样本数相近的样本集,再将其分别与小类样本合并构成多... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
多视图学习在垃圾网页检测中的应用研究
多视图学习在垃圾网页检测中的应用研究
收藏 引用
作者: 高爽 山东师范大学
学位级别:硕士
现在网络极大地改变了人们表达自己和与他人互动的方式,已经成为最主要的信息检索方式。正因如此,向HTML页面或其他网络文件添加信息也变得越来越容易,同时用户就会更难分辨准确和不准确的信息或可信赖和不可靠的信息,因此创建一个... 详细信息
来源: 同方学位论文库 同方学位论文库 评论