咨询与建议

限定检索结果

文献类型

  • 10 篇 期刊文献
  • 7 篇 学位论文

馆藏范围

  • 17 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 14 篇 工学
    • 12 篇 计算机科学与技术...
    • 8 篇 软件工程
    • 2 篇 网络空间安全
    • 1 篇 机械工程
    • 1 篇 仪器科学与技术
    • 1 篇 电子科学与技术(可...
    • 1 篇 信息与通信工程
    • 1 篇 生物医学工程(可授...
  • 2 篇 理学
    • 1 篇 数学
    • 1 篇 系统科学
  • 2 篇 管理学
    • 2 篇 管理科学与工程(可...
  • 1 篇 文学
    • 1 篇 新闻传播学

主题

  • 17 篇 minhash
  • 2 篇 mapreduce
  • 2 篇 协同过滤
  • 2 篇 算法实现
  • 2 篇 文本聚类
  • 2 篇 simhash
  • 2 篇 jaccard系数
  • 1 篇 云存储
  • 1 篇 单分子测序技术
  • 1 篇 资源签名
  • 1 篇 社会机会网络
  • 1 篇 分布式
  • 1 篇 hadoop
  • 1 篇 三角不等式
  • 1 篇 共现矩阵
  • 1 篇 mapreduce框架
  • 1 篇 相似度估计
  • 1 篇 lda
  • 1 篇 随机森林
  • 1 篇 集合

机构

  • 4 篇 东华大学
  • 2 篇 北京邮电大学
  • 1 篇 高可信软件技术教...
  • 1 篇 science and tech...
  • 1 篇 宁波大学
  • 1 篇 长沙理工大学
  • 1 篇 北京大学
  • 1 篇 宝鸡职业技术学院
  • 1 篇 深圳大学
  • 1 篇 北京工业大学
  • 1 篇 哈尔滨工程大学
  • 1 篇 中国科学院国家授...
  • 1 篇 中国科学院大学
  • 1 篇 宁夏大学
  • 1 篇 上海市浦东新区电...
  • 1 篇 温州广播电视大学
  • 1 篇 school of cyber ...
  • 1 篇 浙江理工大学
  • 1 篇 贵州大学
  • 1 篇 faculty of intel...

作者

  • 2 篇 吴西送
  • 1 篇 黄如强
  • 1 篇 崔浩翔
  • 1 篇 罗雄才
  • 1 篇 le gao
  • 1 篇 郑亮亮
  • 1 篇 fengwei wang
  • 1 篇 牛少彰
  • 1 篇 吴云
  • 1 篇 王洪亚
  • 1 篇 刘轩甫
  • 1 篇 高军
  • 1 篇 邹敏
  • 1 篇 王安瑾
  • 1 篇 刘丹丹
  • 1 篇 武佳南
  • 1 篇 孙延青
  • 1 篇 李融
  • 1 篇 吴博文
  • 1 篇 黄瑞章

语言

  • 16 篇 中文
  • 1 篇 英文
检索条件"主题词=Minhash"
17 条 记 录,以下是1-10 订阅
排序:
基于Mahout的minhash算法研究与实现
基于Mahout的MinHash算法研究与实现
收藏 引用
作者: 吴西送 东华大学
学位级别:硕士
在很多应用领域中,需要处理的数据往往是海量的并且具有很高的维度。近年来,随着大数据研究领域的兴起,针对高维数据的最近邻查找问题已经得到广泛的应用和研究。精确最近邻查找的查询代价非常大,近似最近邻查找与精确最近邻查找相... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
分布式平台下minhash算法研究与实现
收藏 引用
智能计算机与应用 2014年 第6期4卷 44-46页
作者: 王洪亚 吴西送 任建军 赵银龙 东华大学计算机科学与技术学院 上海201620
minhash作为位置敏感哈希(LSH)算法中的一种,可以用来快速估算两个集合的相似度,查找网络上的重复网页或者相似新闻网页,minhash算法使用Jaccard相似度来度量对象的相似程度。本文针对minhash算法在分布式平台上的实现和性能表现进行分... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
一种基于minhash的改进新闻文本聚类算法
收藏 引用
计算机技术与发展 2019年 第2期29卷 39-42页
作者: 王安瑾 东华大学计算机科学与技术学院 上海200000
信息技术的不断发展,带来的是网络上新闻文本的快速增长,面对大量的新闻文本,对其进行有效聚类就显得十分重要。基于上述需求,提出一种基于minhash的DBSCAN聚类算法。针对传统向量空间模型文本聚类存在的数据维度高、计算复杂度大、资... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于minhash的协同过滤技术在推荐系统中的应用
收藏 引用
微型电脑应用 2017年 第10期33卷 67-70页
作者: 刘艾侠 刘丹丹 宝鸡职业技术学院 宝鸡721013 中国科学院大学 北京100039 中国科学院国家授时中心 西安710600
传统协同过滤的推荐机制应用在大规模数据上时,如果在要保证推荐质量会导致占用运行时间和存储空间的增加。研究分析了minhash在大规模数据上的降维原理,论证了将minhash应用到协同过滤,设计并实现基于minhash算法的协同过滤模型。实验... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
Practical and privacy-preserving geo-social-based POI recommendation
收藏 引用
Journal of Information and Intelligence 2024年 第2期2卷 148-166页
作者: Qi Xu Hui Zhu Yandong Zheng Fengwei Wang Le Gao School of Cyber Engineering Xidian UniversityXi'an 710126China Science and Technology on Communication Networks Laboratory Shijiazhuang 050081China Faculty of Intelligent Manufacturing Wuyi UniversityJiangmen 529020China
With the rapid development of location-based services and online social networks,POI recommendation services considering geographic and social factors have received extensive ***,the vigorous development of cloud comp... 详细信息
来源: 维普期刊数据库 维普期刊数据库 评论
基于资源签名的Android应用相似性快速检测方法
收藏 引用
电子学报 2019年 第9期47卷 1913-1918页
作者: 张鹏 牛少彰 黄如强 北京邮电大学智能通信软件与多媒体北京市重点实验室 北京100876 宁夏大学信息工程学院 宁夏银川750021
由于盗版Android应用(Android Application,简称APP)通常保持着与正版APP相似的用户体验,因此本文提出一种基于资源签名的APP相似性快速检测方法.该方法将APP的资源签名视为字符串集合,利用计算任意一对APP资源签名集合的Jaccard系数判... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
面向Top-k快速查询的层次化LSH索引方法
收藏 引用
计算机研究与发展 2015年 第S1期52卷 56-63页
作者: 罗雄才 高军 北京大学信息科学技术学院 北京100871 高可信软件技术教育部重点实验室(北京大学) 北京100871
局部敏感哈希(locality sensitive hashing,LSH)用于在海量高维数据中检索相似的数据项,它能高效地返回相似度大于用户给定阈值的数据对.但是,由于需要设置固定阈值,LSH无法直接处理Top-k相似查询.传统LSH索引算法需要设置一系列阈值,... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
MR-GSpar:一种基于MapReduce的大图稀疏化算法
收藏 引用
计算机科学 2013年 第10期40卷 190-193,212页
作者: 陈德华 周蒙 孙延青 郑亮亮 东华大学计算机科学与技术学院 上海201620 上海市浦东新区电子政务管理中心 上海200135
图的稀疏化是图聚类分析中数据预处理的关键操作,已得到广泛的关注。针对图数据日益普及、规模不断增大的现状,提出了一种基于MapReduce的面向大规模图的稀疏化算法,即MR-GSpar算法。该算法在MapReduce并行计算框架的基础上,通过对传统... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
一种基于Hadoop的文本相似度仿真检测模型
收藏 引用
新疆大学学报(自然科学版) 2017年 第3期34卷 308-315页
作者: 吴云 许抗震 黄瑞章 贵州大学计算机科学与技术学院 贵州贵阳550025
随着信息时代数据量成倍的增长,传统的文本相似度检测方法已经无法处理大规模的文本数据.为此,提出了一种基于Hadoop集群技术的文本相似度仿真检测模型.该检测模型分为三步:第一步,利用Hadoop工具搭建实验平台,并针对该平台进行硬件和... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
第三代DNA测序数据压缩方法研究
第三代DNA测序数据压缩方法研究
收藏 引用
作者: 崔浩翔 深圳大学
学位级别:硕士
第三代测序技术自问世以来在临床分子诊断中扮演着越来越重要的角色,尤其在基因组测序、甲基化研究、突变鉴定(SNP检测)等方面。测序技术的不断发展使得测序成本逐年下降,测序数据量急剧增加,如何存储和传输庞大的测序数据是当前亟需... 详细信息
来源: 同方学位论文库 同方学位论文库 评论