咨询与建议

限定检索结果

文献类型

  • 8 篇 学位论文
  • 6 篇 期刊文献
  • 1 篇 会议

馆藏范围

  • 15 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 14 篇 工学
    • 14 篇 计算机科学与技术...
    • 14 篇 软件工程
    • 1 篇 机械工程
  • 1 篇 文学
    • 1 篇 新闻传播学
  • 1 篇 管理学
    • 1 篇 图书情报与档案管...

主题

  • 15 篇 语义指纹
  • 5 篇 simhash
  • 3 篇 文本去重
  • 2 篇 信息检索
  • 2 篇 文本相似
  • 2 篇 同义词扩展
  • 1 篇 文本侵权检测
  • 1 篇 语义相似度
  • 1 篇 姓名消歧
  • 1 篇 潜在语义分析(lsa...
  • 1 篇 理论计算机科学
  • 1 篇 语义知识
  • 1 篇 文本表示
  • 1 篇 百科全书
  • 1 篇 热点事件
  • 1 篇 敏感舆论倾向
  • 1 篇 bert
  • 1 篇 词向量
  • 1 篇 互信息
  • 1 篇 云模型

机构

  • 4 篇 华中师范大学
  • 2 篇 北京邮电大学
  • 1 篇 东南大学
  • 1 篇 国家数字化学习工...
  • 1 篇 中国工程物理研究...
  • 1 篇 中国工程物理研究...
  • 1 篇 江西财经大学
  • 1 篇 延边大学
  • 1 篇 中国科学技术信息...
  • 1 篇 武汉大学
  • 1 篇 中国科学技术信息...
  • 1 篇 国家语言资源监测...
  • 1 篇 北京信息科技大学

作者

  • 2 篇 姜雪
  • 2 篇 韩红旗
  • 2 篇 李仲
  • 1 篇 陶以政
  • 1 篇 潘霄航
  • 1 篇 董诚
  • 1 篇 于永胜
  • 1 篇 吴国仕
  • 1 篇 杨柳
  • 1 篇 涂新辉
  • 1 篇 周汝佳
  • 1 篇 何婷婷
  • 1 篇 张运良
  • 1 篇 梁燕
  • 1 篇 崔彤彤
  • 1 篇 骆超
  • 1 篇 孟琼瑶
  • 1 篇 李晶
  • 1 篇 翟晓瑞
  • 1 篇 陈露

语言

  • 14 篇 中文
  • 1 篇 英文
检索条件"主题词=语义指纹"
15 条 记 录,以下是1-10 订阅
排序:
基于语义指纹的中文文本快速去重
收藏 引用
现代图书情报技术 2013年 第9期 41-47页
作者: 李纲 毛进 陈璟浩 武汉大学信息资源研究中心 武汉430072
针对中文文本,抽取出文本内容特征,结合Simhash算法生成中文文本的语义指纹,通过语义指纹的海明距离判断文本间相似程度。整合Single-Pass快速聚类算法对语义指纹快速聚类,所得的语义指纹聚类即为文本去重的最终结果,从而实现面向中文... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于语义指纹关联的网络事件热度分析方法研究
基于语义指纹关联的网络事件热度分析方法研究
收藏 引用
作者: 孟琼瑶 华中师范大学
学位级别:硕士
随着互联网的快速发展,网络媒体应运而生,传统媒体公司也随之建立了新闻发布网站。网络传播的快捷性、互动性、开放性等特点使得民众可以快速关注网络上的热点事件,发表看法、参与讨论。随着民众的关注,负面热点事件的事件破坏力可能会... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于语义指纹和云模型的动态词义变化程度研究
基于语义指纹和云模型的动态词义变化程度研究
收藏 引用
作者: 潘霄航 华中师范大学
学位级别:硕士
词作为语言的基础,具有相对的稳定性。但是语言是不断往前发展的,作为语言的一种成分,词又具备着语言的发展变化性。随着互联网的发展,信息成指数级增长。在网络这样特殊的环境下,许多汉语词语的语义发生了显著的变化。如何深入了解网... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于语义指纹和Simhash的文本去重方法研究
基于语义指纹和Simhash的文本去重方法研究
收藏 引用
作者: 周汝佳 江西财经大学
学位级别:硕士
随着不同类型的信息数据的增加,用户能够获取的信息量不断增多,因此搜索信息过程中投入的成本也随之提高。从信息资源集合中去除重复内容是信息资源管理的一项重要工作,可以提高用户使用信息资源的效率。目前,信息内容去重已经被应用到... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于主题和语义指纹融合的学术论文粗分类方法研究
基于主题和语义指纹融合的学术论文粗分类方法研究
收藏 引用
作者: 崔彤彤 延边大学
学位级别:硕士
互联网、物联网、云计算等信息技术把我们带到了多元智能的网络化大数据时代。然而,大量的资源共享和实时的交流探讨使网络空间中的数据呈爆炸式增长,其规模巨大且形式多样,不仅给网络空间数据的存储带来了压力,同时降低了数据价值的利... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于语义指纹和LCS的文本去重方法
收藏 引用
软件 2014年 第11期35卷 25-30页
作者: 陈露 吴国仕 李晶 北京邮电大学软件学院 北京100000
为了解决传统中文文本去重准确率低的问题,本文提出了一种基于语义指纹和LCS的文本去重方法。针对中文文本,预处理后抽取出文本摘要,然后使用tf-idf算法分别得出文本内容特征向量和摘要特征向量,分别将这两个向量作为simhash算法的输入... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于语义指纹的海量文本快速相似检测算法研究
收藏 引用
电脑知识与技术 2016年 第12X期12卷 175-177页
作者: 姜雪 万正景 梁燕 陶以政 中国工程物理研究院计算机应用研究所 四川绵阳621900
相似检测算法在海量文本信息处理中具有广泛的应用,尤其是Simhash算法因其指纹局部敏感特性、检测效率高在文本查重、网页检测等大规模数据处理中都十分常见。针对传统Simhash算法无法支持近义词、多义词等自然语言处理上的语义问题,通... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
社交网络中意见领袖的敏感舆论倾向识别
收藏 引用
计算机工程与设计 2021年 第11期42卷 3293-3300,F0003页
作者: 宋振 徐雅斌 北京信息科技大学计算机学院 北京100101 北京信息科技大学网络文化与数字传播北京市重点实验室 北京100101
为准确识别意见领袖的敏感舆论倾向,有效把控敏感类舆情的发展,提出基于多任务学习的敏感舆论倾向识别模型(MTL-SA-LSTM)和基于指纹汇聚技术的快速识别模型。以准确识别意见领袖的敏感舆论倾向为目标,兼顾其识别效率。采用指纹汇聚技术... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于稀疏分布式表征的英文著者姓名消歧研究
收藏 引用
计算机应用研究 2019年 第12期36卷 3534-3538页
作者: 翟晓瑞 韩红旗 张运良 李仲 中国科学技术信息研究所富媒体数字出版内容组织与知识服务重点实验室
为将稀疏分布式表征理论应用到著者姓名消歧,了解其在解决姓名消歧问题时的效果,提出了基于稀疏分布式表征的英文文献著者姓名消歧方法。该方法选择论文摘要文本信息作为消歧特征,将其生成二进制表示的SDR码。根据待消歧论文的SDR与同... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
新闻文本侵权检测关键技术研究
新闻文本侵权检测关键技术研究
收藏 引用
作者: 孙麟 东南大学
学位级别:硕士
由于微博、微信和门户网站等均是公开传播媒介,所以极易导致新闻内容被抄袭、篡改或非法扩散,继而给新闻内容原创者造成经济损失。文本相似度检测是用来解决新闻内容侵权问题的关键技术之一。然而,传统的文本相似度检测算法在处理海量... 详细信息
来源: 同方学位论文库 同方学位论文库 评论