咨询与建议

限定检索结果

文献类型

  • 9 篇 期刊文献
  • 7 篇 学位论文

馆藏范围

  • 16 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 15 篇 工学
    • 13 篇 计算机科学与技术...
    • 11 篇 软件工程
    • 2 篇 控制科学与工程
    • 1 篇 机械工程
  • 3 篇 管理学
    • 2 篇 管理科学与工程(可...
    • 1 篇 工商管理
    • 1 篇 图书情报与档案管...
  • 1 篇 经济学
    • 1 篇 应用经济学
  • 1 篇 法学
    • 1 篇 法学
  • 1 篇 文学
    • 1 篇 新闻传播学
  • 1 篇 理学

主题

  • 16 篇 文本相似
  • 5 篇 simhash
  • 2 篇 hadoop
  • 2 篇 语义指纹
  • 2 篇 自然语言处理
  • 2 篇 同义词扩展
  • 1 篇 同购概率
  • 1 篇 角色
  • 1 篇 minhash
  • 1 篇 技术差距
  • 1 篇 bert
  • 1 篇 词向量
  • 1 篇 词义信息
  • 1 篇 互信息
  • 1 篇 多序列
  • 1 篇 权值
  • 1 篇 shingling
  • 1 篇 系统相似函数
  • 1 篇 elasticsearch
  • 1 篇 社交网络

机构

  • 1 篇 上海工程技术大学
  • 1 篇 华南师范大学
  • 1 篇 中国工程物理研究...
  • 1 篇 中国科学院自动化...
  • 1 篇 福州大学
  • 1 篇 浙江大学
  • 1 篇 中国工程物理研究...
  • 1 篇 广东工业大学
  • 1 篇 河北师范大学
  • 1 篇 中国科学院大学
  • 1 篇 湖南工业大学
  • 1 篇 中国科学院文献情...
  • 1 篇 天津财经大学
  • 1 篇 广西大学
  • 1 篇 郑州大学
  • 1 篇 电子科技大学
  • 1 篇 中国传媒大学
  • 1 篇 贵州大学
  • 1 篇 北京电影学院
  • 1 篇 中南大学

作者

  • 2 篇 姜雪
  • 1 篇 吕璐成
  • 1 篇 陶以政
  • 1 篇 刘杰
  • 1 篇 蒋文丽
  • 1 篇 许玉赢
  • 1 篇 万俊杰
  • 1 篇 赵亚娟
  • 1 篇 吴云
  • 1 篇 龙军
  • 1 篇 梁燕
  • 1 篇 袁鑫攀
  • 1 篇 宗文卓
  • 1 篇 陈靖元
  • 1 篇 张树武
  • 1 篇 董东
  • 1 篇 王学昭
  • 1 篇 贾仁祥
  • 1 篇 卢希
  • 1 篇 廖凯红

语言

  • 16 篇 中文
检索条件"主题词=文本相似"
16 条 记 录,以下是1-10 订阅
排序:
BSLA:改进Siamese-LSTM的文本相似模型
收藏 引用
计算机工程与应用 2022年 第23期58卷 178-185页
作者: 孟金旭 单鸿涛 万俊杰 贾仁祥 上海工程技术大学电子电气工程学院 上海201620
针对Siamese-LSTM模型对相似文本特征提取能力差的问题,提出了一种改进Siamese-LSTM的文本相似模型,该方法引入注意力机制,对相似词分配更大的权重,增强了对文本相似词的识别能力,同时又引入目前先进的预训练模型BERT,提高相似文本上... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于有序神经元LSTM的短文本相似性检测
收藏 引用
计算机应用与软件 2021年 第12期38卷 314-319,340页
作者: 吴迎岗 广东工业大学计算机学院 广东广州510006
针对自然语言处理中短文本相似度问题,提出一种基于有序神经元长短期记忆神经网络(Ordered Neurons-Long Short Term Memory,ON-LSTM)的短文本相似度匹配方法。将神经元经过特定排序使层级结构融入到LSTM中,自动学习到层级结构信息,更... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
一种基于Hadoop的文本相似度仿真检测模型
收藏 引用
新疆大学学报(自然科学版) 2017年 第3期34卷 308-315页
作者: 吴云 许抗震 黄瑞章 贵州大学计算机科学与技术学院 贵州贵阳550025
随着信息时代数据量成倍的增长,传统的文本相似度检测方法已经无法处理大规模的文本数据.为此,提出了一种基于Hadoop集群技术的文本相似度仿真检测模型.该检测模型分为三步:第一步,利用Hadoop工具搭建实验平台,并针对该平台进行硬件和... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
WDS:基于词向量的文本相似函数
收藏 引用
计算机科学 2018年 第B11期45卷 113-116页
作者: 王路琪 龙军 袁鑫攀 中南大学软件学院 长沙410075 湖南工业大学计算机与通信学院 湖南株洲412000
为进一步提高文本相似度计算的准确性,在系统相似函数的架构下,提出了基于词向量的文本相似函数WDS(Word Documents Similarity)及其优化算法FWDS(Fast Word Documents Similarity)。该函数将文本词语集合对应的词向量集合看作系统,将... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于simhash的文本相似检测算法研究
基于simhash的文本相似检测算法研究
收藏 引用
作者: 姜雪 中国工程物理研究院
学位级别:硕士
文本相似检测算法在海量自然语言文本信息处理中具有广泛的应用,包括常见的科技论文查重、大规模网页去重、科技论文自动摘要等。尤其是simhash指纹算法,不仅生成的指纹满足局部敏感特性,即通过指纹之间的距离度量就可以体现文本相似... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于词语权重分析的中文文本相似检测技术研究
基于词语权重分析的中文文本相似检测技术研究
收藏 引用
作者: 陈靖元 郑州大学
学位级别:硕士
在当今互联网环境下,愈来愈多的文档出现被随意复制、修改、变换格式、替换同义词等现象,这将导致大量核心内容甚至全部内容一样的文档产生。这些近似或重复文档在文件存储和信息检索任务中都会耗费大量的成本和时间,也会对互联网信息... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
美国商业管制清单与专利自动映射方法及实证研究
收藏 引用
情报学报 2022年 第1期41卷 50-61页
作者: 吕璐成 韩涛 陈芳 王学昭 赵亚娟 郭世杰 中国科学院文献情报中心 中国科学院大学经济与管理学院图书情报与档案管理系
为了高效分析中美在美国商业管制清单(Commerce Control List,CCL)记录的管制技术上的差距,针对CCL清单数据非结构化程度高的问题,提出了一种管制清单数据和专利数据的自动映射方法,实现了从专利视角自动揭示中美技术差距。基于文本挖... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
电子招投标中的文本处理技术方法研究与实践
电子招投标中的文本处理技术方法研究与实践
收藏 引用
作者: 唐华龙 天津财经大学
学位级别:硕士
随着计算机技术的成熟,电子化招投标发展迅速,评标形式从专家线下评标逐步转为专家线上评标。但“专家评审制”的评标方式依旧有着其自身的局限性,其一是投标书中文本过多,但专家精力有限,无法在有限时间内对投标书进行高效的对比分析,... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于分布式架构的海量文本快速相似度检测研究
收藏 引用
中国传媒大学学报(自然科学版) 2019年 第1期26卷 39-44页
作者: 晋晓琳 张树武 刘杰 中国传媒大学信息工程学院 北京100024 中国科学院自动化研究所数字内容技术与研究中心 北京100190 北京电影学院未来影像高精尖创新中心 北京100088
为了在海量文本中快速精确的找到所需文本,本文提出了一种基于分布式架构的海量文本相似度检测方法。首先使用TF-IDF进行文本特征提取,然后用分布式搜索引擎Elasticsearch召回候选样本集,最后采用余弦相似度算法计算最终相似度。在全文... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于语义指纹的海量文本快速相似检测算法研究
收藏 引用
电脑知识与技术 2016年 第12X期12卷 175-177页
作者: 姜雪 万正景 梁燕 陶以政 中国工程物理研究院计算机应用研究所 四川绵阳621900
相似检测算法在海量文本信息处理中具有广泛的应用,尤其是Simhash算法因其指纹局部敏感特性、检测效率高在文本查重、网页检测等大规模数据处理中都十分常见。针对传统Simhash算法无法支持近义词、多义词等自然语言处理上的语义问题,通... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论