咨询与建议

限定检索结果

文献类型

  • 6 篇 期刊文献
  • 2 篇 学位论文

馆藏范围

  • 8 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 7 篇 工学
    • 6 篇 计算机科学与技术...
    • 6 篇 软件工程
    • 1 篇 仪器科学与技术
    • 1 篇 控制科学与工程
  • 1 篇 教育学
    • 1 篇 教育学
  • 1 篇 艺术学
    • 1 篇 设计学(可授艺术学...

主题

  • 8 篇 新词检测
  • 2 篇 统计特征
  • 2 篇 重复模式
  • 1 篇 优化策略
  • 1 篇 逐层剪枝算法
  • 1 篇 海量语料
  • 1 篇 分类模型
  • 1 篇 共现状态
  • 1 篇 平均互信息
  • 1 篇 左右熵
  • 1 篇 统计框架
  • 1 篇 新词呈现
  • 1 篇 重复串
  • 1 篇 词汇教学
  • 1 篇 知识图谱
  • 1 篇 程序设计
  • 1 篇 组合特征
  • 1 篇 最大熵模型
  • 1 篇 自然语言处理
  • 1 篇 子串归并

机构

  • 3 篇 新疆师范大学
  • 1 篇 浙江绍兴鲁迅中学
  • 1 篇 苏州大学
  • 1 篇 华南理工大学
  • 1 篇 东华大学
  • 1 篇 南京理工大学
  • 1 篇 中国科学技术大学
  • 1 篇 内蒙古农业大学
  • 1 篇 内蒙古大学
  • 1 篇 中国科技大学

作者

  • 3 篇 张海军
  • 2 篇 栾静
  • 2 篇 李勇
  • 1 篇 侯宏旭
  • 1 篇 姚建民
  • 1 篇 齐向伟
  • 1 篇 章传宝
  • 1 篇 刘梦
  • 1 篇 杨玲亭
  • 1 篇 陈俊杰
  • 1 篇 彭成
  • 1 篇 朱巧明
  • 1 篇 韩艳
  • 1 篇 张晶
  • 1 篇 高静
  • 1 篇 闫琪琪
  • 1 篇 丁溪源

语言

  • 8 篇 中文
检索条件"主题词=新词检测"
8 条 记 录,以下是1-10 订阅
排序:
基于统计学习框架的中文新词检测方法
收藏 引用
计算机科学 2012年 第2期39卷 232-235页
作者: 张海军 栾静 李勇 齐向伟 新疆师范大学计算机科学技术学院 乌鲁木齐830054 中国科学技术大学计算机科学与技术学院 合肥230027
新词自动检测是中文信息处理的重要基础,但中文字符极强的构词能力给新词检测带来了巨大困难。提出一种新词检测的形式化描述模型,用以建立特征和新词检测结果之间的统计联系。在此基础上提出应用统计学习模型作为框架来整合不同类型的... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
面向程序设计领域的新词检测算法研究与应用
面向程序设计领域的新词检测算法研究与应用
收藏 引用
作者: 刘梦 东华大学
学位级别:硕士
海量的程序设计领域文本,存在大量的领域词语。jieba分词用于通用领域,已经取得较好的效果。但是,由于部分程序设计领域词语没有在分词词典中出现,因此,jieba分词用于程序设计领域的分词结果的准确性不高。如果能使用新词检测算法从领... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
在课堂教学中优化新词呈现与检测手段例析
收藏 引用
中小学外语教学 2010年 第9期33卷 23-28页
作者: 章传宝 浙江绍兴鲁迅中学
本文结合课堂教学片段,针对如何在课堂教学中优化新词汇的呈现与检测手段的问题,对新词呈现与检测脱离语境、缺乏创意的问题以及新词呈现与检测情景化、立体化等优化策略进行了例析。
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于外部排序的字串左右熵快速计算方法
收藏 引用
计算机工程与应用 2011年 第19期47卷 18-20页
作者: 张海军 彭成 栾静 新疆师范大学计算机科学技术学院 乌鲁木齐830054 中国科技大学计算机科学技术学院 合肥230027
左右熵在自然语言处理领域有着广泛应用,但目前尚无有效方法实施大规模语料中海量模式的左右熵快速计算。提出了一种计算方法,对于某长度字串计算熵,首先按长度提取语料中的全部字串,使用外部排序和归并获取字串的出现频率,然后分别剔... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
一种基于海量语料的网络热点新词识别方法
收藏 引用
计算机工程与应用 2015年 第5期51卷 208-213页
作者: 张海军 李勇 闫琪琪 新疆师范大学初等教育学院 乌鲁木齐830054 新疆师范大学计算机科学技术学院 乌鲁木齐830054
基于海量语料的热点新词识别是汉语自动处理领域的一项基础性课题,因要求快速处理大规模语料,且在新词检测中需要更多智力因素,在研究中存在较多困难。构建了一个基于海量语料的网络热点新词识别框架,整合了所提出的基于逐层剪枝算法的... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于大规模语料的中文新词抽取算法的设计与实现
基于大规模语料的中文新词抽取算法的设计与实现
收藏 引用
作者: 丁溪源 南京理工大学
学位级别:硕士
中文新词抽取是中文信息处理的基础研究,抽取的新词能直接应用到分词、词典编纂等领域中。由于新词散布于海量的信息中,为尽可能多地抽取到新词,本文研究针对大规模语料进行。 首先在综合已有定义的基础上,将新词界定为不含命名实... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
不限领域的中文新词的识别研究
收藏 引用
郑州大学学报(理学版) 2008年 第3期40卷 67-71页
作者: 韩艳 姚建民 朱巧明 张晶 苏州大学计算机科学与技术学院 江苏苏州215006 华南理工大学计算机学院 广州510000
新词识别是中文信息处理领域中的一个难点,也是自然语言处理、信息检索和机器翻译等领域的一项基础研究.根据新词特点提出不限领域的基于概率统计技术和规则方法相结合的概念抽取方法,比较了规则和统计结合的方法与纯统计的新词识别方法... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
一种利用Helmholtz原理的中文新词识别方法
收藏 引用
内蒙古农业大学学报(自然科学版) 2015年 第1期36卷 139-142页
作者: 陈俊杰 侯宏旭 杨玲亭 高静 内蒙古大学计算机学院 呼和浩特010021 内蒙古农业大学计算机与信息工程学院 呼和浩特010018
新词识别近年来逐渐被人们所关注的热点和难点问题。提出了一种利用Helmholtz原理检测新词的方法,该方法利用词语共现状态的突然变换来检测新词。实验证明使用该方法进行新词识别的召回率可以达到60%,F值可以达到45.5%,该方法是一种有... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论