咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >神经机器翻译中英语单词及其大小写联合预测模型 收藏

神经机器翻译中英语单词及其大小写联合预测模型

Joint Prediction Model of English Words and Their Cases in Neural Machine Translation

作     者:张楠 李响 靳晓宁 陈伟 ZHANG Nan;LI Xiang;JIN Xiaoning;CHEN Wei

作者机构:北京工业大学北京未来网络科技高精尖创新中心北京100124 中国科学院计算技术研究所北京100190 中国科学院大学北京100049 北京搜狗科技发展有限公司北京100084 

出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)

年 卷 期:2019年第33卷第3期

页      面:52-58页

核心收录:

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主  题:机器翻译 大小写恢复 联合预测 

摘      要:英文中单词有大小写之分,如果使用不规范,会降低语句的可读性,甚至造成语义上的根本变化。当前的机器翻译处理流程一般先翻译生成小写的英文译文,再采用独立的大小写恢复工具进行还原,这种方式步骤繁琐且没有考虑上下文信息。另一种方式是抽取包含大小写的词表,但这种方式扩大了词表,增加了模型参数。该文提出了一种在神经机器翻译训练中联合预测英语单词及其大小写属性的方法,在同一个解码器输出层分别预测单词及其大小写属性,预测大小写时充分考虑源端语料和目标端语料上下文信息。该方法不仅减小了词表的大小和模型参数,译文的质量也得到提升。在WMT 2017汉英新闻翻译任务测试集上,相比基线方法,该方法在大小写敏感和大小写不敏感两个评价指标上分别提高0.97BLEU和1.01BLEU,改善了神经机器翻译模型的性能。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分