咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于语种关联度课程学习的多语言神经机器翻译 收藏

基于语种关联度课程学习的多语言神经机器翻译

Similarity-based Curriculum Learning for Multilingual Neural Machine Translation

作     者:于东 谢婉莹 谷舒豪 冯洋 YU Dong;XIE Wan-ying;GU Shu-hao;FENG Yang

作者机构:北京语言大学信息科学学院北京100083 中国科学院计算技术研究所北京100190 中国科学院大学北京100049 

出 版 物:《计算机科学》 (Computer Science)

年 卷 期:2022年第49卷第1期

页      面:24-30页

学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:教育部人文社会科学研究青年基金项目(19YJCZH230) 北京语言大学研究生创新基金资助项目(20YCX138)。 

主  题:机器翻译 多语言 课程学习 关联度评估 语种排序 句子排序 

摘      要:近年来,使用单一模型实现多语言神经机器翻译的方法受到了广泛关注。然而,现有方法多将所有语种语料直接混合作为训练语料,未能利用多种语言之间关联和相似的信息。此外,模型训练涉及语言种类多、数据量大、整体训练难度大、耗时长等问题。针对以上两个问题,文中提出了一种基于语种关联度的课程学习方法来提高多语言神经机器翻译的整体性能和收敛速度。具体来说,提出了两种度量语种关联度的指标:使用奇异向量典型相关分析对不同语言进行排序以及使用余弦相似度对特定语言中的不同句子进行排序。进一步,文中提出以验证集损失为课程替换标准的课程学习策略,使模型训练由整体训练转化为一系列课程上的训练,降低了训练难度。该方法填补了课程学习策略在多语言神经机器翻译领域的空白。文中在平衡和非平衡的IWSLT多语言数据集和Europarl语料库数据集上进行了实验,结果表明,所提方法优于多语言基线翻译系统,最多可使训练时间缩短64%。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分