机器翻译词语漏译的语料库语境策略研究
A study on the corpus context strategies for the missing words in Machine Translation作者机构:阳光学院外国语与海外教育学院福建省350015
出 版 物:《外语教学与研究》 (Foreign Language Teaching and Research)
年 卷 期:2022年第54卷第2期
页 面:277-287,F0003页
核心收录:
学科分类:0303[法学-社会学] 03[法学] 030303[法学-人类学]
基 金:教育部人文社会科学研究规划基金项目“机器翻译漏译三维语境判断机理研究”(19YJAZH110) 福建省社会科学规划项目“茶产业汉英双语语料库智能构建研究”(FJ2021B106)的阶段性成果。
摘 要:机器翻译漏译错误有语用、语法层面的,也有词语层面的,后者占比较大。本文从机器翻译译后和机器翻译应用两个角度总结漏译的语言学应对策略。从词、短语和句子三个层级入手,采用本地语料库和机器翻译数据的语境交叉确认策略确定漏译的词语,采用词向量语境关联搭配策略降低机器翻译漏译数量。在两项实验中,与词语漏译评测强相关的BLEU值以及人工评测的结果都显示,在语言学干预语料库因素和词向量语境因素后,漏译比例大幅减少,相关词语错译和语序错误也同步减少。