基于双语语料库的翻译等价对自动抽取
Automatic Extraction of Translational Equivalence Based on Bilingual Corpora作者机构:哈尔滨工业大学计算机科学与技术学院哈尔滨150001
出 版 物:《高技术通讯》 (Chinese High Technology Letters)
年 卷 期:2003年第13卷第5期
页 面:19-24页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:双语语料库 自动抽取 N-gram模型 翻译概率 计算机 知识获取 候选翻译单元
摘 要:提出了一种利用双语语料库自动抽取多词翻译等价对的方法。首先利用N-gram模型获得候选翻译单元,然后根据统计同现计算候选等价对的翻译概率,并用贪心策略实现翻译等价对的自动抽取。在翻译概率的计算中对3种常用的统计同现测度进行了比较。实验表明,当语料规模较小时,对数似然比(Log Likelihood Ratio)测度对于翻译等价对的抽取具有较好的效果。与现有方法相比,该方法较好地解决了翻译等价对抽取中多词单元对应及间接相关问题。