基于语料库的对外汉语教学领域术语提取
Corpus-Based Term Extraction in Field of Chinese Teaching as a Foreign Language作者机构:河南财经政法大学外语学院河南郑州450046
出 版 物:《中国科技术语》 (CHINA TERMINOLOGY)
年 卷 期:2024年第26卷第1期
页 面:11-18页
学科分类:0502[文学-外国语言文学] 05[文学] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 050211[文学-外国语言学及应用语言学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:“中国外语教育基金”项目“基于语料库的汉俄对外语言教学术语词典编纂方式探究”(ZGWYJYJJ11A102)阶段性成果
主 题:专用语料库 术语提取 对外汉语教学 对外汉语教学术语集 C-value算法
摘 要:文章介绍了自动提取对外汉语教学领域术语的方法。以对外汉语教学领域文本为目标文本,遵循主题取向、语料科学性、样本代表性、规模有限性等原则,建立专用语料库,并对其进行分词标注等加工;将统计学和语言学规则相结合,引用C-value方法计算术语度值,探索该领域内不同长度术语的发现、辨识及提取的“混合方法(hybrid solution),最终建立对外汉语教学术语集,其中包含单词型术语238个,两词术语375个,三词术语121个和50个由4~6个单词组成的长术语。