公文语料库建设浅谈
作者机构:山东烟台市鲁东大学
出 版 物:《秘书工作》 (Office Administration)
年 卷 期:2009年第3期
页 面:34-35页
学科分类:0502[文学-外国语言文学] 050201[文学-英语语言文学] 050301[文学-新闻学] 05[文学] 0503[文学-新闻传播学]
主 题:语料库建设 公文材料 语言材料 信息标注 材料积累 语言学 计算机 文本
摘 要:语料库顾名思义就是存储语言材料的仓库,通常是指存放在计算机里的原始文本或经过加工后带有语言学信息标注的语料文本。我们平常所见的公文例文,或者网站上的公文,或者某些部门、单位、学者积累的公文材料,虽与语料库有一定的相似之处,但这些材料积累,往往只是局部的、较为随意的、难成体系的公文收集。我们要建立的公文语料库,是从词语到段落篇章、不同文种、不同层次,