基于互联网的汉语认知属性获取及分析
Collection and Analysis on Chinese Cognitive Properties Based on Web Data作者机构:南京师范大学文学院江苏南京210097 南京大学计算机软件新技术国家重点实验室江苏南京210093
出 版 物:《语言文字应用》 (Applied Linguistics)
年 卷 期:2012年第3期
页 面:134-143页
核心收录:
学科分类:0502[文学-外国语言文学] 05[文学] 050211[文学-外国语言学及应用语言学]
基 金:国家社科基金项目(10CYY021) 中国博士后基金(2012M510178) 江苏省博士后基金(1101065C) 南京大学计算机软件新技术国家重点实验室开放课题(KFKT2011B03) 江苏高校优势学科建设工程的资助
摘 要:认知语义学强调词语的日常感知意义的描写,但传统的人工描写方式存在搜集难度大、主观性过强两大困难。本文基于互联网数据,利用知网收录的51020个名词、27901个动词和12252个形容词自动采集词语的认知属性,得到120多万条原始记录。对这些结果按词类进行详细的频率统计和数据分析,构建了6000多词条的汉语常用词语的认知属性库,尝试了夸张和反讽的自动生成。该研究可应用于计算机理解和生成修辞表达、语言教学、词典编纂和机器翻译等领域。