咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于多类型文本的英语关系从句自动提取和标注研究 收藏

基于多类型文本的英语关系从句自动提取和标注研究

Automatic Extraction and Annotation of English Relative Clauses in Multitype Texts

作     者:李金满 张婷玉 LI Jinman;ZHANG Tingyu

作者机构:上海财经大学外国语学院上海200433 

出 版 物:《外语与外语教学》 (Foreign Languages and Their Teaching)

年 卷 期:2023年第3期

页      面:85-96,148页

核心收录:

学科分类:0501[文学-中国语言文学] 0303[法学-社会学] 050102[文学-语言学及应用语言学] 03[法学] 030303[法学-人类学] 05[文学] 

基  金:国家社科基金项目“类型学特色构式的加工共性研究”(项目编号:18BYY008)的阶段性研究成果 

主  题:AutoSubClause 关系从句 自动提取及标注 多类型文本 

摘      要:关系从句在理论语言学、心理语言学、计算语言学、语言习得与教学等研究领域广受关注,但因人工提取和标注耗时且易错,严重限制了研究规模。新近问世的AutoSubClause计算机程序,通过使用依存句法分析器,能够实现英语多种从句自动提取及标注,有助于解决这一问题,但其具体处理效果犹未可知。本文基于不同类型语料文本,包括英语本族语者、学习者、译者产出的政论、文学类书面语和口语语料文本,系统评估该程序自动提取英语关系从句的准确率,并进一步考察该程序对关系从句各类特性的自动标注效果,包括可及性、生命性、限制性等。研究结果显示,该程序自动提取英语本族语和译文文本中关系从句的召回率和精确率较高,但对学习者文本的提取效果还有待改进;在关系从句特性的自动标注方面,该程序对名词生命性、从句限制性以及核心名词在从句中充当成分等的识别精确率总体表现优秀。针对程序存在的问题和不足,论文进行了分析并提出了改进建议。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分