基于话题链的汉语语篇连贯性描述体系
Topic-Chain-Based Coherence Annotation Scheme for Chinese Text作者机构:清华信息科学与技术国家实验室(筹) 清华大学信息技术研究院语音和语言技术中心北京100084
出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)
年 卷 期:2014年第28卷第5期
页 面:102-110页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家973计划(2013CB329304) 国家自然科学基金(61373075)
摘 要:汉语简洁灵活的意合型篇章组合结构,对传统的基于关联词的篇章连贯性描述体系提出了新的挑战。该文引入话题链描述形式,设计不同类型的话题评述关系集,构建了以话题链为主,融合关联词语和其他连贯形式描述机制,覆盖话题评述、并列、因果、转折四大类关系的汉语语篇连贯性描述体系。在清华句法树库TCT上进行的验证实验,发现话题链和关联词语分别覆盖了约76%和50%的汉语复句,并且两者经常同时使用,初步证明了这个体系在句子连贯性描述方面的可行性和有效性。