一种基于循环神经网络的古文断句方法
A Sentence Segmentation Method for Ancient Chinese Texts Based on Recurrent Neural Network作者机构:厦门大学智能科学与技术系厦门361005 厦门大学两岸关系和平发展协同创新中心厦门361005 福建省类脑计算技术及应用重点实验室厦门361005 厦门大学软件学院厦门361005
出 版 物:《北京大学学报(自然科学版)》 (Acta Scientiarum Naturalium Universitatis Pekinensis)
年 卷 期:2017年第53卷第2期
页 面:255-261页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081203[工学-计算机应用技术] 08[工学] 081104[工学-模式识别与智能系统] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:教育部专项"简繁汉字智能转换系统" 教育部博士点基金(20130121110040) 国家科技支撑计划项目(2012BAH14F03) 国家自然科学基金(61573294) CCF中文信息技术开放课题(CCF2015-01-01)资助
摘 要:提出一种基于循环神经网络的古文自动断句方法。该方法采用基于GRU(gated recurrent unit)的双向循环神经网络进行古文断句。在解码过程中,该算法不仅利用神经网络输出的概率分布,还进一步引入状态转移概率和长度惩罚,以便提高断句准确率。在大规模古籍语料上的实验结果表明,所提方法能够取得比传统方法更高的断句F1值。