基于编码器—解码器和注意力机制神经网络的数学公式识别方法-南通市图书馆

文献详情 >基于编码器—解码器和注意力机制神经网络的数学公式识别方法收藏

基于编码器—解码器和注意力机制神经网络的数学公式识别方法

作者单位：厦门大学

学位级别：硕士

导师姓名：吴梅红

授予年度：2019年

学科分类：1305[艺术学-设计学（可授艺术学、工学学位）] 12[管理学] 13[艺术学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0804[工学-仪器科学与技术] 0835[工学-软件工程] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术（可授工学、理学学位）]

主题：手写体数学公式识别编码器-解码器预训练

摘要：数学公式识别是纸质文献进行电子化转录领域的一项关键技术,同时随着近年来触摸设备的普及,在线手写体数学公式识别技术也变得越发重要,该技术的发展可以促进一种新型的人机交互方式,尤其在数字化教学、数学文档撰写等领域将带来极大的便利。数学公式识别问题属于光学字符识别的一种,但又有其自身的特殊性。数学公式识别问题的特殊性体现在:公式中存在大量书写歧义、字符歧义、分割歧义以及结构歧义等难点。这些难点使得该问题存在诸多的挑战,因此并不能使用传统光学字符识别技术来解决该问题。根据数学公式的表示格式来划分的话,可以分为印刷体和书写体两种。手写体公式会引入更多歧义,因此相对印刷体公式来说识别也更加困难,本文将主要研究手写体数学公式识别问题。根据是否是实时数据来划分的话,手写体数学公式又可以分为在线的和离线的。所谓在线指的是公式被表示为动态轨迹坐标信息;所谓离线指的是公式被表示为静态图片像素信息;当然根据动态轨迹信息可以得到静态图片信息,反之则不然。由于近来便携式电子触摸设备的流行,使得在线数学公式识别问题受到研究者越来越多的重视,因此本文的研究重点是在线手写体数学公式识别问题,并且本文将采用在线手写体数学公式识别领域较为权威的数据集—CROHME来展开相关研究工作,最终将开发一套系统用于将数学公式手写轨迹信息转录为数学公式所对应的LaTeX符号序列。在线手写体数学公式识别问题,可以看成是序列到序列进行转录的学习问题,并且是多数据模态序列数据之间的学习问题,也即轨迹坐标序列到LaTeX符号序列之间的学习问题。近年来,研究者采用编码器-解码器架构来解决多模态序列学习问题,如图片描述、语音识别等各种问题,均取得了不错的成果,因此本文将尝试采用编码器-解码器架构来解决在线手写体数学公式识别问题。考虑到手写体数学公式识别问题的特点,本文编码器和解码器都采用LSTM架构,同时还引入了机器翻译领域最新的研究成果,如注意力机制、覆盖机制等。此外本文依照机器翻译领域大规模的模型实践经验,来仔细的调整了编码器-解码器模型的各种超参,如模型深度、隐单元结构、隐单元维度、词向量维度等。本文编码器-解码器模型在2016届CROHME竞赛的测试集上公式识别率达到50.57%,超过同届仅使用官方数据集的其它参赛队伍。此外近来有研究表明,预训练语言模型对各种自然语言处理任务的性能提升有巨大帮助,因此本文使用了 CROHME数据集中的符号分割信息以及LaTeX语料库来分别对编码器和解码器进行预训练,然后再将其迁移到编码器-解码器模型中进行微调。由于编码器-解码器架构中的编码器和解码器组件本质上分别完成了轨迹信息表征和LaTeX语法学习的任务,因此通过引入辅助任务对模型进行预训练使得公式识别率进一步提升到58.76%。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于编码器—解码器和注意力机制神经网络的数学公式识别方法

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于编码器—解码器和注意力机制神经网络的数学公式识别方法

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：