金融发票自动识别系统的研究与开发
作者单位:东华大学
学位级别:硕士
导师姓名:王直杰
授予年度:2018年
学科分类:12[管理学] 120202[管理学-企业管理(含:财务管理、市场营销、人力资源管理)] 1202[管理学-工商管理] 08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
主 题:OCR 二维码 深度学习 Selenium Tesseract
摘 要:财务行业的发票识别及财务做账问题一直是会计行业关注的焦点问题,在这其中发票信息填录尤其重要。近年来随着企业之间财务交易越来越频繁,企业中财务处理也日趋频繁,但传统的人工填录方法效率较低,而且易于出错;在这样的背景下,社会急需一整套发票自动填录系统来解决这些问题。而在此背景下,国家易出台相关政策来辅助社会的需求,为此在17年8月国家开放了增值税发票查询网站。基于此网站,本文重点研究和构建增值税发票识别系统。整个系统需求方案是基于国家发布的增值税发票查询网站来进行构建,并且依据整个需求设计了整个系统的工作流程。本文着重介绍和设计了系统的算法模块。本文的主要工作包括以下几个方面:(1)针对图像倒置、倾斜问题,本文最终采用图像霍夫直线检测算法和tesseract文本旋转两者相结合的方法来进行处理,有效的解决了图像预处理问题。(2)针对二维码识别问题,本文通过图像处理的方法对二维码进行解码;本文还着重对破损二维码图像进行处理,通过图像处理的方法对其进行修复,修复后在进行识别。(3)在文本识别过程中,针对图像模糊、被章覆盖、文本倾斜等问题的图像,本文采用深度学习的方法进行文本识别,最终识别率能够达到95%以上。(4)针对网站查询问题,本文提出了基于Selenium技术来是实现自动化网站查询,并最终构建了查询模块。(5)针对网站验证码问题,本文提出了模仿网站验证码风格来实现大批量生成样本,最终使用深度学习端到端的方法进行验证码识别,识别率达到了85%。基于上述模块,最终使用python构建了整个发票识别系统。目前,该系统已经应用到会计行业当中去,最终网站查询成功的发票占比在93%以上,而其系统效率较高,能够满足会计行业的基本需求。