咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >机打普通商业发票识别系统研究 收藏
机打普通商业发票识别系统研究

机打普通商业发票识别系统研究

作     者:虞飞 

作者单位:华南理工大学 

学位级别:硕士

导师姓名:皮佑国

授予年度:2013年

学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 

主      题:图像校正 定位 去噪 数字识别 

摘      要:随着我国经济和科技的持续高速发展,会计电算化已经基本普及并在商业活动中起到重要作用,但是鉴于经济工作的严谨性,经济往来中并没有实现无纸化办公,发票仍然是商品交易的法定记账凭证。我国幅员辽阔,计算机网络已经基本覆盖全国,因此把纸质发票承载的数据信息转化为计算机能够使用和存储的电子信息将给发票数据信息的传输、存储与查询带来极大的便利。传统的转换是依靠人工手动输入实现,但是随着发票数量的日益增多,此种输入方式需要投入更多的人力、物力、财力,而且容易出错,因而研究出一种能够代替人工的发票自动处理系统将十分有意义。 针对机打普通商业发票这类交易中最为常见的票据,本文利用模式识别原理、OCR技术,设计和研究出机打普通商业发票自动处理系统,从而更好地推进会计的电算化。 本文以最容易获得的二值发票图像作为系统输入,在分析对象识别内容及版面特点后,设计系统流程,确定各个处理环节的输入输出以及需要实现的功能。 在结合票面特点基础上,本文提出一种基于切割矩形框的Hough变换算法用于检测倾斜角度,提高检测的可靠性并减少运算复杂度;定位环节,本文提出基于先验知识的粗定位和基于移动矩形框的细定位;块去噪环节,本文在对四种常用滤波算法进行比较的基础上选择效果最好的形态学降噪方法;字符切割中,基于机打数字的无粘连特点,采用基于投影的字符切割法;数字识别环节,基于发票版面上的数字字号大小不同的特点,提出一种基于结构特征和投影特征相结合的数字识别算法实现数字的准确识别,通过与BP神经网络算法的对比表明前种算法更适合于本系统。 对整个系统识别率进行测试,实验214张发票,共包含8088个数字字符,其中7612个字符被准确识别,识别率达94.11%,基本达到系统设计目标。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分