咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度学习的护照文本信息识别 收藏

基于深度学习的护照文本信息识别

A Passport Text Information Recognition System Based on Deep Learning

作     者:谢子敬 XIE Zijing

作者机构:华中科技大学电子信息与通信学院湖北武汉430074 

出 版 物:《数字通信世界》 (Digital Communication World)

年 卷 期:2024年第10期

页      面:53-55,71页

学科分类:08[工学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主  题:护照 深度学习 文本检测 文本识别 关键信息提取 

摘      要:应用基于深度学习的场景文本检测和场景文本识别的算法,实现对多国护照图片中关键文本信息的结构化输出具有重要意义。该文针对检测算法难以处理极端长宽比和小尺度文字的问题,使用了基于像素分割的检测方法,并且进行多尺度特征融合获得不同尺度的特征图;针对字符像素受干扰的情况,使用循环神经网络进行图像特征的上下文关系建模,以减轻污损干扰;针对无关文本干扰的情况,使用了基于文本和布局信息的多模态Transformer进行建模,获取关键信息的多模态模式,滤去无关信息,进行关键词匹配和提取,获得了较好的实验结果。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分