基于简化Mumford-Shah模型的文本行和段落分割算法
Text Line and Paragraph Segmentation Based on simple Mumford-Shah Model作者机构:山东师范大学管理与经济学院济南250014 山东师范大学信息科学与工程学院济南250014 山大鸥玛图像处理与研究中心济南250100
出 版 物:《信息技术与信息化》 (Information Technology and Informatization)
年 卷 期:2009年第5期
页 面:66-69页
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0835[工学-软件工程] 080201[工学-机械制造及其自动化]
基 金:山东省自然科学基金(2005ZRB01001) 2008年度山东省中青年科学家科研奖励基金(2008BSB38001)
主 题:文本行和段落分割 简化Mumford—Shah模型 水平集 形态学
摘 要:文本行和段落分割是文档图像处理过程中的重要步骤。本文提出了一种基于简化Mumford-Shah模型的新的文本行和段落分割算法,该算法是脚本语言独立的。为了提高文本行和段落分割算法的有效性,首先使用高斯滤波器对文档图像进行平滑,然后再在此基础上运用简化的Mumford-Shah模型的水平集图像分割算法分割文档图像。最后,利用数学形态学方法处理文档中粘连和交叠情况。实验表明,该算法可以准确快速的分割目标物体,而且算法与初始轮廓线位置无关、不受边界轮廓线连续性限制、对图像噪声具有很强的鲁棒性。