Computer Science and Application
Vol.06 No.11(2016), Article ID:18892,4 pages
10.12677/CSA.2016.611079

An Improved Algorithm of Skew Correction of Text Imagine Based on the White Run-Length of the Direction

Mingming Yue, Guowei Yang, Cuifang Zhang

Electronic Information School, Qingdao University, Qingdao Shandong

Received: Oct. 19th, 2016; accepted: Nov. 6th, 2016; published: Nov. 9th, 2016

Copyright © 2016 by authors and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

ABSTRACT

During the scanning phase, the tilt of text has a great impact on the following steps (image segmentation, OCR). This paper presents an improved arithmetic based on white run-length of direction. By rotating the image, it can scan the white run-length of different angles. Then it calculates the white run-length’s length of every angle, and it finally finds out the angel of the longest white run-length. The experimental results show this algorithm can correct the text image accurately and quickly.

Keywords:OCR, White Run-Length, Skew Detection and Correction

一种基于方向白游程的文本图像倾斜校正的 改进算法

岳明明,杨国为,张翠芳

青岛大学电子信息学院,山东 青岛

收稿日期:2016年10月19日;录用日期:2016年11月6日;发布日期:2016年11月9日

摘 要

文本图像在扫描阶段的倾斜现象会对后续的图像分割以及光学字符识别(OCR)等处理造成极大的影响。本文提出了一种方向白游程算法的改进算法,通过对文本图像旋转从而对不同倾角的白游程进行扫描,然后统计每一个倾角上的白游程长度,最后找出最大白游程长度的倾角来调整文本图像。实验结果表明该算法能够准确并快速的校正文本图像。

关键词 :OCR,白游程,倾斜校正

1. 引言

随着数字化技术的发展,“无纸化”已经成为办公自动化的显著特点。将纸质文章拍摄成为照片,不仅能够保持原文件的书写特征,而且可以使用JPEG、TIFF等图像编码格式表示,易于存储建档并在互联网中传输。文本图像在存储后可以运用信息处理技术提取感兴趣的信息,因此在各类信息系统汇总得到了广泛的应用。然而在将纸质文件转换为文本图像的过程中,由于机械操作和人为的原因,不可避免地会造成文本图像的倾斜,这种倾斜显然将对文本图像的分析,如图像分割、版面分析和理解及光学字符识别处理等产生不利的影响。因此,文本图像倾斜角度的检测和校正是文本图像预处理中一个必不可少的技术环节。

目前,已有很多研究人员开展了图像的倾斜校正方面的研究工作。主要的方法有基于Hough变换 [1] 的图像倾斜校正的方法 [2] 、基于投影的方法 [3] [4] 、直线拟合方法 [5] 等。Hough变换方法是把倾斜角度检测问题看作直线检测问题,通过把图像上的点映射为参数空间上的线,然后在参数空间上求多条直线的交点得到图像空间上的直线参数,从而完成倾斜角度检测。该方法精度较高,但是耗费时间比较多,需要的存储空间也比较大。方向投影法是用不同倾斜角度对图像进行投影,同时把各个角度下的投影值保存下来,最后通过取得投影最大值时的方向或者通过设定的能量函数求得最小值时的方向作为图像的倾斜方向。该方法效果较好,但需要对各个方向投影,由粗到精,所以运算量较大,时间较长。直线拟合的方法通过对图像做傅里叶变换,然后在傅里叶能量谱中获得亮线所在的方向,该方向垂直的方向即为图像倾角方向。由于要对图像做二维傅里叶变换,所以运算量也很大。前人提出了一种基于方向白游程的倾角检测,只对图像进行一遍扫描,只对少于百分之一的像素点计算方向白游程,故计算量很小,速度较快。但是该算法对于行间距较大的文本图像存在误差,所以本文基于上述算法提出了一种改进算法。本算法通过对图像旋转从不同倾角白游程进行扫描,然后统计每个方向上白游程长度,最后通过不断的调整与对图像倾斜角度不断的精确化,从而达到对文本图像倾斜校正的目的。

2. 方向白游程

白游程是指从一个白色的像素点出发,一直沿着直线方向向前走,直到遇到黑色的点或者到达图像的边缘为止,得到的白点走过的线段。如果沿着不同方向的直线向前走,直到遇到黑色的点或者到达图像的边缘为止,就得到了方向白游程 [6] 。由方向白游程概念可以知道,选择文本行中间的白像素点作为中心点时,当游程线的方向与图像的倾斜角度一致时,游程的长度达到最大。因此可以通过计算最大游程长度所在方向来获得图像的倾斜角度。

基于方向白游程的倾斜检测步骤如下:首先,基于方向白游程的倾斜检测重要的的一点就是确定选取的中心点在文本行之间,而不是在文字的内部,其次,单一的选择一个中心点会受到文字间距或者字间距的干扰,所以要选取多个样本中心点进行检测,然后找到各个样本点中白游程最大值的样本点倾角作为倾斜角度。

此种方法对普通文本具有较好的倾斜校正,但是对于一些文本行间距较大的图像,此种方法取得效果并不理想,为此,本文在此处提出了改进。

首先,对图像进行预处理,去除离散点以及噪声的干扰,对图像中的点去除边界白像素的干扰,找到文本行列的第一个黑色像素点,作为采样区域。按照水平和垂直方向都间隔十个点取一个采样点,依次取得全图的样本点。

对样本点进行分析,首先判断其是否是行之间的中心点,如果该采样点50 × 50的区域内有黑像素点,则去掉此样本点,否则,记下该点的所在的位置。

对满足条件的各个样本点分别作为图像中心,以一度为单位,分别计算白游程的长度,找出各个样本点的白游程长度最大值,然后从各个样本点白游程长度最大值方向上向上向下搜索每个角度的白游程,只要碰到有黑色像素点的白游程就停止搜索,这样得到行间的各个角度的白游程,将得到的这几个角度取平均值,记下该角度值,然后对各个满足条件的样本点都进行上述步骤,将各个样本点得到的角度平均值再次去平均 [7] ,即得到准确的倾斜角度。

3. 倾斜校正

在找到准确的倾斜角度后,再通过图像旋转才能达到倾斜校正的目的 [8] 。如果从图像的(0, 0)点开始旋转,就会有一部分图像文本内容旋转到图像区域之外,造成信息的丢失。所以本文以图像的中心点作为原点进行旋转。任意一点(x, y)旋转后的横纵坐标公式如下:

4. 实验结果

结果分析:实验选取了二十幅图像,经测试均能正确的进行倾斜校正,并且为后续步骤打下了基础。图1为校正前的图像,图2为校正之后的图像。此方法之所以能取得较好的校正效果,主要因为选取了多个采样点,并且都计算了各个方向上白游程,并且通过调整和对各个方向上白游程取平均值作为

Figure 1. Text image before correction

图1. 校正前的文本图像

Figure 2. The corrected text image through this algorithm

图2. 通过本文算法校正后的文本图像

最终的白游程,从而得到倾斜角度。本文对传统的基于方向白游程计算倾斜角度的算法进行了改进,相比于传统的方法更加精确,实验结果证明此种基于方向白游程的方法可以有效的对倾斜的文本图像进行校正。

5. 总结

本文基于方向白游程的概念,对前人提出的方向白游程算法提出了改进,在找到行与行之间的所有白游程,然后计算每个白游程的倾斜角度,得到倾角的平均值作为文本图像倾斜角度。最后根据倾斜角度对图像做以图像中心为坐标原点的旋转,从而达到倾斜校正的目的。实验结果表明该算法能够准确地校正图像。

文章引用

岳明明,杨国为,张翠芳. 一种基于方向白游程的文本图像倾斜校正的改进算法
An Improved Algorithm of Skew Correction of Text Imagine Based on the White Run-Length of the Direction[J]. 计算机科学与应用, 2016, 06(11): 644-647. http://dx.doi.org/10.12677/CSA.2016.611079

参考文献 (References)

  1. 1. 瞿洋, 杨利平. Hough变换OCR图像倾斜矫正方法[J]. 中国图像图形学报, 2001(6): 178-181.

  2. 2. 李政, 杨扬, 颉斌, 等. 一种基于Hough变换的文档图像倾斜纠正方法[J]. 计算机应用, 2005, 25(3): 583-585.

  3. 3. 张丘, 马利庄, 高岩. 基于方向投影的票据图像倾斜检测方法[J]. 计算机应用, 2004, 24(9): 50-52.

  4. 4. Steinherz, T., Intrator, N. and Rivlin, E. (1999) Skew Detection via Principal Components Analysis. International Con- ference on Document Analysis and Recognition, 153-156.

  5. 5. 王姝华, 李佐, 蔡士杰. 基于直线连续性的页面倾斜检测与校正[J]. 计算机辅助设计与图形学学报, 2001, 13(8): 736-741.

  6. 6. 王威, 刘百华, 韩宇菲, 孙洪庆, 孟凡清. 一种通过方向白游程校正文本图像倾斜的方法[J]. 科学技术与工程, 2012, 12(22): 5642-5648.

  7. 7. 明德烈, 柳健, 胡家忠. 小角度倾斜图像的快速检测和校正技术[J]. 华中理工大学学报, 2000, 28(5): 66-68.

  8. 8. 章毓晋. 图像处理与分析[M]. 北京: 清华大学出版社, 1999: 256-260.

期刊菜单