166
2010,46(3)
Computer Engineering and Applications
计算机工程与应用
基于投影的文档图像倾斜校正方法
张顺利 1
2,李卫斌 1,吉 军 2
,
ZHANG Shun-li1
2,
LI Wei-bin1,
,
JI Jun2
咸阳师范学院 图形图像处理研究所,陕西 咸阳
西北工业大学 现代设计与集成制造技术教育部重点实验室,西安
712000
1.
2.
1.Institute of Graphics and Image Processing
,
Xianyang Normal University
2.Key Lab of Contemporary Design & Integrated Manufacturing Technology of MOE
E-mail
:
slmmzhang@sina.com
710072
,
Xianyang
,
Northwestern Polytechnical University
,
Shaanxi 712000
,
China
,
Xi’an 710072
,
China
ZHANG Shun-li
and Applications
,
LI Wei-bin
,
2010
,
JI Jun.Skew correction method for document image based on projection.Computer Engineering
(
):
3
166-168.
,
46
:
Abstract
,
it projects the document image from different views using an efficient pixels traversal algorithm.Then
the skew correction of document
Aiming at
Firstly
image
,
it calculates the sum
,
a novel skew correction method based on projection is proposed.
of projection data and the skew angle can be determined by comparing these sums of different views.Since only very few part of
the document
of this method
image is projected during the procedure of projection
,
a strategy of projection from rough to fine is proposed
,
large amount of operations are saved.Based on the character
,
which can greatly improve the speed and ensure the accu-
racy of detection.The experimental results show that the proposed method is very effective and can achieve very high accuracy.
Key words
image processing
:
;
skew correction
;
document image
摘 要:针对文档图像的倾斜校正问题,提出了一种新的基于投影的文档图像倾斜角检测方法
法对文档图像从不同角度进行投影,然后对投影数据进行累加求和,通过比较不同角度下的累加和来确定倾斜角度
影过程中只需对文档图像进行极少部分投影,因而大大减少了运算量
保检测精度的同时大幅提高了检测速度
关键词:图像处理;倾斜校正;文档图像
实验结果表明,方法非常有效,可以获得很高的检测精度
首先采用一种高效的像素遍历算
该方法在投
的投影策略,在确
”
基于该方法的特点,提出了由
“
到
“
”
粗
精
。
。
。
。
。
:
10.3778/j.issn.1002-8331.2010.03.050
DOI
文章编号:
(
)
1002-8331
2010
03-0166-03
文献标识码:
A
中图分类号:
TP391
1
引言
在将纸质文档资料通过图像采集设备进行光学扫描时,所
得到的图像不可避免地存在一定程度的倾斜,这会给后续的文
档图像的分析和处理带来困难
尤其是在对文档图像进行光学
字符识别(
)时,由于文档图
像的倾斜会降低文字的识别率,因此,有必要对文档图像进行
倾斜校正处理
Optical Character Recognition
,
OCR
。
。
倾斜校正的关键是如何高效
基于交叉相关性的方法[2]、
准确地检测出图像的倾斜角
、
。
变换的
目前,倾斜角检测的方法有多种,主要分为基于
变换的方法[3]、
基
方法[1]、
于投影的方法[4-5]和
其中基于投影的
。
方法是最常用的倾斜校正方法,它是对文档图像进行不同角度
的投影,得到若干投影图,再根据这些投影图的某些特征如均
第一特征矢量以及梯度等[7]的统计特性来求得文本倾斜
方差
、
但是由于传统投影方法需要对整个图像进行投影,且所需
角
Fourier
最近邻簇方法[6]等五类
Hough
基于
K-
。
的投影方向多,因而计算量和复杂度都较高[8]。
针对传统投影方法的不足,考虑到文档图像的特点,提出
高精度的倾斜角检测方法,并通
、
了一种新的基于投影的快速
过实验对方法进行了验证
。
2
算法原理
在文档图像中,文字行与行之间通常存在一定的间距
可
以设想,当用一系列平行光线从不同角度投射到文档图像时,
光线将被文字遮挡,其中只有与文字行相平行的光线才可以沿
着行间隙最大量地穿过文档图像,此时的光线方向即是文档的
倾斜角度
。
基于上述思想,将文档图像的像素看作是边长为
δ
的光束组成,通常取
的正方
为
τ=δ。
表格等所覆盖部分的像素值为
,未被覆
、
1
实际中所获得的文档图像通常为灰度图
形,光线看作是由一系列宽度为
了方便计算,令文字
盖部分的像素值为
τ
。
0。
基金项目:陕西省自然科学基金(
育厅专项基金(
No.09JK810
。
)
the Natural Science Foundation of Shaanxi Province of China under Grant No.2007D22
,
2009JQ8017
);陕西省教
作者简介:张顺利(
1973-
),男,博士研究生,副教授,主要研究方向:计算机图形图像处理;李卫斌(
),男,博士研究生,主要研究方向:计算机辅助设计与制造
机图形图像处理;吉军(
1976-
。
收稿日期:
2008-07-19
1982-
修回日期:
2008-09-01
),男,博士后,教授,主要研究方向:计算
张顺利,李卫斌,吉 军:基于投影的文档图像倾斜校正方法
2010,46(3)
167
则遍历右上方像素
K-W+1。
K
在遍历像素之前,需要计算文档图像中光束经过的初始像
及其中心坐标(
为了计算每个投影角下的投影,定义
,
)
。
x
y
,其中
为每一投影角下的光束数,通常取
下面给出某一角度下的投影运算的伪代码:
)
素
一个数组
,并令
δ=1。
;
(
;
i++
i
0
{proj[i]=1
;
continue
;
}
。
。
;如果光束所经过的所有像素值均为
像,为了去除噪声和简化计算,需要对文档图像进行二值化预
处理
作如下的规定:如果一个像素的中心位于光束内,则光束
经过该像素;否则,不经过该像素
这样,当一条光束投影到文
的像素,则这条光束将被遮挡,记投
档图像时,一旦经过值为
影值为
,则光束完全穿
过文档图像,记投影值为
将同一角度下的投影值进行累加
求和,根据上述规定,如果光束越接近文档图像的倾斜角,则累
加和越小,反之则越大
因此可以对文档图像进行不同角度的
投影,并对投影值进行累加求和,根据和的大小最终确定文档
图像的倾斜角
0。
。
1
0
1
。
3
算法实现
设文档图像由
图像宽为
所有像素按从左到右
WIDTH
W×H
,高为
个边长为
的像素组成,如图
1
,左下角位于坐标原点
δ
HEIGHT
所示
。
对
O。
从上到下的顺序进行编号,依次为
、
,对应的图像灰度值为
0、1、
由上
…、HW-1
述分析可知,该文方法的关键是实现光束与像素的快速遍历
。
中,提出了一种射束与像素的遍历算法,该算法通过
在文献
增量计算,而且主要涉及到加
减法运算,因而具有很高的效率
、
0≤i≤HW-1。
,其中
f[i]
[9]
。
Y
HEIGHT
1
0
W
,
(
)
y
x
K
δ
WIDTH
y=kx+b1
W-1
y=kx+b2
(
)
H-1
W
O (
0
,
)
0
HW-1
δ
X
δ
图
1
光束投影示意图
考虑到多数情况下,文档图像的倾斜角度不会过大
一般性,假定光束的斜率
满足
k
,下边界直线方程为
0≤k<1
y=kx+b2。
y=kx+b1
下性质:
性质
若一个像素在光束内,且其正上方像素也在光束
不失
,其上边界直线方程为
由几何关系不难得到如
。
1
2
3
内,则其右上方像素必然也在射束内
。
。
性质
若一个像素在光束内,且其正右方像素也在光束
内,则其正上方像素必然不在射束内
性质
若一个像素在光束内,且其正右方和正上方像素均
不在光束内,则其右上方像素必然在光束内
当
0≤k<1
方向步进
时,由于光束在
在步进过程中,当确定一个像素
。
沿
根据上述性质,下一个要遍历的像素按如下规则来确定:
方向比
X
Y
K
X
。
方向变化要块,所以
在光束内时,
(
)首先判断正右方像素
1
是否在光束内,若在,则遍
K+1
历该像素
。
K-W
上方像素
(
)若正右方像素
2
是否在光束内,若在,则依次遍历正上方像素
不在光束内,则判断正上方像素
和右
K+1
K-W
K-W+1。
(
)若正右方像素
3
和正上方像素
K+1
K-W
都不在光束内,
n1
y>=F2+k
)
//
判断正右方像素是否在光束内
do{
(
if
{
(
if
x0
;
F1=F1+k
x++
;
F2=F2+k
;
}
;
break
;
} else break
;
}
(
else if
(
y+1<=F1
)
//
{ if
y0
;
;
}else break
(
if
x0
;
F1=F1+k
x++
{proj[i]=1
;
F2=F2+k
;
}
;
break
;
)
;
}else break
}
else //
{
右上方像素在光束内
)
(
if
x0
;
y++
;
break
x++
;
}
;
}else break
}
(
}while
x168
2010,46(3)
Computer Engineering and Applications
计算机工程与应用
4
实验结果及分析
选取一幅标准的没有倾斜的文档图像,并人为旋转不同的
角度得到倾斜图像,通过这些倾斜的文档图像来测试该文算法
的检测精度
交叉相关算法及该文算法分别应
、
测试计算机配置为
用于不同倾斜角的同一文档来进行对比
实验过程中投影
。
内存
Hough
算法
将
。
Pentium 4 2.8 GHz CPU、512 MB DDR
角的间隔
取
表
给出了三种算法检测结果的对比
。
δ
0.1°。
1
。
表
1
三种算法的检测精度对比
倾斜角
算法
交叉相关算法
Hough
(
)
°
该文算法
-3.8
-2.8
-1.8
-0.8
0.1
0.2
1.2
2.2
3.2
4.2
最大绝对误差
最小绝对误差
平均误差值
-4.0
-2.9
-1.9
-1.1
0.0
0.1
1.0
2.1
3.0
4.1
0.3
0.1
-3.82
-2.89
-1.83
-0.86
0.10
0.10
1.07
2.13
3.09
4.13
0.13
0.0
0.15
0.068
-3.75
-2.8
-1.8
-0.8
0.05
0.2
1.2
2.2
3.2
4.2
0.05
0.0
0.01
由表
1
绝对误差达到
超过
越高
而该文算法仅为
。Hough
0.005°。
如果
可以看出,该文算法的最大绝对误差为
,最小
,则最大绝对误差将不
平均误差反映了算法精确度,其值越小表示精确度
算法的平均误差为
,
,交叉相关算法为
进一步取
0.05°
0.01°
0°。
δ
0.068°
实验证明,该文算法具有很高的精度
0.15°
若
0.01°。
。
由于该文方法是基于投影的,因此检测精度很大程度上取
过大,则检测速度快,但精度低;反
δ
为了同时提高倾斜角检测的速度和精
精
投影策略,即先用大角度间隔进行
”
决于投影角的间隔
δ。
之,则速度慢但精度高
度,提出了一种由
“
),以确定大致的倾斜角度
投影(通常取
角度范围内以小角度间隔进行投影(如
0.5]
可以大幅减少运算量,同时确保足够的精度
,
n+
),这样
;然后在
n
。
到
“
”
[n-0.5
0.01°
0.1°
粗
或
1°
角度范围内以间隔
文档图像为例,如图
以一幅实际扫描的
920×508
,
8]
,耗时
[-8
4.975°
2.235 s。
示,先用该文算法在
检测到倾斜角为
的投影方法进行测试,其中大角度间隔为
为
算出倾斜角为
0.628 s。
保持检测精度的同时将检测速度提高了
斜校正后的文档图像
,接着用小角度间隔
0.01°
,实际耗时
4.975°
,
5.5]
[4.5
在
5°
)所
(
a
2
进行投影,
粗
0.01°
然后采用由
“
到
“
”
精
”
,检测到的倾斜角
1°
角度范围内投影,计
可见,改进后的方法在
(
)为倾
b
2
倍多
2.5
图
。
。
。
)原始倾斜文档图像
(
a
图
2
(
)倾斜校正后的图像
b
倾斜校正实例
副
为了进一步测试该文算法的效率,选取
不等,以
的文档图像,倾斜角度从
扫描输入
行倾斜角的检测,其中该文算法中的大角度间隔为
间隔取
对比实验结果如表
分别使用
页面大小
的分辨率进行
交叉相关算法及该文算法进
、
,小角度
300 dpi
-5°~5°
Hough
算法
所示
A4
20
。
1°
0.1°。
2
。
表
2
三种算法的检测时间对比
s
平均处理时间
算法
交叉相关算法
该文算法
Hough
3.164
2.621
2.275
由表
2
,而
可以看出,该文算法倾斜角检测的平均处理时间为
,交叉相关算
可见,该文算法具有较快的处理
算法的平均处理时间为
3.164 s
2.621 s。
Hough
2.275 s
法的平均处理时间为
速度
。
5
结论
文章提出了一种新的基于投影的文档图像倾斜校正方法
。
该方法采用一种高效的像素遍历算法对文档图像进行部分投
影运算,克服了传统投影方法计算量大的不足
基于该文方法
的投影方法,在保证精度的
的特点,提出了一种由
”
“
同时大大提高了倾斜角的检测速度
实验结果表明,该文方法
可以达到很高的精度,这为文档图像的后续处理奠定了良好的
基础
到
“
”
粗
精
。
。
。
参考文献:
周冠玮,平西建,程娟
基于改进
.
Hough
[1]
变换的文本图像倾斜校正
方法
计算机应用,
[J].
,
27
(
):
7
52-57.
2007
[2] Gatos B
,
Papermarkos N
,
Chamzas C.Skew detection and text
position determination in digitized documents[J].Pattern Recognition
,
30
(
):
9
1997
1505-1519.
[3] Pstl W.Detection of
linear oblique structure and skew scan in
line
,
digitized documents[C]//Proceedings of
,
France
ference on Pattern Recognition
,
Paris
,
1986
:
487-489.
the 8th International Con-
[4] Ciardiello G
,
Scafur G
,
Degrandi M
,
et al.An experimental system
for office document handling and text recognition [C]//Proceedings
:
of Ninth International Conference on Pattern Recognition
,
1998
739-743.
[5] Baird H S.The Skew angle of printed documents[C]//SPSE 40th An-
:
nual Conference and Symposium on Hybrid Imaging System
,
1987
[6]
[7]
[8]
[9]
739-743.
何希平,李云峰,朱庆生
彩色文档图像的倾斜自动校正算法
中
国图象图形学报,
.
,
2006
11
卜飞宇,刘长松,丁晓青
灰度名片图像快速倾斜检测和校正方法
.
(
):
1
中文信息学报,
(
):
3
367-370.
,
18
[J].
2004
一种快速的文本倾斜检测方法
62-69.
吴涛,贺汉根
[J].
计算机工程与应
[J].
.
(
):
5
,
38
用,
2002
113-115.
张顺利,张定华,王 凯,等
术
核电子学与探测技术,
[J].
算法的快速图像重建技
一种基于
.
ART
(
):
3
,
27
2007
479-483.