64 位 Tesseract4.1+leptonica1.74
(编译安装步骤详解)
最近由于需要 OCR 技术对生成线上的英文进行识别,在网上搜索后,发现开
源的 Tesseract ocr 效果不错。于是经过几天的艰苦地探索,终于可以使用了。
由于整个编译过程比较复杂,容易出错地方较多,现把整个过程整理如下,
以作备用。
一、 所需源码包括:
1. leptonica1.74,下载地址:
官网地址:http://www.leptonica.org/download.html
2. Tesseract4.1,下载地址:
github 地址:
https://github.com/tesseract-ocr/tesseract/releases
二、 编译工具:
1. Cmake3.16(64 位)
2. Vs2019
三、 leptonica 编译步骤:
1. 由 于 Tesseract 使 用 第 三 方 库 leptonica , 所 以 必 须 先 编 译 安 装
leptonica.
2. 下载解压 leptonica1.74 到一个目录,我的是:
d:\temp\tesseract_ocr\leptonica-1.74.4
3. 运行 cmake:按下图设置源文件和目标文件夹,然后点击【configure】按
钮,进行下一步:
4. 设置 configure:
5. 多次 configure:
第一 configure 会出现很多红色信息,那就多次点击【configure】
按钮直到红色信息没有为止:
6. 注意问题:这里要特别要说明,leptonica 缺少第三方图像库
(jpg,tiff,gif,png 等),因此 configure 完成后会出现,下面的信息:
这信息我用了很长时间,搜索了网上的一些介绍方法,都没有解决。
这个问题,不影响编译,但会影响后面程序的运行。关于这个问题的解
决方法,我后面专门介绍。
7. 修改 DLL 和 LIB 输出文件的位置:(我是安放在 d:/leptonica)
8. 生成工程文件:点击【generate】按钮
9. 运行 vs2019,打开生成的工程文件:
10. 按下面步骤,设置编译属性:
11. 开始编译:
12. 编译成功:
在指定位置,生成我们需要的目标文件夹:
四、 Tesseract 编译步骤:
1. 将 下 载 的 tesseract-4.1.1.zip 解 压 到 指 定 目 录 :
D:\temp\test\tesseract-4.1.1
2. 运行 cmake:按下图设置源文件和目标文件夹,然后点击【configure】按
钮,进行下一步:
3. 设置 configure
4. 多次 configure:
和前面生成 leptonica 一样,进行多次【configure】
但依然有上图的红色信息出现,这是因为没有 cmake 没有找到 leptonica
位置
5. 指定 leptonica 位置:
将上面的项,设置成前面编译 leptonica 的 DLL 和 LIB 文件夹的 cmake
位置:
D:\leptonica\cmake
6. 去到两个选项:(下面的两个项不要勾选,否则不能正常 cmake)
7. 再次进行,多次 configure:(注意一定要有 internet 网络,因为要下
载很多文件):
经过几次【configure】后,最终出现上面的没有红色报警的界面
8. 修改 DLL 和 LIB 输出文件的位置:(我是安放在 d:/tesseract)
9. 生成工程文件:点击【generate】按钮
10. 运行 vs2019,打开生成的工程文件: