logo资料库

我的笔记tesseract编译安装过程(leptonica1.74,tesseract4.1).pdf

第1页 / 共19页
第2页 / 共19页
第3页 / 共19页
第4页 / 共19页
第5页 / 共19页
第6页 / 共19页
第7页 / 共19页
第8页 / 共19页
资料共19页,剩余部分请下载后查看
64位Tesseract4.1+leptonica1.74
(编译安装步骤详解)
64 位 Tesseract4.1+leptonica1.74 (编译安装步骤详解) 最近由于需要 OCR 技术对生成线上的英文进行识别,在网上搜索后,发现开 源的 Tesseract ocr 效果不错。于是经过几天的艰苦地探索,终于可以使用了。 由于整个编译过程比较复杂,容易出错地方较多,现把整个过程整理如下, 以作备用。 一、 所需源码包括: 1. leptonica1.74,下载地址:  官网地址:http://www.leptonica.org/download.html 2. Tesseract4.1,下载地址:  github 地址: https://github.com/tesseract-ocr/tesseract/releases 二、 编译工具: 1. Cmake3.16(64 位) 2. Vs2019 三、 leptonica 编译步骤: 1. 由 于 Tesseract 使 用 第 三 方 库 leptonica , 所 以 必 须 先 编 译 安 装 leptonica. 2. 下载解压 leptonica1.74 到一个目录,我的是: d:\temp\tesseract_ocr\leptonica-1.74.4 3. 运行 cmake:按下图设置源文件和目标文件夹,然后点击【configure】按 钮,进行下一步: 4. 设置 configure:
5. 多次 configure: 第一 configure 会出现很多红色信息,那就多次点击【configure】 按钮直到红色信息没有为止: 6. 注意问题:这里要特别要说明,leptonica 缺少第三方图像库 (jpg,tiff,gif,png 等),因此 configure 完成后会出现,下面的信息:
这信息我用了很长时间,搜索了网上的一些介绍方法,都没有解决。 这个问题,不影响编译,但会影响后面程序的运行。关于这个问题的解 决方法,我后面专门介绍。 7. 修改 DLL 和 LIB 输出文件的位置:(我是安放在 d:/leptonica) 8. 生成工程文件:点击【generate】按钮 9. 运行 vs2019,打开生成的工程文件:
10. 按下面步骤,设置编译属性:
11. 开始编译: 12. 编译成功: 在指定位置,生成我们需要的目标文件夹:
四、 Tesseract 编译步骤: 1. 将 下 载 的 tesseract-4.1.1.zip 解 压 到 指 定 目 录 : D:\temp\test\tesseract-4.1.1 2. 运行 cmake:按下图设置源文件和目标文件夹,然后点击【configure】按 钮,进行下一步: 3. 设置 configure 4. 多次 configure: 和前面生成 leptonica 一样,进行多次【configure】
但依然有上图的红色信息出现,这是因为没有 cmake 没有找到 leptonica 位置 5. 指定 leptonica 位置: 将上面的项,设置成前面编译 leptonica 的 DLL 和 LIB 文件夹的 cmake 位置: D:\leptonica\cmake 6. 去到两个选项:(下面的两个项不要勾选,否则不能正常 cmake) 7. 再次进行,多次 configure:(注意一定要有 internet 网络,因为要下 载很多文件):
经过几次【configure】后,最终出现上面的没有红色报警的界面 8. 修改 DLL 和 LIB 输出文件的位置:(我是安放在 d:/tesseract) 9. 生成工程文件:点击【generate】按钮 10. 运行 vs2019,打开生成的工程文件:
分享到:
收藏