如何将 Tesseract OCR 库集成到 C++ 程序中

Posted

技术标签:

【中文标题】如何将 Tesseract OCR 库集成到 C++ 程序中【英文标题】:How to integrate Tesseract OCR Library to a C++ program 【发布时间】:2012-02-27 11:55:03 【问题描述】:

我正在尝试使用Tesseract OCR Library 来创建一个程序来读取电梯楼层号的图片。我还没有找到任何关于如何将 Tesseract 库包含到 C++ 文件中的示例。比如:

#include "tesseract.h"

我在 Ubuntu 10.10 上使用 Tesseract v 3.00。

【问题讨论】:

这可能还不够。我对 Tesseract OCR 库一无所知,但您将需要包含指令,并通过编译器开关(通常为 -I)和(可能)与 Tesseract 库文件链接指定安装 Tesseract 头文件的目录. 为什么还不够。我已经在我的系统上安装了 Tesseract。例如,对于 openCV,您只需要执行 #include "cv.h" 和 "using namespace cv";。安装完库后肯定没有你说的那么复杂。 如果头文件安装到公共包含目录中,这足以编译源代码。但是,如果头文件不包含所有函数/变量的定义(不仅仅是声明),那么将有一个库文件(如libtesseract.a 或/和libtesseract.so)必须链接以便编译你的二进制文件。 你确实安装了libtesseract-dev,对吧? 【参考方案1】:

PlatformStatus 页面有一些关于如何安装它的 cmets。它有依赖项(leptonica),也需要安装。

Another solution 也链接自上述讨论,对于其他 linux 发行版也有类似的详细信息。

在与您的程序链接时,this post 有一些细节

那里有is also a C wrapper to the underlying API calls;查看包含的文件应该会告诉您要包​​含的内容。 Other wrappers 在这里可用。

base API class are here...的文档

来自Platform Status 页面的安装评论。

评论来自 tim.lawr...@gmail.com,2011 年 11 月 23 日 我使用这些命令在 Ubuntu 11.10 64Bit 上成功安装了 tesseract-ocr:

sudo apt-get install libleptonica-dev autoconf automake libtool libpng12-dev libjpeg62- dev libtiff4-dev zlib1g-dev subversion g++
cd
svn checkout http://tesseract-ocr.googlecode.com/svn/trunk/ tesseract-ocr
cd tesseract-ocr
./autogen.sh
./configure
make
sudo make install
sudo ldconfig
cd /usr/local/share/tessdata/
sudo wget http://tesseract-ocr.googlecode.com/files/eng.traineddata.gz
sudo gunzip eng.traineddata.gz
cd ~/tesseract-ocr/
tesseract phototest.tif phototest
cat phototest.txt

【讨论】:

谢谢,真的很有帮助 libjpeg62-dev 现在只是 libjpeg-dev

以上是关于如何将 Tesseract OCR 库集成到 C++ 程序中的主要内容,如果未能解决你的问题,请参考以下文章

Tesseract OCR集成Android Studio实现OCR识别

集成利用tesseract.exe进行ocr

如何在windows上编译Tesseract OCR

Tesseract 或任何其他 OCR 库

如何在任何位置使用 tesseract ocr 和 php

寻求有关如何将 tesseract 集成到 VC2010 C 程序中的说明