如何将 Tesseract OCR 库集成到 C++ 程序中
Posted
技术标签:
【中文标题】如何将 Tesseract OCR 库集成到 C++ 程序中【英文标题】:How to integrate Tesseract OCR Library to a C++ program 【发布时间】:2012-02-27 11:55:03 【问题描述】:我正在尝试使用Tesseract OCR Library 来创建一个程序来读取电梯楼层号的图片。我还没有找到任何关于如何将 Tesseract 库包含到 C++ 文件中的示例。比如:
#include "tesseract.h"
我在 Ubuntu 10.10 上使用 Tesseract v 3.00。
【问题讨论】:
这可能还不够。我对 Tesseract OCR 库一无所知,但您将需要包含指令,并通过编译器开关(通常为-I
)和(可能)与 Tesseract 库文件链接指定安装 Tesseract 头文件的目录.
为什么还不够。我已经在我的系统上安装了 Tesseract。例如,对于 openCV,您只需要执行 #include "cv.h" 和 "using namespace cv";。安装完库后肯定没有你说的那么复杂。
如果头文件安装到公共包含目录中,这足以编译源代码。但是,如果头文件不包含所有函数/变量的定义(不仅仅是声明),那么将有一个库文件(如libtesseract.a
或/和libtesseract.so
)必须链接以便编译你的二进制文件。
你确实安装了libtesseract-dev
,对吧?
【参考方案1】:
PlatformStatus 页面有一些关于如何安装它的 cmets。它有依赖项(leptonica),也需要安装。
Another solution 也链接自上述讨论,对于其他 linux 发行版也有类似的详细信息。
在与您的程序链接时,this post 有一些细节
那里有is also a C wrapper to the underlying API calls;查看包含的文件应该会告诉您要包含的内容。 Other wrappers 在这里可用。
base API class are here...的文档
来自Platform Status 页面的安装评论。
评论来自 tim.lawr...@gmail.com,2011 年 11 月 23 日 我使用这些命令在 Ubuntu 11.10 64Bit 上成功安装了 tesseract-ocr:
sudo apt-get install libleptonica-dev autoconf automake libtool libpng12-dev libjpeg62- dev libtiff4-dev zlib1g-dev subversion g++
cd
svn checkout http://tesseract-ocr.googlecode.com/svn/trunk/ tesseract-ocr
cd tesseract-ocr
./autogen.sh
./configure
make
sudo make install
sudo ldconfig
cd /usr/local/share/tessdata/
sudo wget http://tesseract-ocr.googlecode.com/files/eng.traineddata.gz
sudo gunzip eng.traineddata.gz
cd ~/tesseract-ocr/
tesseract phototest.tif phototest
cat phototest.txt
【讨论】:
谢谢,真的很有帮助 libjpeg62-dev 现在只是 libjpeg-dev以上是关于如何将 Tesseract OCR 库集成到 C++ 程序中的主要内容,如果未能解决你的问题,请参考以下文章