未找到Tesseract unicharset_extractor命令

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了未找到Tesseract unicharset_extractor命令相关的知识,希望对你有一定的参考价值。

我的问题

运行unicharset_extractor并接收:

unicharset_extractor:找不到命令

我的环境

OSX El Capitan Version 10.11.4

Terminal Version 2.6.1 (361.1)

tesseract 3.04.00
 leptonica-1.73
  libgif 4.2.3 : libjpeg 9a : libpng 1.6.21 : libtiff 4.0.6 : zlib 1.2.8 : libwebp 0.5.0 : libopenjp2 2.1.0

类似的问题

这个问题已经被问了很多,但似乎没有解决我的问题。这里列出了一些非工作问题:

unicharset_extractor: command not found

Adding New Fonts to Tesseract 3

Issue 1327 in tesseract-ocr: unicharset_extractor statement doesn´t work

我在做什么

我目前正在尝试训练我的tesseract-ocr识别自定义数字。

我做了什么

我最初使用tesseract安装了Homebrew,它将tesseractleptonica和其他依赖项安装到/usr/local/Cellar。我使用this指南来帮助我训练数据。像导游指示的那样,我首先以.tif的格式生成了一组tla.test_font.exp[num].tif文件。然后我使用这个脚本生成了.box文件:

for i in `seq 0 52`;
do
    tesseract tla.test_font.exp$i.tif tla.test_font.exp$i -l eng -psm 10 batch.nochop makebox
done

然后我通过tesseract运行.box文件:

for i in `seq 0 52`;
do
    tesseract tla.test_font.exp$i.tif tla.test_font.exp$i -l eng -psm 10 nobatch box.train
done

然后我尝试运行unicharset_extractor *.box,我收到上面的错误消息。

怀疑它与我的tesseract安装路径有关,并且不想使用符号链接更加混乱,然后我从tesseract卸载libtoolleptonicausr/local/Cellar,并使用MacPorts再次安装所有内容。这次是在/opt/local/bin。在重复上述相同的步骤后,我陷入了同样的问题。我甚至试过运行man unicharset_extractor并且手册页工作得很好。

答案

安装tesseract时,您尚未安装培训工具。现在,您必须使用以下命令brew uninstall tesseract卸载tesseract,然后使用brew install安装工具--with-training-tools tesseract

在此之后,您应该能够运行unicharset_extractor命令。

谢谢

以上是关于未找到Tesseract unicharset_extractor命令的主要内容,如果未能解决你的问题,请参考以下文章

opencv tesseract 未定义的引用错误

没有这样的文件或目录:'tesseract': 'tesseract' 即使在 pytesseract.py 中指定了在哪里可以找到 tesseract

Pytesseract:“TesseractNotFound 错误:tesseract 未安装或不在您的路径中”,我该如何解决?

为啥 tesseract 不会在图像中找到这个简单的文本?

Tesseract OCR 无法检测到不同的字体大小和未水平对齐的字母

难以用 tesseract 检测数字