Tesseract 4.1.1 错误 eng.traineddata 在谷歌 colab 中找不到

Posted

技术标签:

【中文标题】Tesseract 4.1.1 错误 eng.traineddata 在谷歌 colab 中找不到【英文标题】:Tesseract 4.1.1 error eng.traineddata not found in google colab 【发布时间】:2021-04-20 03:00:32 【问题描述】:

我正在尝试在 google colab 中安装 tesseract 4.1.1。我已经安装了 tesseract,我可以使用 !tesseract --version 检查版本。之后我在/usr/local/share/tessdata/文件夹中下载了eng.traineddata和org.traineddata

现在当尝试从 python 中使用它时,它给了我以下错误

TesseractError: (1, 'Error opening data file /usr/local/share/tessdata/eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'eng\' Tesseract couldn\'t load any languages!)

我已尝试使用此检查文件是否存在


if os.path.isfile('/usr/local/share/tessdata/eng.traineddata'):
    print ("File exist")

打印File exist。对此的任何帮助将不胜感激。谢谢

【问题讨论】:

【参考方案1】:

试试这个命令

export TESSDATA_PREFIX=/usr/local/share/ 

【讨论】:

请记住,Stack Overflow 不仅仅是为了解决眼前的问题,而是为了帮助未来的读者找到类似问题的解决方案,这需要了解底层代码。这对于我们社区的初学者和不熟悉语法的成员来说尤其重要。鉴于此,您能否在edit 的回答中解释您正在做什么以及为什么您认为这是最好的方法?

以上是关于Tesseract 4.1.1 错误 eng.traineddata 在谷歌 colab 中找不到的主要内容,如果未能解决你的问题,请参考以下文章

Tesseract - 错误 net.sourceforge.tess4j.Tesseract - null

Tesseract 错误空间识别

错误!找不到命令“tesseract”。 (PHP 蒂亚戈莱西奥)

tesseract 错误置信决策

在 Angular 中安装 Tesseract.js 后找不到名称“缓冲区”错误

tesseract-php 包装器在本地主机上运行时出现路径错误