用于从图像中识别文本的简单 python 库

Posted

技术标签:

【中文标题】用于从图像中识别文本的简单 python 库【英文标题】:Simple python library for recognition text from image 【发布时间】:2013-07-11 22:12:03 【问题描述】:

我正在寻找一个简单的 python 库,用于从图像中识别文本。图片类似这样:

图片包含了一个很纯粹很简单的——一行,数字和连字符,但是分辨率很低。

我想要类似的东西(理想情况下):

 text = recognize(open('image.png', 'rb').read())

是否存在类似的东西? 谢谢。

UPD

我知道 pytesser 和 OCRopus。但据我了解,它们不支持 Python 3.x。

【问题讨论】:

【参考方案1】:

我使用了pytesser。非常容易学习,对我来说做得很好。 如果您不喜欢此选项,请搜索“python OCR 库”

【讨论】:

最新版本 - 0.0.1 - 2007 年 5 月。开发完成了吗? 我猜不是,我下载的时候都没注意到。无论如何,我不知道其他选择,这对我有好处,所以值得一试 在此处更新旧线程,但重要信息:请改用 pytesseract。 Pytesser 已重命名并分叉。【参考方案2】:

OCRopus 是另一个易于学习的 Python OCR 库。它似乎也比 pytesser 产生(稍微)更好的结果。这是link to its site

【讨论】:

以上是关于用于从图像中识别文本的简单 python 库的主要内容,如果未能解决你的问题,请参考以下文章

从图像中识别文本

Python使用easyocr模块完成图片文字识别

如何在python中使用OCR从图像中获取文本识别器的坐标

用于读取图像内文本的最佳 Python/Ruby 库 [关闭]

提高 Python Tesseract OCR 的准确性

使用 C# 进行图像分类