如何从 python 中的图像(或 pdf 文件)中提取名称和手写数字?
Posted
技术标签:
【中文标题】如何从 python 中的图像(或 pdf 文件)中提取名称和手写数字?【英文标题】:How can I extract names and handwritten numbers from images (or pdf files) in python? 【发布时间】:2020-05-28 00:02:21 【问题描述】:我想建立一个项目,当我放入一个 pdf 文件时,它会提取 打印名称和手写数字,然后 将它们放入 CSV 文件(excel 文件) 请注意,pdf 文件有一个表格,我们可以在其中找到一列中的名称和另一列中的手写标记 那么您能推荐一个示例或最好的 python 框架或引擎吗?请确保在下图中看到一个示例 提前致谢
【问题讨论】:
对于手写,你必须训练一个模型来检测手写数字,对于扫描的文档部分,你可以使用 tessaract。我建议使用 Keras 你试过谷歌图片 API 吗?如果可以使用非本地代码... 【参考方案1】:Python 框架“Tesseract”可以满足您的需求。你可能想看看这个博客。有描述的基本说明。 Tessereact for Python
【讨论】:
问题是:tes-s-ract 或 pytes-s-ract 只能检测到以特定语言编写的文本,例如 eng 或 fr 的完整段落……而不是名称!名称是不同的类型,我需要知道如何检测名称 @Adem Youssef 另一种方法是构建和训练自己的 CNN。我建议将 Keras 与 Tensorflow 结合使用。对于 Numbers,您可以使用 MNIST 训练的网络。字母检测有类似的解决方案..您可能需要阅读本主题 @Adem Youssef OpenCV 提供了有用的功能来查找和检测边缘和东西......也许也有帮助 感谢@sxeros 的帮助,这让我走上了正确的道路 @Adem Youssef 很高兴为您提供帮助:D【参考方案2】:您可以将 Pytesseract 用于文本。 Pytesseract 是 Python 的光学字符识别 (OCR) 工具。它将帮助您识别图像中的文本。
对于手写数字,您可以使用 mnist 数据集通过 Tensorflow 或 Keras。
【讨论】:
以上是关于如何从 python 中的图像(或 pdf 文件)中提取名称和手写数字?的主要内容,如果未能解决你的问题,请参考以下文章
如何从 Python 中的 HTML / CSS(包括图像)源生成 PDF? [关闭]
浏览pdf文件以查找特定页面并使用python从图像中提取表格数据