如何从 python 中的图像（或 pdf 文件）中提取名称和手写数字？

Posted 2023-04-17

技术标签:

【中文标题】如何从 python 中的图像（或 pdf 文件）中提取名称和手写数字？【英文标题】：How can I extract names and handwritten numbers from images (or pdf files) in python? 【发布时间】：2020-05-28 00:02:21 【问题描述】：

我想建立一个项目，当我放入一个 pdf 文件时，它会提取 打印名称和手写数字，然后将它们放入 CSV 文件（excel 文件）请注意，pdf 文件有一个表格，我们可以在其中找到一列中的名称和另一列中的手写标记 那么您能推荐一个示例或最好的 python 框架或引擎吗？请确保在下图中看到一个示例 提前致谢

【问题讨论】：

对于手写，你必须训练一个模型来检测手写数字，对于扫描的文档部分，你可以使用 tessaract。我建议使用 Keras 你试过谷歌图片 API 吗？如果可以使用非本地代码... 【参考方案1】：

Python 框架“Tesseract”可以满足您的需求。你可能想看看这个博客。有描述的基本说明。 Tessereact for Python

【讨论】：

问题是：tes-s-ract 或 pytes-s-ract 只能检测到以特定语言编写的文本，例如 eng 或 fr 的完整段落……而不是名称！名称是不同的类型，我需要知道如何检测名称 @Adem Youssef 另一种方法是构建和训练自己的 CNN。我建议将 Keras 与 Tensorflow 结合使用。对于 Numbers，您可以使用 MNIST 训练的网络。字母检测有类似的解决方案..您可能需要阅读本主题 @Adem Youssef OpenCV 提供了有用的功能来查找和检测边缘和东西......也许也有帮助感谢@sxeros 的帮助，这让我走上了正确的道路 @Adem Youssef 很高兴为您提供帮助：D【参考方案2】：

您可以将 Pytesseract 用于文本。 Pytesseract 是 Python 的光学字符识别 (OCR) 工具。它将帮助您识别图像中的文本。

对于手写数字，您可以使用 mnist 数据集通过 Tensorflow 或 Keras。

【讨论】：

以上是关于如何从 python 中的图像（或 pdf 文件）中提取名称和手写数字？的主要内容，如果未能解决你的问题，请参考以下文章

如何从 Python 中的 HTML / CSS（包括图像）源生成 PDF？ [关闭]

如何识别扫描的 PDF 文件中的图像？

浏览pdf文件以查找特定页面并使用python从图像中提取表格数据

如何从内部存储中选择文档和图像文件并上传到服务器？

如何使用 iText 或 android 上的其他库创建 PDF 文件？

如何通过swift中的alamofire上传从手机中挑选的pdf和图像（任何一个选择的任何一个）文件