如何从 python 中的图像(或 pdf 文件)中提取名称和手写数字?

Posted

技术标签:

【中文标题】如何从 python 中的图像(或 pdf 文件)中提取名称和手写数字?【英文标题】:How can I extract names and handwritten numbers from images (or pdf files) in python? 【发布时间】:2020-05-28 00:02:21 【问题描述】:

我想建立一个项目,当我放入一个 pdf 文件时,它会提取 打印名称手写数字,然后 将它们放入 CSV 文件(excel 文件) 请注意,pdf 文件有一个表格,我们可以在其中找到一列中的名称另一列中的手写标记 那么您能推荐一个示例或最好的 python 框架或引擎吗?确保在下图中看到一个示例 提前致谢

【问题讨论】:

对于手写,你必须训练一个模型来检测手写数字,对于扫描的文档部分,你可以使用 tessaract。我建议使用 Keras 你试过谷歌图片 API 吗?如果可以使用非本地代码... 【参考方案1】:

Python 框架“Tesseract”可以满足您的需求。你可能想看看这个博客。有描述的基本说明。 Tessereact for Python

【讨论】:

问题是:tes-s-ract 或 pytes-s-ract 只能检测到以特定语言编写的文本,例如 eng 或 fr 的完整段落……而不是名称!名称是不同的类型,我需要知道如何检测名称 @Adem Youssef 另一种方法是构建和训练自己的 CNN。我建议将 Keras 与 Tensorflow 结合使用。对于 Numbers,您可以使用 MNIST 训练的网络。字母检测有类似的解决方案..您可能需要阅读本主题 @Adem Youssef OpenCV 提供了有用的功能来查找和检测边缘和东西......也许也有帮助 感谢@sxeros 的帮助,这让我走上了正确的道路 @Adem Youssef 很高兴为您提供帮助:D【参考方案2】:

您可以将 Pytesseract 用于文本。 Pytesseract 是 Python 的光学字符识别 (OCR) 工具。它将帮助您识别图像中的文本。

对于手写数字,您可以使用 mnist 数据集通过 Tensorflow 或 Keras。

【讨论】:

以上是关于如何从 python 中的图像(或 pdf 文件)中提取名称和手写数字?的主要内容,如果未能解决你的问题,请参考以下文章

如何从 Python 中的 HTML / CSS(包括图像)源生成 PDF? [关闭]

如何识别扫描的 PDF 文件中的图像?

浏览pdf文件以查找特定页面并使用python从图像中提取表格数据

如何从内部存储中选择文档和图像文件并上传到服务器?

如何使用 iText 或 android 上的其他库创建 PDF 文件?

如何通过swift中的alamofire上传从手机中挑选的pdf和图像(任何一个选择的任何一个)文件