如何从带有文本的图像中获取每个字母的图像[关闭]

Posted

技术标签:

【中文标题】如何从带有文本的图像中获取每个字母的图像[关闭]【英文标题】:How to get an image of each letter from image with text [closed] 【发布时间】:2017-10-03 15:34:22 【问题描述】:

F.E.我们有一个扫描的文本文件。现在,我编写了一个程序,它可以获取字母的图像并识别它。我现在不明白的是如何从整个扫描文档中获得每个文本符号的图像表示?有可能吗?

【问题讨论】:

有可能吗?是的。说真的,尽管没有人会为您编写代码,但如果您遇到特定问题,请尝试一些事情并回来。并在您这样做时提供minimal reproducible example。 @TheLethalCoder 不错的答案。祝你好运。 我想知道你需要这个做什么...... @KobyDouek 我的研究生项目。 @Ekaterina 通过不显示您尝试过的内容和此行 how can I get from the whole scanned document the image representation of each text symbol?。正如你没有展示你已经尝试过任何你基本上是在说我该怎么做或者你能做到这一点。 【参考方案1】:

作为一项基本技术,使用二值化和连通分量分析。这将为您提供与各个字符相对应的“斑点”,并且您可以获得它们的边界框。

你会面临额外的困难:

某些字符可以接触并形成单个斑点。您将需要一些检测逻辑来拆分它们,例如基于大小和/或错误的识别分数。在恶劣的情况下(几个感人的字符,宽度不均匀的字符),你将不得不尝试不同的分裂假设并保持最佳。

某些字符由多个 blob 组成(例如重音字母),并且某些字符可能会出现碎片。当附近有小斑点时,您可以检测到这些情况。同样,您必须尝试对假设进行分组(有可能将不相关的部分分组)并保持最佳状态。

blob 将以随机顺序报告给您,您需要一些额外的逻辑来重新排列它们的读取顺序。

【讨论】:

你知道这个问题离题了,为什么要回答呢?虽然建议多于答案,但建议还是不错的。 我是来帮助人们的。我的第一句话答案:blob detection,没什么好说的。我没有计划提供任何代码。其余的都是额外的好东西。 和我们一样,除了回答一个离题的问题,您可以向其他人展示回答此类导致网站降级的问题是可以的。我的观点是,如果您想帮助人们,请帮助那些尝试过的人。如果您想帮助那些还没有尝试过任何事情的人,请成为讲师。 那条评论是错误的,帮助尝试的人比为别人工作更有价值。 @TheLethalCoder:我更喜欢给出提示而不是把人赶出去。

以上是关于如何从带有文本的图像中获取每个字母的图像[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

使用引导程序连续图像下方的文本[关闭]

从iOS中的图片中获取文本[关闭]

Tesseract API - 获取每个带有位置的文本框

如何从 Python 创建 PDF 文件,包括图像和文本? [关闭]

将PDF转换为图像后如何获得可读文本(具有抗锯齿的文本)? [关闭]

如何使用opencv从图像中检测文本