使用 OpenCV 拉直手写文本行
Posted
技术标签:
【中文标题】使用 OpenCV 拉直手写文本行【英文标题】:Straighten handwriting text line using OpenCV 【发布时间】:2021-09-11 19:54:56 【问题描述】:我有文本行的图像,其中有些行不直。 作为文本识别之前的预处理步骤,我想拉直图像,使文本显示为水平。 如何使用 Python 在 OpenCV 中实现这一点?
文本行示例:
【问题讨论】:
获取字形/单词的框,将它们大致水平关联以形成一条线。然后估计该行的“基线”(想象有人在上面写文本的行),并使用它。这只是我在不了解最新技术的情况下会尝试的一件事。你应该做文献研究(找论文)。 见pyimagesearch.com/2017/02/20/text-skew-correction-opencv-python 【参考方案1】:您的问题可以通过在频域中分析图像来解决。我在下面附上一个链接。阅读博客以获得有关此主题的最佳解释。在博客中还添加了文本的方向作为示例。
https://homepages.inf.ed.ac.uk/rbf/HIPR2/fourier.htm#:~:text=The%20Fourier%20Transform%20is%20an,is%20the%20spatial%20domain%20equivalent
【讨论】:
以上是关于使用 OpenCV 拉直手写文本行的主要内容,如果未能解决你的问题,请参考以下文章
Python,OpenCV使用KNN来构建手写数字及字母识别OCR
OpenCV-Python实战(番外篇)——利用 SVM 算法识别手写数字