如何使用 PHP 从图像中提取文本
Posted
技术标签:
【中文标题】如何使用 PHP 从图像中提取文本【英文标题】:How to extract text from an image using PHP 【发布时间】:2011-06-19 06:44:16 【问题描述】:假设我有一张由白色背景和黑色文本组成的图像。如何使用php从文件中提取文本并将其保存为具有透明背景的png?
【问题讨论】:
您是否想阅读验证码? :) 不,只需要提取字母/将背景从白色更改为透明... 【参考方案1】:如果您已经有使用调色板(gif 或 png)的图像并假设左上角的像素仍然是白色,您可以简单地使用:
$im = imagecreatefrompng($filename);
imagecolortransparent($im, imagecolorat($im, 0, 0));
否则,您必须遍历像素,找到白色像素 (jpeg) 并分别设置它们。更多示例在这里:http://www.php.net/manual/en/function.imagecolortransparent.php
【讨论】:
【参考方案2】:实际上从图像中提取文本并不是那么简单。从图像中提取文本的过程称为光学字符识别 (OCR),与扫描仪用于“读取”文档并将其直接作为文本导入的系统相同。
对于 PHP,有一个库可以处理这种识别,请查看:http://sourceforge.net/projects/phpocr/。
【讨论】:
嗨,我已经尝试过这个 URL sourceforge.net/projects/phpocr 它只读取整数而不读取字符。有什么方法可以读取图像字符?以上是关于如何使用 PHP 从图像中提取文本的主要内容,如果未能解决你的问题,请参考以下文章
如何使用 openCV 或 OCR tesseract 从图像中提取文本? [复制]