5行Python实现验证码识别,太稳了

Posted 梦子mengy7762

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了5行Python实现验证码识别,太稳了相关的知识,希望对你有一定的参考价值。

很久之前,分享过一次Python代码实现验证码识别的办法。

当时采用的是pillow+pytesseract,优点是免费,较为易用。但其识别精度一般,若想要更高要求的验证码识别,初学者就只能去选择使用百度API接口了。

但其实百度API接口和pytesseract其实都需要进行前期配置,对于初学者来说就不太友好了。

而且百度API必须要联网,对于某些机器不能联网的朋友而言,就得pass了

最近群里有位群友分享了一个新库,试用一下发现非常实用,特意今天分享给大家。最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~

Github地址:https://github.com/sml2h3/ddddocr

该库名也是非常有趣 —— ddddocr(谐音带带弟弟OCR)

环境要求

python >= 3.8Windows/Linux/Macox..

可以通过以下命令安装

pip install ddddocr

参数说明

在网上随机寻找了一个验证码图片,使用这个库来实战一下。

来源:百度搜索

import ddddocr

ocr = ddddocr.DdddOcr()
with open(‘1.png’, ‘rb’) as f:
img_bytes = f.read()
res = ocr.classification(img_bytes)

print(res)

成功识别出来了验证码文字!

而且优点也非常明显:首先代码非常精简,对比前文提到的两种方法,不需要额外设置环境变量等等,5行代码即可轻松识别验证码图片。另一方面,我们使用魔法命令%%time也测试出来吗,这段代码识别速度非常快。最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~

下面用更多的验证码图片继续测试:

我又找了6个验证码图片来测试,观察结果,发现这类简单的验证码基本可以进行快速识别。但也有部分结果有问题——字母大小写没有进行区分(比如第6张图片)。

总而言之,如果你需要进行验证码识别,且对精度要求不是过高。

那么,带带弟弟OCR(ddddocr)这个库是一个不错的选择~

以上是关于5行Python实现验证码识别,太稳了的主要内容,如果未能解决你的问题,请参考以下文章

热点复现|验证码识别

20行 Python 代码实现验证码识别

20 行代码带你实现验证码自动识别

Python 代码实现验证码识别

爬虫遇到头疼的验证码?Python实战讲解弹窗处理和验证码识别

Python+TF实现验证码识别