selenium解决验证码的方法

Posted 永远不要矫情

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了selenium解决验证码的方法相关的知识,希望对你有一定的参考价值。

1.使用pytesseract模块和PIL模块解决

pytesseract模块和PIL模块可以解决不太复杂的验证码问题。首先需要安装:

pip install pytesseract
pip install pil

解决思路如下:

  1. 截屏整个屏幕
  2. 获得验证码坐标数据
  3. 根据坐标数据抠图
  4. 使用pytesseract模块进行验证

代码如下:获取当前页面的验证码
在这里插入图片描述

import time

from selenium import webdriver
from PIL import Image
import pytesseract
from builtins import str

class TestCase(object):
    def __init__(self):
        self.driver = webdriver.Chrome()
        self.driver.get('http://localhost:8080/jpress/user/register')
        self.driver.maximize_window()
    def test1(self):

         #获取验证码图片
        t = time.time() #获取当前时间
        picture_name1 = str(t)+'.png'
        self.driver.save_screenshot(picture_name1) #保存截屏
        ce = self.driver.find_element_by_id("captchaimg")
        print(ce.location)
        left = ce.location['x']
        top = ce.location['y']
        right = ce.size['width'] + left
        height = ce.size['height'] + top

        im = Image.open(picture_name1)
         # 抠图
        img = im.crop((left, top, right, height))

        t = time.time()
        picture_name2 = str(t)+'.png'

        img.save(picture_name2)#这里就是截取到的验证码图片

        self.driver.close()

        image1 = Image.open(picture_name2)
        str1 = pytesseract.image_to_string(image1)
        print(str1)

if __name__ == '__main__':
    case = TestCase()
    case.test1()

控制台无输出

2.使用第三方的API来实现

可以第三方的AI库进行识别,我使用万维易源的API来实现,大家如果有其他的网站也行。
首先要下载一个SDK,将其解压放到项目的lib目录下:
在这里插入图片描述
然后代码如下所示:my_appId和my_appSecret是购买了其图片验证码识别后,用相关信息进行更换。1621131086.506006.png是在上一个方法中截取出来的
在这里插入图片描述


from selenium import webdriver
from PIL import Image
import pytesseract
from builtins import str
from lib.ShowapiRequest import ShowapiRequest


class TestCase(object):
    def __init__(self):
        self.driver = webdriver.Chrome()
        self.driver.get('http://localhost:8080/jpress/user/register')
        self.driver.maximize_window()
    def test1(self):
        r = ShowapiRequest("http://route.showapi.com/184-1", "my_appId", "my_appSecret") 
        r.addFilePara("image", "1621131086.506006.png")
        r.addBodyPara("typeId", "34")
        r.addBodyPara("convert_to_jpg", "0")
        res = r.post()
        print(res.text)
        print(res.json()['showapi_res_body']['Result'])

if __name__ == '__main__':
    case = TestCase()
    case.test1()

控制台输出:
在这里插入图片描述

以上是关于selenium解决验证码的方法的主要内容,如果未能解决你的问题,请参考以下文章

selenium自动化——验证码问题

python selenium-webdriver 登录验证码的处理

Python用selenium模拟登录知乎,输完验证码以后点击登录,验证码收了起来却不进主页为啥

Selenium-WebDriver实战篇Java丨验证码图片去除干扰像素,方便验证码的识别(转)

Selenium实战—— 登录过程验证码的获取

python selenium4 模拟点击+拖动+保存验证码 测试对象+以验证码的返回ID保存命名 58同城验证码