Python:黑板课爬虫闯关第二关

Posted 丹枫无迹的博客

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python:黑板课爬虫闯关第二关相关的知识,希望对你有一定的参考价值。

第二关依然是非常的简单

地址:http://www.heibanke.com/lesson/crawler_ex01/

 随便输入昵称呢密码,点击提交,显示如下:


这样看来就很简单了,枚举密码循环 post 请求,获取响应网页的内容,如果有“密码错误”,那就继续。


import re
import requests
import time


def main():
    url = \'http://www.heibanke.com/lesson/crawler_ex01/\'
    for psd in range(30):
        print(f\'test password {psd}\')
        r = requests.post(url, data={\'username\': \'aa\', \'password\': psd})
        html = r.text
        if \'密码错误\' not in html:
            m = re.search(\'(?<=\\<h3\\>).*?(?=\\</h3\\>)\', html)
            print(m.group())
            m = re.search(\'(\\<).*?href="([^"]*?)".*?(\\>下一关\\</a\\>)\', html)
            print(f\'下一关 http://www.heibanke.com{m.group(2)}\')
            return
        else:
            time.sleep(1)


if __name__ == \'__main__\':
    main()

 

以上是关于Python:黑板课爬虫闯关第二关的主要内容,如果未能解决你的问题,请参考以下文章

Python:黑板课爬虫闯关第一关

Python:黑板课爬虫闯关第三关

黑板客 -- 爬虫闯关 -- 关卡04

黑板客 -- 爬虫闯关 -- 关卡05

XSS闯关之第二关

XSS闯关之第三关