12306模拟登录验证码识别,Python资深大牛深度分析,纯干货!
Posted 北京博雅环球教育
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了12306模拟登录验证码识别,Python资深大牛深度分析,纯干货!相关的知识,希望对你有一定的参考价值。
全文都是Python知识干货,没有一句多余的废话!
1.Python爬虫原理
网络爬虫:自动的按照我们制定的规则,下载互联网上网络资源的程序。
爬虫的本质:伪造网络请求(90%是http请求)
用途:搜索引擎,数据采集,测试分析
狭义定义:伪造浏览器行为的程序!
2.浏览器工作流程
本质上:浏览器就是一个客户端,它通过http请求从服务器下载数据,解析渲染
展示给用户。
任何一个网页都是n个http请求回的数据组成。
我们在浏览器中看到的所有的信息都是从服务器下载而来。
3.http请求的分析
1.请求头
url method,header
2.请求体
参数
抓包
谷歌浏览器 开发者 调试工具
顺序方法:手动的操作一遍流程,记录所有的http请求
分析http请求,没有捷径,只有耐心,细心和经验。
会话技术
业务流程:
cookie保持
1.访问登录页面
2.下载验证码
3.校验验证码
4.校验用户名密码
5.获取权限token
6.获取权限
7.文件操作
Python模拟登陆12306相关步骤
第一步 :访问登录页面
第二步:下载验证码
第三步:校验验证码
第四步:校验用户名和密码
第五步:获取权限token
第六步:获取权限
7.Python源代码
今天的IT小课堂,你学会了吗?
火热课程免费抢先听
这里是博雅环球,欢迎来撩!
因为专业,所以成功!
因为成功,所以才有更多学员选择博雅环球!
精心培养,倾囊相授!
以上是关于12306模拟登录验证码识别,Python资深大牛深度分析,纯干货!的主要内容,如果未能解决你的问题,请参考以下文章