python爬虫登录保持及对http的总结

Posted huangfuyuan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬虫登录保持及对http的总结相关的知识,希望对你有一定的参考价值。

这几天一直看python爬虫登录保持。实现接口太多,太乱,新手难免云山雾罩。各种get、post,深入理解一下,其实就是由于http的特性导致了这些操作。http是一种无状态、不保存上次通信结果的一种网络传输协议,虽然基于tcp但是不是连接的。

  本文先从原理角度介绍http各种特性,然后基于python语言,介绍其比较出名的一个http库——requests.主要会参考其中文的开发文档来总结,翻译的还是不错的。https://blog.csdn.net/u011054333/article/details/69486364

以上是关于python爬虫登录保持及对http的总结的主要内容,如果未能解决你的问题,请参考以下文章

基于UDP的新一代HTTP协议及对爬虫的影响

Python爬虫模拟登录带验证码网站

登录网站爬虫(保持Cookie不变)

python cookies 爬虫处理

最全Python爬虫总结

Python爬虫模拟登录遇到的问题——CSRF防御