爬虫入门

Posted wbyixx

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫入门相关的知识,希望对你有一定的参考价值。

http

当用户在浏览器地址栏输入了网址,进行跳转,就相当于发送了一个网络请求
这个过程需要有一定的规则,这个规则就是 http(超文本传输协议)

http的请求方式:

  • get
    • 明文传参,比较便捷,但相对来说不安全
    • 参数的长度有限制
  • post
    • 比较安全
    • 数据整体没有限制
    • 可以上传文件
  • put
    • 不完全的
  • delete
    • 删除一些信息
  • head

请求:

  • 发送网络请求,带一定的数据给服务器,不带也可以
  • 发送的东西存放在请求头
    响应:
  • 接收到的请求存放在响应头里

发送网络请求的过程:网址 ==> DNS服务器解析 ==> 拿到服务器ip ==> 访问服务器

爬虫入门

爬虫:使用代码模拟用户,批量发送网络请求,批量的获取数据

以上是关于爬虫入门的主要内容,如果未能解决你的问题,请参考以下文章

如何入门爬虫(基础篇)

如何入门 Python 爬虫?

python爬虫

如何入门 Python 爬虫

如何入门 Python 爬虫

如何入门 Python 爬虫