爬虫入门
Posted wbyixx
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫入门相关的知识,希望对你有一定的参考价值。
http
当用户在浏览器地址栏输入了网址,进行跳转,就相当于发送了一个网络请求
这个过程需要有一定的规则,这个规则就是 http(超文本传输协议)
http的请求方式:
- get
- 明文传参,比较便捷,但相对来说不安全
- 参数的长度有限制
- post
- 比较安全
- 数据整体没有限制
- 可以上传文件
- put
- 不完全的
- delete
- 删除一些信息
- head
请求:
- 发送网络请求,带一定的数据给服务器,不带也可以
- 发送的东西存放在请求头
响应: - 接收到的请求存放在响应头里
发送网络请求的过程:网址 ==> DNS服务器解析 ==> 拿到服务器ip ==> 访问服务器
爬虫入门
爬虫:使用代码模拟用户,批量发送网络请求,批量的获取数据
以上是关于爬虫入门的主要内容,如果未能解决你的问题,请参考以下文章