在Python中用requests.get()获取到的内容是啥类型的?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在Python中用requests.get()获取到的内容是啥类型的?相关的知识,希望对你有一定的参考价值。

为什么要获取到网页的html时需要在后面加上.text。这个后缀的作用是什么?为什么不加的时候打印出来的是<Response [200]>

获取文本信息,如果不加的话只返回你一个HTTP状态码,可以使用help(requests.get(url))查看具体参数追问

嗯好的

参考技术A # coding = utf-8
import requests

url = 'http://www.baidu.com'
ret = requests.get(url)
print(type(ret))  # 返回类型 <class 'requests.models.Response'>
print(ret)   # 返回值:<Response [200]>
print(ret.text)  # 输出文本信息
print(ret.content)  # 以二进制输出

追问

ret的内容不知道是啥,是啥类型的?

参考技术B get()返回类型就是:<class 'requests.models.Response'>
加.text是以文本形式输出
参考技术C 用type看一下,那是个对象追问

这个不行他提示的是这个

追答

是的,response.get()返回的是一个response对象,而text是一个属性

Python基本语法

估计你是直接学习爬虫脚本照着打的?

追问

我是看的视频,主要学scrapy的,不过开头他先讲的这个

python requests 库 首次使用

安装requests库

执行pip3 install requests

使用resquests库获取百度网站首页

  1. 打开python idle终端。以python3为例,在终端执行python3并回车。

  2. 输入 import requests , 表示引用requests库。

  3. 输入 r = requests.get("http://www.baidu.com"), 表示以get方式获取百度网页。

  4. r.status_code 返回200,表示返回成功。

  5. r.encoding=‘utf-8‘ 修改编码方式。

  6. r.text 打印网页内容。

以上是关于在Python中用requests.get()获取到的内容是啥类型的?的主要内容,如果未能解决你的问题,请参考以下文章

python requests 库 首次使用

Requests.get(zipfile) 获取“BadZipFile:文件不是 zip 文件”

python爬虫-requests

Python requests模块详解

Python requests.get(URL) 在使用带点的 URL 时返回 404 错误

python requests第三方库详解