python+requests——响应内容以及设置编码格式

Posted 小白龙白龙马

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python+requests——响应内容以及设置编码格式相关的知识,希望对你有一定的参考价值。

响应内容



我们能读取服务器响应的内容。再次以 GitHub 时间线为例:

>>> import requests

>>> r = requests.get(‘https://api.github.com/events‘)

>>> r.text

u‘[{"repository":{"open_issues":0,"url":"https://github.com/...

Requests 会自动解码来自服务器的内容。大多数 unicode 字符集都能被无缝地解码。



请求发出后,Requests 会基于 HTTP 头部对响应的编码作出有根据的推测。



当你访问 r.text 之时,Requests 会使用其推测的文本编码。你可以找出 Requests 使用了什么编码,并且能够使用 r.encoding 属性来改变它:

>>> r.encoding                     #返回编码格式 ‘utf-8‘                            

>>> r.encoding = ‘ISO-8859-1‘     #设置编码格式




如果你改变了编码,每当你访问 r.text ,Request 都将会使用 r.encoding 的新值。

你可能希望在使用特殊逻辑计算出文本的编码的情况下来修改编码。

比如 HTTP 和 XML 自身可以指定编码。这样的话,你应该使用 r.content 来找到编码,然后设置 r.encoding 为相应的编码。这样就能使用正确的编码解析 r.text 了。


----------------------------------------------------------------------------

import requests

response = requests.get("https://www.baidu.com")



print(response.url)                         #返回请求的url:https://www.baidu.com/

print(response.status_code)                #获取响应状态码:200

print(response.encoding)                    #返回当前的编码格式:ISO-8859-1

response.encoding = ‘utf-8‘                 #设置编码格式

print(response.encoding)                    #返回:utf-8   说明上一步设置成功



print(response.content)       #返回:b‘<!DOCTYPE html>
<!--STATUS OK--><html> <head><meta http-equiv=content-type content=text/html;charset=utf-8>
                               
                                      <meta http-equiv=X-UA-Compatible content=IE=Edge><meta content=always name=referrer>

执行结果:


https://www.baidu.com/

200

ISO-8859-1

utf-8


b‘<!DOCTYPE html>
<!--STATUS OK--><html> <head><meta http-equiv=content-type content=text/html;charset=utf-8>

<meta http-equiv=X-UA-Compatible content=IE=Edge><meta content=always name=referrer>

=============================================================================================================================

 

以上是关于python+requests——响应内容以及设置编码格式的主要内容,如果未能解决你的问题,请参考以下文章

Python-Requests

[实战演练]python3使用requests模块爬取页面内容

[实战演练]python3使用requests模块爬取页面内容

使用python3 requests和bs4进行爬虫(二)爬取文章

python requests模块-Response

python接口自动化20-requests获取响应时间(elapsed)与超时(timeout)