python requests的content和text方法的区别

Posted 枫飞飞

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python requests的content和text方法的区别相关的知识,希望对你有一定的参考价值。

转自“https://blog.csdn.net/xie_0723/article/details/51361006

 

一直在想requests的content和text属性的区别,从print 结果来看是没有任何区别的

看下源码:

    @property
    def text(self):
        """Content of the response, in unicode.

        If Response.encoding is None, encoding will be guessed using
        ``chardet``.

        The encoding of the response content is determined based solely on HTTP
        headers, following RFC 2616 to the letter. If you can take advantage of
        non-HTTP knowledge to make a better guess at the encoding, you should
        set ``r.encoding`` appropriately before accessing this property.
        """

    #content的完整代码就不贴了。
    @property
    def content(self):
        """Content of the response, in bytes."""

 

  • 结论是:

resp.text返回的是Unicode型的数据。

resp.content返回的是bytes型也就是二进制的数据。


也就是说,如果你想取文本,可以通过r.text。

如果想取图片,文件,则可以通过r.content。

(resp.json()返回的是json格式数据)

  • 举个栗子
# 例如下载并保存一张图片

import requests

jpg_url = ‘http://img2.niutuku.com/1312/0804/0804-niutuku.com-27840.jpg‘

content = requests.get(jpg_url).content

with open(‘demo.jpg‘, ‘wb‘) as fp:
    fp.write(content)
---------------------------------------------------------------------------------------以下是正确的

1、重点理解

response.text返回的类型是str

response.content返回的类型是bytes,可以通过decode()方法将bytes类型转为str类型

推荐使用:response.content.decode()的方式获取相应的html页面

2、扩展理解

  • response.text
    解码类型:根据HTTP头部对响应的编码做出有根据的推测,推测的文本编码
    如何修改编码方式:response.encoding = ‘gbk‘
  • response.content
    解码类型:没有指定
    如何修改编码方式:response.content.decode(‘utf8‘)
 







以上是关于python requests的content和text方法的区别的主要内容,如果未能解决你的问题,请参考以下文章

python requests的content和text方法的区别

无论 Content-Type 标头如何,在 Python Flask 中获取原始 POST 正文

aiohttp中request.iter_content()的等效方法是啥?

Python爬虫-requests库数据挖掘

Python爬虫-requests库数据挖掘

python怎样保证requests抓取下的text的编码格式正确