Python HTTP库requests中文页面乱码解决方案!

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python HTTP库requests中文页面乱码解决方案!相关的知识,希望对你有一定的参考价值。

html编码类型赋与获取到文本

获取html编码类型:

1.使用apparent_encoding可以获得真实编码

1 >>> response.apparent_encoding 
2 GB2312

2.从html的meta中抽取

1 >>> requests.utils.get_encodings_from_content(response.text)
2 [gb2312]

前戏结束,只出一招即可(随意选用):

1 # response.encoding = response.apparent_encoding
2 response.encoding = gb2312

 

以上是关于Python HTTP库requests中文页面乱码解决方案!的主要内容,如果未能解决你的问题,请参考以下文章

Python学习request库

Python爬虫:HTTP协议Requests库

python requests库学习笔记(上)

requests第三方库

Python requests多页面爬取案例 񩲝

Python requests多页面爬取案例 񑶍