python爬虫中文乱码问题

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬虫中文乱码问题相关的知识,希望对你有一定的参考价值。

用urllib做一个简单的功能,抓取网页,然后打印,发现中文部分输出异常,全是16进制,如图

技术分享

后面百度了一下,看了几张帖子,终于找到了解决方法,只需要将结果decode一下就ok,decode的编码根据不同的网站都不一样,一般为utf-8

技术分享

之后输出结果正常

技术分享

 

以上是关于python爬虫中文乱码问题的主要内容,如果未能解决你的问题,请参考以下文章

python爬虫抓下来的网页,中间的中文乱码怎么解决

python爬虫中文乱码问题(request方式爬取)

python爬虫windoes的爬虫中文乱码现象,通用转码解决

Python 爬虫过程中的中文乱码问题

python3爬虫中文乱码之请求头‘Accept-Encoding’:br 的问题

Python爬虫中文小说网点查找小说并且保存到txt(含中文乱码处理方法)