Python3.x:BeautifulSoup()解析网页内容出现乱码

Posted 整合侠

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python3.x:BeautifulSoup()解析网页内容出现乱码相关的知识,希望对你有一定的参考价值。

Python3.x:BeautifulSoup()解析网页内容出现乱码

问题:

start_html = requests.get(all_url, headers=Hostreferer)
BeautifulSoup(start_html.text, "html.parser")

 出现乱码; 

解决方案:

 将BeautifulSoup(start_html.text, "html.parser")替换为BeautifulSoup(start_html.content, "html.parser"),即可;

start_html = requests.get(all_url, headers=Hostreferer)
BeautifulSoup(start_html.content, "html.parser")

 

以上是关于Python3.x:BeautifulSoup()解析网页内容出现乱码的主要内容,如果未能解决你的问题,请参考以下文章

Python3.x的BeautifulSoup解析html常用函数

Python3.X BeautifulSoup([your markup], "lxml") markup_type=markup_type))的解决方案

python3 爬虫(urllib+beautifulsoup)beautifulsoup自动检测编码错误

《Python网络数据采集》笔记之BeautifulSoup

Python3.X爬虫

Python——各类库的安装(持续更新)