Python 爬虫常见的坑和解决方法

Posted cxscode

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 爬虫常见的坑和解决方法相关的知识,希望对你有一定的参考价值。

1.请求时出现HTTP Error 403: Forbidden

headers = {‘User-Agent‘:‘Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0‘}  

req = urllib.request.Request(url=url, headers=headers)  

urllib.request.urlopen(req).read()  

详细:https://www.2cto.com/kf/201309/242273.html

 

2.保存html内容时出现Python UnicodeEncodeError: ‘gbk‘ codec can‘t encode character

f = open("out.html","w")  

换成

f = open("out.html","w",encoding=‘utf-8‘)  

详细:http://www.jb51.net/article/64816.htm

 

以上是关于Python 爬虫常见的坑和解决方法的主要内容,如果未能解决你的问题,请参考以下文章

常见的移动端H5页面开发遇到的坑和解决办法

Python scrapy 常见问题及解决 遇到的坑

记一次SpringBoot 开发中所遇到的坑和解决方法

纯Socket(BIO)长链接编程的常见的坑和填坑套路

网络爬虫:配置seleniumpycharm(windows平台)

java通过key判断map中是否containsKey一个对象(遇到的坑和解决办法)