在python2的使用中,总会遇到各种各样的编码问题,这也是使用Python2最头疼的一件事情,幸好python3解决了编码的问题。
下面我在爬虫时遇到的类似é??????ooè?¨??????é???? ?-????è??(????-?格式的编码。
解决:
response = requests.get(url)
response.encoding = response.apparent_encoding # 将乱码进行编码
html = etree.HTML(response.text)