Xpath编码问题解决
Posted ggrm
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Xpath编码问题解决相关的知识,希望对你有一定的参考价值。
使用Xpath获取属性时,出现乱码问题,解决办法找了好多,终于解决,特将办法贴在这,供大家尝试
不要直接简单的将爬取的网页设置为utf-8,
先通过print(r.encoding)输出看看爬取的是什么编码,每个网页采用的编码不同,
后通过标红线的代码可解决问题
selector_new = etree.html(html.text)
是将HTML转化为文本/html 格式
selector_new = etree.HTML(html.content)
是将HTML转化为二进制/html 格式
我是通过以下链接博客解决的:
https://blog.csdn.net/hyg55555/article/details/85246353
以上是关于Xpath编码问题解决的主要内容,如果未能解决你的问题,请参考以下文章
未解决的问题,登录163邮箱http://mail.163.com/,用xpath的方式定位密码输入框的时候,总是报找不到该元素
如何解决硒循环中的这个错误? InvalidSelectorException:消息:无效选择器:无法使用 xpath 定位元素