python xpath基础 01
Posted 青春叛逆者
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python xpath基础 01相关的知识,希望对你有一定的参考价值。
from lxml import etree text = ‘‘‘ <div> <ul> <li class="item-0"><a href="link1.html">first item</a></li> <li class="item-1"><a href="link2.html">second item</a></li> <li class="item-inactive"><a href="link3.html">third item</a></li> <li class="item-1"><a href="link4.html">fourth item</a></li> <li class="item-0"><a href="link5.html">fifth item</a> </ul> </div> ‘‘‘ html = etree.HTML(text)#构造了一个XPath解析对象并对HTML文本进行自动修正 result = etree.tostring(html)#输出修正后的结果,类型是bytes print(result.decode(‘utf-8‘))#以utf8的编码的方式打印修正后的内容 # 修正后的内容 test_data=‘‘‘<html><body><div> <ul> <li class="item-0"><a href="link1.html">first item</a></li> <li class="item-1"><a href="link2.html">second item</a></li> <li class="item-inactive"><a href="link3.html">third item</a></li> <li class="item-1"><a href="link4.html">fourth item</a></li> <li class="item-0"><a href="link5.html">fifth item</a> </li></ul> </div> </body></html>‘‘‘
以上是关于python xpath基础 01的主要内容,如果未能解决你的问题,请参考以下文章
Python爬虫编程思想(45):在Chrome中自动获得XPath代码