python xpath基础 01

Posted 青春叛逆者

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python xpath基础 01相关的知识,希望对你有一定的参考价值。

from lxml import etree

text = ‘‘‘
<div>
    <ul>
         <li class="item-0"><a href="link1.html">first item</a></li>
         <li class="item-1"><a href="link2.html">second item</a></li>
         <li class="item-inactive"><a href="link3.html">third item</a></li>
         <li class="item-1"><a href="link4.html">fourth item</a></li>
         <li class="item-0"><a href="link5.html">fifth item</a>
     </ul>
 </div>
‘‘‘
html = etree.HTML(text)#构造了一个XPath解析对象并对HTML文本进行自动修正
result = etree.tostring(html)#输出修正后的结果,类型是bytes
print(result.decode(‘utf-8‘))#以utf8的编码的方式打印修正后的内容
# 修正后的内容
test_data=‘‘‘<html><body><div>
    <ul>
         <li class="item-0"><a href="link1.html">first item</a></li>
         <li class="item-1"><a href="link2.html">second item</a></li>
         <li class="item-inactive"><a href="link3.html">third item</a></li>
         <li class="item-1"><a href="link4.html">fourth item</a></li>
         <li class="item-0"><a href="link5.html">fifth item</a>
     </li></ul>
 </div>
</body></html>‘‘‘

  

以上是关于python xpath基础 01的主要内容,如果未能解决你的问题,请参考以下文章

5.网络爬虫——Xpath解析

Python爬虫编程思想(45):在Chrome中自动获得XPath代码

python基础一 ------xpath基础

Python爬虫基础——XPath语法的学习与lxml模块的使用

[Python 练习爬虫] XPATH基础语法

python爬虫基础04-网页解析库xpath