lxml中的Xpath的使用

Posted my-global

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了lxml中的Xpath的使用相关的知识,希望对你有一定的参考价值。

  lxml中的Xpath的使用:

#coding:utf-8
import lxml
import lxml.etree
text="""
<div>
    <ul>
         <li class="item-0"><a href="link1.html">first item</a></li>
         <li class="item-1"><a href="link2.html">second item</a></li>
         <li class="item-inactive"><a href="link3.html">third item</a></li>
         <li class="item-1"><a href="link4.html">fourth item</a></li>
         <li class="item-0"><a href="link5.html">fifth item</a> # 注意,此处缺少一个 </li> 闭合标签
     </ul>
 </div>
"""
‘‘‘
html=lxml.etree.HTML(text) #html处理文本
print (type(html))
print html
print lxml.etree.tostring(html)  
‘‘‘


html=lxml.etree.parse("index.html") #parse处理文件
print(type(html))
print(html)
print(lxml.etree.tostring(html))

 

以上是关于lxml中的Xpath的使用的主要内容,如果未能解决你的问题,请参考以下文章

使用 xpath/lxml 抓取文本

使用lxml的Python脚本,xpath返回空列表

lxml结合xpath注意事项

在 Python 中使用 XPath 和 LXML

爬虫进阶数据提取-lxml模块(万能操作)

python中的beautifulsoup和xpath有啥异同点