python中lxml这个库主要是干啥的?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python中lxml这个库主要是干啥的?相关的知识,希望对你有一定的参考价值。
参考技术A功能
1、解析html
2、文件读取
1、示例代码
# _*_coding : UTF-8 _*_
# 开发组织 : 个人开发
# 创建作者 :
# 开发时间 : 2020/11/5 23:33
# 文件名称 : a20.py
# 开发工具 : PyCharm
from lxml import etree
txt = '''
<div>
<ol>
<li>星期一</li>
<li>星期二</li>
<li>星期三</li>
<li>星期四</li>
<li>星期五</li>
<li>星期六</li>
<li>星期日</li>
</ol>
</div>
'''
hmk = etree.HTML(txt)
res = etree.tostring(hmk, encoding='utf-8')
print(res.decode('utf-8'))
2、示例结果
<html><body><div>
<ol>
<li>星期一</li>
<li>星期二</li>
<li>星期三</li>
<li>星期四</li>
<li>星期五</li>
<li>星期六</li>
<li>星期日</li>
</ol>
</div>
</body></html>
参考技术B 主要是解析html文件的,获取到的html文件想要抓取你想抓的部分需要先解析,然后才能用xpath等获取。以上是关于python中lxml这个库主要是干啥的?的主要内容,如果未能解决你的问题,请参考以下文章