python中lxml这个库主要是干啥的?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python中lxml这个库主要是干啥的?相关的知识,希望对你有一定的参考价值。

参考技术A

功能

1、解析html

2、文件读取


1、示例代码

# _*_coding : UTF-8 _*_
# 开发组织 : 个人开发
# 创建作者 : 
# 开发时间 : 2020/11/5 23:33
# 文件名称 : a20.py
# 开发工具 : PyCharm

from lxml import etree

txt = '''
<div>
<ol>
<li>星期一</li>
<li>星期二</li>
<li>星期三</li>
<li>星期四</li>
<li>星期五</li>
<li>星期六</li>
<li>星期日</li>
</ol>
</div>
'''
hmk = etree.HTML(txt)
res = etree.tostring(hmk, encoding='utf-8')
print(res.decode('utf-8'))


2、示例结果

<html><body><div>

        <ol>

            <li>星期一</li>

            <li>星期二</li>

            <li>星期三</li>

            <li>星期四</li>

            <li>星期五</li>

            <li>星期六</li>

            <li>星期日</li>

        </ol>

    </div>

</body></html>

参考技术B 主要是解析html文件的,获取到的html文件想要抓取你想抓的部分需要先解析,然后才能用xpath等获取。

以上是关于python中lxml这个库主要是干啥的?的主要内容,如果未能解决你的问题,请参考以下文章

Python类中的self到底是干啥的

函数 assert() 是干啥的 包含在哪个库中

Python类中的self到底是干啥的

Python类中的self到底是干啥的

matlab gui 是干啥的?

Python里面有个inf是干啥的