XML 和 HTML、lxml

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了XML 和 HTML、lxml相关的知识,希望对你有一定的参考价值。

参考技术A XML 和 html 的区别

数据格式 描述 设计目标
XML Extensible Markup Language (可扩展标记语言) 被设计为传输和存储数据,其焦点是数据的内容。
HTML HyperText Markup Language (超文本标记语言) 显示数据以及如何更好显示数据。
HTML DOM Document Object Model for HTML (文档对象模型) 通过 HTML DOM,可以访问所有的 HTML 元素,连同它们所包含的文本和属性。可以对其中的内容进行修改和删除,同时也可以创建新的元素。

from lxml import etree

html = etree.HTML(html) ----> 使用xpath

Python爬虫编程思想(39):使用lxml解析HTML与XML

 

目录

1. 安装lxml

2. 操作XML

3. 操作HTML

    

          lxml是Python的一个解析库,用于解析HTML和XML,支持XPath解析方式。由于lxml底层是使用C语言编写的,所以解析效率非常高。本节会介绍lxml在Windows、Linux和Mac OS X下的安装方式,以及lxml的基本使用方法。

1. 安装lxml<

以上是关于XML 和 HTML、lxml的主要内容,如果未能解决你的问题,请参考以下文章

Python Beautiful Soup 解析库的使用

python学习(25) BeautifulSoup介绍和实战

BeautifulSoup4

011 Python 爬虫库安装简单使用

python中的BeautifulSoup使用小结

干货丨XML和HTML的区别和联系介绍