python的lxml解析器
Posted timxgb
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python的lxml解析器相关的知识,希望对你有一定的参考价值。
from lxml import etree import codecs import sys from lxml import etree def parser(p): tree = etree.HTML(open(str(p)+‘.html‘, ‘r‘).read()) nodes = tree.xpath("//div[@class=‘BlueTable‘]//tr") #nodes = tree.xpath("//text()") for n in nodes: #mystr=etree.tostring(n,pretty_print=True) mystr=etree.tostring(n, method="html") print(etree.HTML(mystr).xpath("//text()")) for p in range(1,211): parser(p);
以上是关于python的lxml解析器的主要内容,如果未能解决你的问题,请参考以下文章
Python:在 lxml.cssselect 中使用的 CSS 选择器
python模块--BeautifulSoup4 和 lxml