python的lxml解析器

Posted 2020-11-19 timxgb

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了python的lxml解析器相关的知识，希望对你有一定的参考价值。

from lxml import etree

import codecs
import sys
from lxml import etree

def parser(p):
    tree = etree.HTML(open(str(p)+‘.html‘, ‘r‘).read())
    
    nodes = tree.xpath("//div[@class=‘BlueTable‘]//tr")
    #nodes = tree.xpath("//text()")
    for n in nodes:
        #mystr=etree.tostring(n,pretty_print=True)
        mystr=etree.tostring(n, method="html")
        print(etree.HTML(mystr).xpath("//text()"))

for p in range(1,211):
    parser(p);

以上是关于python的lxml解析器的主要内容，如果未能解决你的问题，请参考以下文章