python的lxml解析器

Posted timxgb

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python的lxml解析器相关的知识,希望对你有一定的参考价值。

from lxml import etree

import codecs
import sys
from lxml import etree

def parser(p):
    tree = etree.HTML(open(str(p)+.html, r).read())
    
    nodes = tree.xpath("//div[@class=‘BlueTable‘]//tr")
    #nodes = tree.xpath("//text()")
    for n in nodes:
        #mystr=etree.tostring(n,pretty_print=True)
        mystr=etree.tostring(n, method="html")
        print(etree.HTML(mystr).xpath("//text()"))

for p in range(1,211):
    parser(p);

 

以上是关于python的lxml解析器的主要内容,如果未能解决你的问题,请参考以下文章

Python:在 lxml.cssselect 中使用的 CSS 选择器

lxml / BeautifulSoup 解析器警告

python模块--BeautifulSoup4 和 lxml

Python 之lxml解析模块

Python爬虫(十四)_BeautifulSoup4 解析器

[Python]BeautifulSoup安装与使用