pyquery——以jQuery的语法来操作解析xml文档

Posted sengzhao666

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pyquery——以jQuery的语法来操作解析xml文档相关的知识,希望对你有一定的参考价值。

pyquery允许对xml文档进行jquery查询。该API尽可能类似于jquery。pyquery使用lxml进行快速的xml和html操作,能够以jQuery的语法来操作解析 HTML 文档。
(今天报错还未调试成功,明天继续)
技术图片

 

 

import requests
from pyquery import PyQuery as pq

def get_page(url):
    """发起请求 获得源码"""
    r = requests.get(url)
    r.encoding = utf8
    html = r.text
    return html


def parse(text):
    """解析数据 写入文件"""
    doc = pq(text)
    # 获得每一行的tr标签
    ths  = doc(table.table thead tr.VirusTable_1-1-156_26gN5Z).items()
    for th in ths:
        area = th.find(span).text()  # 地区
        confirm = th.find(td:nth-child(2)).text()  # 确诊
        death = th.find(td:nth-child(3)).text()  # 死亡
        cure = th.find(td:nth-child(4)).text()  # 治愈
        with open(D:yiqing.csv, a+, encoding=utf8) as f:
            f.write(area + 		)
            f.write(confirm + 		)
            f.write(death + 		)
            f.write(cure + 		
)
    print("写入完成")
    """
    tds = doc(‘table.table tbody tr‘).items()
    for td in tds:
        rank = td.find(‘td:first-child‘).text()     # 排名
        name = td.find(‘div‘).text()  # 大学名称
        city = td.find(‘td:nth-child(3)‘).text()    # 城市
        score = td.find(‘td:nth-child(4)‘).text()   # 总分
        with open(‘D:yiqing.csv‘, ‘a+‘, encoding=‘utf8‘) as f:
            f.write(rank + ‘		‘)
            f.write(name + ‘		‘)
            f.write(city + ‘		‘)
            f.write(score + ‘		
‘)
    print("写入完成")
    """

if __name__ == "__main__":
    url = "https://voice.baidu.com/act/newpneumonia/newpneumonia"
    text = get_page(url)
    parse(text)

 

以上是关于pyquery——以jQuery的语法来操作解析xml文档的主要内容,如果未能解决你的问题,请参考以下文章

一起学爬虫——PyQuery常用用法总结

Python爬虫应用实战案例-pyquery在爬虫中的应用,爬取猫眼电影数据

python3 爬虫神器pyquery的使用实例

Pyquery解析库的安装和使用

使用 PyQuery

PyQuery