Python爬虫编程思想(90):分析异步装载页面返回的json数据

Posted 蒙娜丽宁

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想(90):分析异步装载页面返回的json数据相关的知识,希望对你有一定的参考价值。

        在上一篇文章中知道了异步请求的URL,就可以通过requests等网络库通过URL抓取数据,不过返回的数据格式不是html,也不是XML,而是JSON。所以不能使用XPath和CSS选择器处理,而是使用json模块中的loads函数将字符串形式的JSON转换为Python字典。

        下面的例子使用requests库访问了页面异步访问的URL,并将返回数据转换为Python字典,最后输出了返回的所有视频课程名称。

import requests
import json
from lxml import etree
result = requests.get(\'http://localhost:1234/data\')
# 由于返回的数据包含中文(unicode编码),所以需要将其转码
text = result.text.encode(\'utf-8\').decode(\'unicode-escape\')
print(text)
# 将字符串形式的JSON转换为Python字典
data = json.loads(text)
print(\'个数:\',len(data))
# 输出返回的所有视频课程名称
for value in data:
    print(value[\'name\'])

以上是关于Python爬虫编程思想(90):分析异步装载页面返回的json数据的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫编程思想(89):如何用逆向工程分析异步加载页面

Python爬虫编程思想(89):如何用逆向工程分析异步加载页面

Python爬虫编程思想(106):基于Splash的爬虫--异步处理与go函数

Python爬虫编程思想(88):抓取异步数据的原理

Python爬虫编程思想(88):抓取异步数据的原理

Python爬虫编程思想(26):Twisted的异步编程模型