2023网络爬虫 -- 获取动态加载数据

Posted 2023-02-15 web安全工具库

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了2023网络爬虫 -- 获取动态加载数据相关的知识，希望对你有一定的参考价值。

1、爬取的网址

http://www.kfc.com.cn/kfccda/storelist/index.aspx

2、要爬取的内容，输入关键字，点击查询，获取餐厅名称和餐厅地址

3、F12，打开开发者工具，点击查询，抓包

4、点击标头，查看请求网址，是post请求，查看载荷也就是提交的参数

http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword

5、表单数据就是我们要提交的数据

6、导入requests包

import requests

7、头和提交的参数

头="User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/86.0.4240.198 Safari/537.36"参数="cname":"","pid":"","keyword": "河南","pageIndex": "1","pageSize": "10",

8、要获取的网址

网页="http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword"

9、post请求，提交参数需要data

响应=requests.post(网页,headers=头,data =参数)

10、获取JSON数据

响应内容=响应.json()

11、将数据存储

withopen("kfc.txt","w",encoding="utf-8") as 数据:for i in 响应内容['Table1']:        店名=i['storeName']        地址=i["addressDetail"]        数据.write(店名+"餐厅"+":"+地址+"\\n")

12、存储结果

以上是关于2023网络爬虫 -- 获取动态加载数据的主要内容，如果未能解决你的问题，请参考以下文章

爬虫之动态获取数据

2017.07.28 Python网络爬虫之爬虫实战今日影视2 获取JS加载的数据

爬虫：获取动态加载数据（selenium）（某站）

2023爬虫学习笔记 -- 解决爬虫Cookies问题

python爬虫 selenium+phantomjs动态解析网页，加载页面成功，返回空数据

Python网络爬虫_爬取Ajax动态加载和翻页时url不变的网页