2023网络爬虫 -- 获取动态加载数据

Posted web安全工具库

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2023网络爬虫 -- 获取动态加载数据相关的知识,希望对你有一定的参考价值。

1、爬取的网址

http://www.kfc.com.cn/kfccda/storelist/index.aspx

2、要爬取的内容,输入关键字,点击查询,获取餐厅名称和餐厅地址

3、F12,打开开发者工具,点击查询,抓包

4、点击标头,查看请求网址,是post请求,查看载荷也就是提交的参数

http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword

5、表单数据就是我们要提交的数据

6、导入requests包

import requests

7、头和提交的参数

头="User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/86.0.4240.198 Safari/537.36"参数="cname":"","pid":"","keyword": "河南","pageIndex": "1","pageSize": "10",

8、要获取的网址

网页="http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword"

9、post请求,提交参数需要data

响应=requests.post(网页,headers=头,data =参数)

10、获取JSON数据

响应内容=响应.json()

11、将数据存储

withopen("kfc.txt","w",encoding="utf-8") as 数据:for i in 响应内容['Table1']:        店名=i['storeName']        地址=i["addressDetail"]        数据.write(店名+"餐厅"+":"+地址+"\\n")

12、存储结果

以上是关于2023网络爬虫 -- 获取动态加载数据的主要内容,如果未能解决你的问题,请参考以下文章

爬虫之动态获取数据

2017.07.28 Python网络爬虫之爬虫实战 今日影视2 获取JS加载的数据

爬虫:获取动态加载数据(selenium)(某站)

2023爬虫学习笔记 -- 解决爬虫Cookies问题

python爬虫 selenium+phantomjs动态解析网页,加载页面成功,返回空数据

Python网络爬虫_爬取Ajax动态加载和翻页时url不变的网页