爬虫中使用格式化参数动态修改URL

Posted kintsugi

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫中使用格式化参数动态修改URL相关的知识,希望对你有一定的参考价值。

在爬取京东商品评论区的过程中,发现每个商品的评论区接口相似,应立即意识到:

技术图片

 

于是编写函数,通过格式化参数动态改变URL

定义fetch_url为商品ID,page为当前评论页数,将原URL中的id和page用%s占位符代替,后面使用%(fetch_url, page)替换

注意:若是单个参数,使用 %page 即可

   如果是多个函数,使用 %(fetch_url, page).而并不是我之前的写法:%fetch_url, %page

def fetch_comment(fetch_url, page=0):

url = ‘https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98&productId=%s&score=0&sortType=5&page=%s&pageSize=10&isShadowSku=0&fold=1‘ %(fetch_url, page)

以上是关于爬虫中使用格式化参数动态修改URL的主要内容,如果未能解决你的问题,请参考以下文章

在android中动态创建选项卡并使用传入的参数加载片段

爬虫 第五天

URL 片段中的多个参数

爬虫1 实例

3-爬虫-模拟登录图片验证码处理

python爬虫把url链接编码成gbk2312格式过程解析