25.爬取去哪儿网的商品数据-2
Posted lvjing
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了25.爬取去哪儿网的商品数据-2相关的知识,希望对你有一定的参考价值。
需要注意的问题:
1.首先要获取dep和query参数。
2.分析请求的url地址变化,获取routeCount参数。
我配置代码出现的问题:
1.url拼接问题,网站拒绝访问,模拟请求参数设置user-agent和cookie
2.获取routeCount参数会报异常,因为有的url返回的数据中无这个参数信息。
异常如下:
正常如下:
只有获取了routeCount参数,才能接下来获取所有url的内容信息。
以上是关于25.爬取去哪儿网的商品数据-2的主要内容,如果未能解决你的问题,请参考以下文章
用python爬取去哪儿游记攻略为十月假期做准备。。。爬虫之路,永无止境!
Python网络爬虫之Selenium使用代理登陆:爬取去哪儿网站