亚马逊商品页面爬取

Posted 2020-10-17 Dong诗原

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了亚马逊商品页面爬取相关的知识，希望对你有一定的参考价值。

通过来源审查，访问错误，不支持直接访问：

更改头信息，重新定义 user-agent，模拟浏览器（Mozilla/5.0浏览器标识字段，页面信息不全，可以成功访问）：

全代码：

　　import requests

　 url="https://www.amazon.cn/?tag=baidu250-23&hvadid={creative}&ref=pz_ic_22fvxh4dwf_e"
try:
　　　　kv={\'user-agent\':\'Mozilla/5.0\'}
　　　　r=requests.get(url,headers=kv)
　　　　r.raise_for_status()
　　　　r.encoding=r.apparent_encoding
　　　　print(r.text[1000:2000])
except:
　　　　print("爬取失败！")

以上是关于亚马逊商品页面爬取的主要内容，如果未能解决你的问题，请参考以下文章

卖家注意：商品描述页面将不能使用HTML标记！

对于淘宝、京东商品评论只能看100页的反爬虫措施要怎么解决，怎么才能爬取一件商品的所有评论