亚马逊商品页面爬取

Posted Dong诗原

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了亚马逊商品页面爬取相关的知识,希望对你有一定的参考价值。

通过来源审查,访问错误,不支持直接访问:

更改头信息,重新定义 user-agent,模拟浏览器(Mozilla/5.0浏览器标识字段,页面信息不全,可以成功访问):

全代码:

  import requests

     url="https://www.amazon.cn/?tag=baidu250-23&hvadid={creative}&ref=pz_ic_22fvxh4dwf_e"
        try:
    kv={\'user-agent\':\'Mozilla/5.0\'}
    r=requests.get(url,headers=kv)
    r.raise_for_status()
    r.encoding=r.apparent_encoding
    print(r.text[1000:2000])
  except:
    print("爬取失败!")

 

以上是关于亚马逊商品页面爬取的主要内容,如果未能解决你的问题,请参考以下文章

Requests库练习

Requests库网络爬虫实战

第一周 2(实战)

amazon爬取亚马逊页面信息

卖家注意:商品描述页面将不能使用HTML标记!

对于淘宝、京东商品评论只能看100页的反爬虫措施要怎么解决,怎么才能爬取一件商品的所有评论