如何刮内容?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何刮内容?相关的知识,希望对你有一定的参考价值。

我创建了以下代码来获取内容:

import requests

r = requests.post(url='https://icecat.us/index.php/product/offers')

print r
print r.content

请求返回HTTP响应代码200确定。但是r.content是空的,因此没有检索到任何内容,即使Developer工具中的响应肯定不是空的。

我错过了什么?为什么内容未正确检索?

谢谢你的建议!

答案

request.get电话需要params,而不是datadata是为request.post

import requests

payload = {
    'num' : '37963146',
    'lang' : 'us',
    'offers_country' : '0'
}

r = requests.get(
    url='https://icecat.us/index.php/product/offers',
    params=payload,
    headers={
        'X-Requested-With': 'XMLHttpRequest'
    }
)

print r
print r.content

顺便说一下,我在Upwork上发布了这个帖子。

以上是关于如何刮内容?的主要内容,如果未能解决你的问题,请参考以下文章

使用幻像进行刮擦时向下滚动(Node.js)

该脚本如何使用 AJAX 从其他站点刮取 HTML,而不需要这些站点上的 CORS 标头?

自动刮34圈代码

如何将列表刮成列表熊猫

如何刮掉这个 squawka 页面?

Prometheus 如何刮取 Kafka 主题?