Python - 使用Python 3 urllib发出POST请求

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python - 使用Python 3 urllib发出POST请求相关的知识,希望对你有一定的参考价值。

我正在尝试向以下页面发出POST请求:http://search.cpsa.ca/PhysicianSearch

为了模拟单击“搜索”按钮而不填写任何表单,这会向页面添加数据。在查看chrome开发人员工具中的网络选项卡时,通过单击按钮获取POST标头信息。我发布这个而不是仅仅从其他类似问题复制解决方案的原因是我相信我可能没有得到正确的标题信息。格式是否正确,我是否抓住了正确的信息?我之前从未发过过POST请求。

这就是我成功拼凑的东西:

import urllib.parse
import urllib.request


data = urllib.parse.urlencode({'Host': 'search.cpsa.ca', 'Connection': 'keep-alive', 'Content-Length': 23796,
                                     'Origin': 'http://search.cpsa.ca', 'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
                                     'Cahce-Control': 'no-cache', 'X-Requested-With': 'XMLHttpRequest',
                                     'X-MicrosoftAjax': 'Delta=true', 'Accept': '*/*',
                                     'Referer': 'http://search.cpsa.ca/PhysicianSearch',
                                     'Accept-Encoding': 'gzip, deflate',
                                     'Accept-Language': 'en-GB,en-US;q=0.8,en;q=0.6',
                                     'Cookie': 'ASP.NET_SessionId=kcwsgio3dchqjmyjtwue402c; _ga=GA1.2.412607756.1459536682; _gat=1'})


url = "http://www.musi-cal.com/cgi-bin/query?%s"

data = data.encode('ascii')
with urllib.request.urlopen("http://search.cpsa.ca/PhysicianSearch", data) as f:
    print(f.read().decode('utf-8'))

此解决方案输出页面的HTML,但不包含我想要从POST请求中检索的任何数据。

答案

这就是你如何做到的。

from urllib import request, parse
data = parse.urlencode(<your data dict>).encode()
req =  request.Request(<your url>, data=data) # this will make the method "POST"
resp = request.urlopen(req)
另一答案

谢谢C熊猫。你真的让我很容易学习这个模块。

我发布了我们传递的字典,不为我编码。我不得不做一个小改动 -

from urllib import request, parse
import json

# Data dict
data = { 'test1': 10, 'test2': 20 }

# Dict to Json
# Difference is { "test":10, "test2":20 }
data = json.dumps(data)

# Convert to String
data = str(data)

# Convert string to byte
data = data.encode('utf-8')

# Post Method is invoked if data != None
req =  request.Request(<your url>, data=data)

# Response
resp = request.urlopen(req)
另一答案

上面的代码用一些额外的“编码JSON字符串”给我带来了很多问题。这看起来是一种更好的方法:

from urllib import request, parse

url = "http://www.example.com/page"

data = {'test1': 10, 'test2': 20}
data = parse.urlencode(data).encode()

req = request.Request(url, data=data)
response = request.urlopen(req)

print (response.read())

以上是关于Python - 使用Python 3 urllib发出POST请求的主要内容,如果未能解决你的问题,请参考以下文章

python模块自学

python 简易音乐盒子

使用python将某些网站的HTML保存在txt文件中

python3爬虫初探之文件保存

python爬虫之基本知识

基本urllib库