在python中从URL下载实时pdf文件时出错

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在python中从URL下载实时pdf文件时出错相关的知识,希望对你有一定的参考价值。

我想下载一个低于Python函数的pdf文件。我能够在浏览器中打开URL(重定向到另一个URL)。但是代码出现了404错误。

import requests
 def downloadFile(url, fileName):
        r = requests.get(url, allow_redirects=True, stream=True)
        with open(fileName, "wb") as pdf:             
            for chunk in r.iter_content(chunk_size=1024):
                if chunk:
                    pdf.write(chunk)


downloadFile("http://pubs.vmware.com/vsphere-55/topic/com.vmware.ICbase/PDF/vsphere-esxi-vcenter-server-552-storage-guide.pdf", "vsphere-esxi-vcenter-server-552-storage-guide.pdf")
答案

很少有网站根据语言或位置进行阻止。以下代码与附加标题工作

In [11]: def downloadFile(url, fileName):
         headers = {'Accept-Language': 'en-US,en;q=0.9,te;q=0.8'}
         r = requests.get(url, allow_redirects=True, stream=True, headers=headers)
        with open(fileName, "wb") as pdf:             
           for chunk in r.iter_content(chunk_size=1024):
               if chunk:
                    pdf.write(chunk)

In [12]: downloadFile("http://pubs.vmware.com/vsphere-55/topic/com.vmware.ICbase/PDF/vsphere-esxi-vcenter-server-552-storage-guide.pdf", "vsphere-esxi-vcenter-server-552-storage-guide.pdf")

以上是关于在python中从URL下载实时pdf文件时出错的主要内容,如果未能解决你的问题,请参考以下文章

如何在 C# 中从外部站点的 url 读取 PDF 文件 [关闭]

如何在 Python 中从 url 下载文件 [重复]

在 python 中从 zip 加载音频文件时出错

在 Python 3 中从 Web 下载文件

在 ios 中从 iCloud 获取文件时出错

如何在 android 中从远程 url 播放实时视频流?