用python解压html链接

Posted

技术标签:

【中文标题】用python解压html链接【英文标题】:unzipping an html link with python 【发布时间】:2017-11-30 11:54:14 【问题描述】:

我有一个 html 网页,表格中有许多下载链接。我已经隔离了我想要的拉链的路径。它们都包含一个 .xlsx 文件,但有时也包含其他文件。

    有没有办法避免下载 zip 并直接访问里面的文件?

    如果我确实需要下载它们,我如何跟踪压缩包的下载位置? (所以我可以提取 .xlsx)

我目前正在研究 zipfilerequests 以寻求解决方案。 zipfile.extract 需要 zip 文件的路径,但我不知道脚本将下载到哪里。 requests给出了一个响应对象,但是如何提示下载呢?

【问题讨论】:

请阅读***.com/help/how-to-ask和***.com/help/mcve 【参考方案1】:

有没有办法避免下载 zip 并直接访问里面的文件?

一般来说:没有。 Web 服务器在文件系统中提供文件,而不是在 zip 存档中。

如果我确实需要下载它们,我如何跟踪压缩包的下载位置? (所以我可以提取 .xlsx)

如果未指定,则位置为当前目录,即脚本已在其中启动的目录。

【讨论】:

以上是关于用python解压html链接的主要内容,如果未能解决你的问题,请参考以下文章

python-----自动解压并删除zip文件

python用zipfile模块打包文件或是目录解压zip文件实例

python利用7z批量解压rar

Python3 爬虫XPath Helper的安装与使用

Python3链接Oracle

Python解压.zip文件