用python解压html链接

Posted 2023-03-06

技术标签:

【中文标题】用python解压html链接【英文标题】：unzipping an html link with python 【发布时间】：2017-11-30 11:54:14 【问题描述】：

我有一个 html 网页，表格中有许多下载链接。我已经隔离了我想要的拉链的路径。它们都包含一个 .xlsx 文件，但有时也包含其他文件。

有没有办法避免下载 zip 并直接访问里面的文件？

如果我确实需要下载它们，我如何跟踪压缩包的下载位置？（所以我可以提取 .xlsx）

我目前正在研究 zipfile 和 requests 以寻求解决方案。 zipfile.extract 需要 zip 文件的路径，但我不知道脚本将下载到哪里。 requests给出了一个响应对象，但是如何提示下载呢？

【问题讨论】：

请阅读***.com/help/how-to-ask和***.com/help/mcve 【参考方案1】：

有没有办法避免下载 zip 并直接访问里面的文件？

一般来说：没有。 Web 服务器在文件系统中提供文件，而不是在 zip 存档中。

如果我确实需要下载它们，我如何跟踪压缩包的下载位置？（所以我可以提取 .xlsx）

如果未指定，则位置为当前目录，即脚本已在其中启动的目录。

【讨论】：

以上是关于用python解压html链接的主要内容，如果未能解决你的问题，请参考以下文章