用python解压html链接
Posted
技术标签:
【中文标题】用python解压html链接【英文标题】:unzipping an html link with python 【发布时间】:2017-11-30 11:54:14 【问题描述】:我有一个 html 网页,表格中有许多下载链接。我已经隔离了我想要的拉链的路径。它们都包含一个 .xlsx 文件,但有时也包含其他文件。
有没有办法避免下载 zip 并直接访问里面的文件?
如果我确实需要下载它们,我如何跟踪压缩包的下载位置? (所以我可以提取 .xlsx)
我目前正在研究 zipfile
和 requests
以寻求解决方案。 zipfile.extract
需要 zip 文件的路径,但我不知道脚本将下载到哪里。 requests
给出了一个响应对象,但是如何提示下载呢?
【问题讨论】:
请阅读***.com/help/how-to-ask和***.com/help/mcve 【参考方案1】:有没有办法避免下载 zip 并直接访问里面的文件?
一般来说:没有。 Web 服务器在文件系统中提供文件,而不是在 zip 存档中。
如果我确实需要下载它们,我如何跟踪压缩包的下载位置? (所以我可以提取 .xlsx)
如果未指定,则位置为当前目录,即脚本已在其中启动的目录。
【讨论】:
以上是关于用python解压html链接的主要内容,如果未能解决你的问题,请参考以下文章