获取 archive.org 保存的文件的最新版本

Posted

技术标签:

【中文标题】获取 archive.org 保存的文件的最新版本【英文标题】:Getting the most recent version of a file kept by archive.org 【发布时间】:2013-04-05 18:37:11 【问题描述】:

我有一组收获的原子提要。他们中的一些人已经有几年了,一些帖子链接到不再存在的图像。

有什么方法可以获取Way Back Machine 保存的最新版本?

我知道我可以手动完成,但我想自动化这个过程。 archive.org 提供了一个宁静的 API,但据我所知,它似乎没有提供我需要的特定调用。我想我总是可以回退到网络抓取,但我更喜欢更优雅的解决方案,如果有的话。

【问题讨论】:

【参考方案1】:

想通了。要获取文件的最新版本,您只需 GET URL(不要忘记检查 HTTP 状态代码是否为 200):

http://web.archive.org/web/form-submit.jsp?type=replay&url=<file_url>

【讨论】:

以上是关于获取 archive.org 保存的文件的最新版本的主要内容,如果未能解决你的问题,请参考以下文章

从封面艺术档案 (archive.org) API 中获取专辑封面会由于重定向导致 CORS 错误

json 从archive.org获取所有快照作为列表

pcl2补全文件失败

从 archive.org 下载文件

TFS 使用新文件获取最新版本

TFS 获取最新版本忽略文件