如何获取任何 URL 或网页的 Google 缓存年龄? [关闭]
Posted
技术标签:
【中文标题】如何获取任何 URL 或网页的 Google 缓存年龄? [关闭]【英文标题】:How can I get the Google cache age of any URL or web page? [closed] 【发布时间】:2011-06-01 10:00:48 【问题描述】:在我的项目中,我需要将 Google 缓存年龄添加为重要信息。我尝试搜索 Google 缓存年龄的来源,即自 Google 上次重新索引列出的页面以来的天数。
我在哪里可以获得 Google 缓存年龄?
【问题讨论】:
webapps.stackexchange.com/questions/15633/… 【参考方案1】:使用网址
https://webcache.googleusercontent.com/search?q=cache:<your url without "http://">
例子:
https://webcache.googleusercontent.com/search?q=cache:***.com
它包含这样的标题:
这是 Google 的 https://***.com/ 缓存。它是格林威治标准时间 2012 年 8 月 21 日 11:33:38 出现的页面快照。当前页面可能在此期间发生了变化。了解更多 提示:要在此页面上快速找到您的搜索词,请按 Ctrl+F 或 ⌘+ F (Mac) 并使用查找栏。
【讨论】:
哇,它甚至可以在robots.txt
附近工作;我用它来阅读博客,因为我们的公司防火墙禁用了它的 URL
您也可以在 Google 搜索中使用cache:
搜索运算符
对于https
,它需要https://
部分,否则返回404
本网站自动执行此操作:cachedview.me
@lmaooooo 请将其添加为单独的答案【参考方案2】:
您需要抓取结果页面,但您可以使用此URL 查看最新的缓存页面:
http://webcache.googleusercontent.com/search?q=cache:www.something.com/path
Google 信息放在 body 标签的第一个 div 中。
【讨论】:
【参考方案3】:你可以使用CachedPages网站
缓存页面通常由拥有强大网络服务器的大公司保存和存储。由于此类服务器通常非常快,因此缓存页面的访问速度通常比活动页面本身更快:
Google 通常会保留最近的网页副本(1 到 15 天)。 Coral 还保留一份最近的副本,尽管它通常不如 Google 更新。 通过 Archive.org,您可以访问多年来保存的网页的多个副本。【讨论】:
【参考方案4】:它太简单了,你可以在页面的 URL 前输入“cache:”。例如
如果您想查看此页面的最后一个网络缓存,只需在 URL 栏上输入 cache:http://***.com/questions/4560400/how-can-i-get-the-google-cache-age-of-any-url-or-web-page
这将显示页面的最后一个网络缓存。请参阅此处:
但请记住,网页的缓存只会在页面已在搜索引擎 (Google) 上被索引时显示。为此,您需要检查该页面的元机器人标签。
【讨论】:
这个我用了很久了。但最近似乎在 medium.com 等网站上失败了。【参考方案5】:您可以使用这个网站:https://cachedviews.com/。任何网站的缓存视图或缓存页面 - 任何网站的 Google 缓存页面
【讨论】:
【参考方案6】:这个也好查看cachepagehttp://www.cachepage.net
通过 google 缓存页面视图:webcache.googleusercontent.com/search?q=cache: Your url
通过archive.org缓存页面视图:web.archive.org/web/*/Your url
【讨论】:
以上是关于如何获取任何 URL 或网页的 Google 缓存年龄? [关闭]的主要内容,如果未能解决你的问题,请参考以下文章
如何获取或生成Google Cloud Run服务的部署URL