查看更多故事

谷歌将不再保留整个互联网的备份。长期以来,谷歌搜索的“缓存”链接一直是加载已关闭或已更改网站的另一种方式,但现在该公司正在取消这一功能。谷歌“搜索联络员”Danny Sullivan在一篇X帖子中证实了这一功能的删除,称该功能“是为了帮助人们访问页面,当你经常无法依赖页面加载时。”如今,情况有了很大的改善。所以,我们决定让它退役。”

自去年12月以来,这个功能对一些人来说时断时续,目前,我们在谷歌搜索中没有看到任何缓存链接。现在,即使没有这个按钮,你仍然可以建立自己的缓存链接,只需要进入“https://webcache.googleusercontent.com/search?q=cache:”加上网站URL,或者在谷歌搜索中输入“cache:”加上URL。目前,Ars Technica的缓存版本似乎仍然可以工作。谷歌所有关于缓存站点的支持页面都被删除了。

过去,缓存链接位于谷歌页面上每个搜索结果旁边的下拉菜单下。当谷歌网络爬虫在互联网上搜索新的和更新的网页时,它也会保存它所看到的任何内容的副本。这很快导致谷歌拥有了基本上整个互联网的备份,使用的数据可能是数不胜数的pb。谷歌现在正处于节约成本的时代,所以假设谷歌可以开始删除缓存数据,它可能会释放大量资源。

广告

如果网站宕机或快速更改,缓存链接是很好的,但多年来,它们也给了一些关于“Google Bot”网络爬虫如何查看网络的见解。页面不一定按照您所期望的方式呈现。在过去,页面是纯文本的,但慢慢地,Google Bot学会了媒体和其他丰富的数据,比如javascript(现在有很多专门的Google Bot)。很多Google Bot的细节都是保密的,以躲避SEO垃圾邮件发送者,但是你可以通过调查缓存页面的样子来了解很多。在2020年,谷歌默认切换到移动端,所以,如果你访问之前缓存的Ars链接,你会得到移动站点。如果你运营着一个网站,并且想要了解更多关于这个网站对于Google Bot是什么样子的信息,你仍然可以通过搜索控制台来做到这一点,尽管只是针对你自己的网站。

缓存站点的消亡将意味着互联网档案馆将承担更大的存档和追踪全球网页变化的负担。