维基百科讨论:使用时光机

最新留言:1年前由Zyksnowy在话题标题文本内发布

Wayback Machine存档后的页面消失

虽然不是维基百科的工具,但是想问问有没有遇到相同情况的朋友。因条目需要,参考Wikipedia:使用时光机,使用Wayback Machine存档该页面后,提示存档成功并生成了存档链接,一开始是可以正常查看的,但一段时间后页面转而提示“The Wayback Machine has not archived that URL.”,尝试了两次都是同样的情况。该站点似乎并没有robots.txt文件,并且也存在其他页面的正常存档。由于存档链接已经添加到条目中,在这种情况下是否应该先移除存档链接呢?--立日留言2021年6月23日 (三) 10:20 (UTC)回复

如果您说的是这笔存档,我刚刚到web.archive官网上去重新操作一次就成了,您可以在天主教厦门教区下方直接点击看看,不过纪录时间是刚刚的下午六点多,也没看到你先前的存档,可能有些技术问题吧。此外就算在官网存档,我也偶尔会遇到类似你说的状况,要过几个小时才找的到。如下次再遇到这种情况,我会建议先放著,过至少几小时到官网上确认有没有存到档,没有就重新存一次。--回廊彼端留言2021年6月23日 (三) 11:05 (UTC)回复
@迴廊彼端:谢谢,我刚刚可以打开您提供的这版本的存档,但现在似乎又再次失效了。--立日留言2021年6月23日 (三) 11:26 (UTC)回复
@回廊彼端:不好意思,似乎是间歇性失效,突然存档又出现了。感觉不是很稳定的样子。--立日留言2021年6月23日 (三) 11:31 (UTC)回复

Wayback Machine不能存档am730的网页,大家能推荐其它存档方法吗?

am730似乎只能从香港访问,内中报道如[1]在用Wayback Machine存档时出错。求推荐其它存档方法。谢谢!--Benevolen留言2022年1月9日 (日) 03:30 (UTC)回复

去Google搜一下然后看网页快照,比如你这个。快照--在下荷花请多指教欢迎签到2022年1月9日 (日) 10:26 (UTC)回复
@Benevolen--在下荷花请多指教欢迎签到2022年1月9日 (日) 10:26 (UTC)回复
感谢指点!还改为这个功能不复存在了--Benevolen留言2022年1月9日 (日) 20:54 (UTC)回复
看来需要程序员开发开源的网页存档器以供我们自建。--Txkk留言2022年1月9日 (日) 13:42 (UTC)回复
有了!ArchiveBox --Txkk留言2022年1月10日 (一) 11:57 (UTC)回复

谷歌网页快照能存档多久?

我找到一个光明日报来源,但是光明网上的页面已经被删除了,然而谷歌网页快照还存了档,我现在在该来源的存档URL里填的网页快照网址,这个会被谷歌删除吗?如何能把谷歌快照的内容备份进web archive?--有困扰的话,就让魔女用魔法帮你排忧吧! 2022年10月26日 (三) 14:49 (UTC)回复

会删,不确定保留多久,可能几周到几个月吧。archive.is支持存档和索引(检索)谷歌快照,但该网站最近似乎下线了。web archive我不确定能否存档快照,经测可以。以前是不行的,因为robots.txt以前不存、会删2017年4月开始忽略。--YFdyh000留言2022年10月26日 (三) 17:30 (UTC)回复
“但该网站最近似乎下线了”,并没有。根据en:archive.today#Cloudflare_DNS_availability所述,用了Cloudflare的DNS服务,可能会打不开这个网站。你用了什么翻墙软件?--Txkk留言2022年10月28日 (五) 10:01 (UTC)回复
感谢提示,困扰已久。可能软件配置和网站问题兼有,出问题时可能在调用OpenDNS。之前访问总是看到nginx的欢迎页面,https正常,所以我以为网站故障了。--YFdyh000留言2022年11月1日 (二) 10:20 (UTC)回复
但是我存了以后发现webarchive好像最后存的是光明网首页,你能试试看怎么在web archive存谷歌快照吗--有困扰的话,就让魔女用魔法帮你排忧吧! 2022年10月27日 (四) 03:42 (UTC)回复
见我那个“可以”的链接。快照页面会因JS自动跳转到光明网,必须想办法(比如禁用JS,或者改URL参数)打开纯文字版来存档。其实不存档也非不行,应该还有图书馆能查到,不过存档了更方便查证就是。--YFdyh000留言2022年10月27日 (四) 03:45 (UTC)回复
哦没事了,存好了--有困扰的话,就让魔女用魔法帮你排忧吧! 2022年10月27日 (四) 03:44 (UTC)回复
Google 页库存档一段时间后会删的。建议你用 https://web.archive.org/save 存档。 -- Shyangs留言2022年10月26日 (三) 17:38 (UTC)回复
网址不是必须的。--Kethyga留言2022年10月27日 (四) 05:10 (UTC)回复

标题文本

存不了的网站……

昨天晚上发现知乎zhihu.com似乎保存不了……存档结果是“您当前请求存在异常,暂时限制本次访问”

应该还有几个国内大网站不能保存。

  • 淘宝taobao.com
  • 新浪微博weibo.com
  • 网易云音乐music.163.com

--Zyksnowy留言2022年11月24日 (四) 04:42 (UTC)回复

顺路报告,近几个月,用archive.is查看或存档知乎页面,似乎无法成功,且会导致archive.is网站不再能正常访问(出现异常cookie)。不知道其他人是否能重现。--YFdyh000留言2022年11月24日 (四) 05:39 (UTC)回复
这四个网站都有单独的图片服务器,可以单独保存……可能容易丢失网址
返回到项目页面“使用时光机”。