互联网那些事 前天
在近40%网页死亡的互联网,一张裸照如何赛博永生
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

" 互联网有记忆吗?"

" 互联网有记忆是可能的,不过互联网有记忆不太可能。" ——阿诺语录互联网版。

数字信息为何难逃短命结局

分享一个让人感觉 " 左脑攻击右脑 " 的概念。虽然我们每个人都觉得 " 互联网是有记忆的 ",但在数据层面,却有相当一部分在线内容迎来了 " 慢性死亡 " 的最终结局。

2024 年,皮尤研究中心的工作人员在 Common Crawl(可以理解为互联网档案馆)中随机抽样了约 100 万个生于 2013 年 -2023 年的网页,并对其进行了访问性验证。结果显示,在 2013 年的网页样本组里,约有 38% 的链接已无法打开;而在 2023 年的网页样本组里,则有 8% 的链接无法打开。

具体而言。

在本轮抽样调查中,那些流量排名前 20% 的新闻网站样本组,约有 25% 的网页里至少包含 1 个失效链接。而在那些流量排名后 20% 的网站样本组里,该数据则提升到了 26%。另在失效原因层面,有 16% 的页面处于 " 网页不在,但域名仍在 " 的尴尬情况;9% 的页面处境则更为粗暴,其域名已经消失不见。

当然,除了新闻网站,研究人员还针对性研究了维基百科、推特。他们发现前者的 100 万个词条参考链接里共有 11% 的链接无法访问,且高达 54% 的维基百科参考内容会至少包含 1 个失效链接。

至于推特,研究人员经由数据分析后则尴尬发现,在 2023 年 3 月 8 日 -2023 年 4 月 27 日抽取的 500 万条推文样本里,接近 18% 的内容会在 3 个月内不可见。其中 60% 的消失原因为账号私密、冻结、注销,40% 的原因为账号运营者主动删除、隐藏了内容。

这一系列数据也让我们意识到,互联网上的信息总量并非始终处于只增不减的 " 屎山状态 ",反而是一种 " 内容增量、消失量动态变化 " 的微妙平衡态。

消失总是与重建并存

《纽约客》上一篇名为 "Can the Internet be archived?" 的文章曾如此评价互联网:" 网络永远生活在当下。它虚幻、短暂、不稳定、不可靠。有时候你想要访问的网页却指向了 404... 有时候你想要查询的页面已经被更新后的内容覆盖——这更麻烦,因为网页不会告诉你,你看到的内容压根儿不是你想查询的内容。"

在过去的时间里,无论是古早新闻的报道链接,还是网友们更新知识词条的参考出处、如今看来原始又粗糙的七十年代电子游戏、辣眼睛的互联网广告录屏,它们都或多或少迎来了消失的结局。

但对一些人而言,这些数字内容并不是毫无意义的垃圾。它们不仅是一个时代的见证,更承载着自己的独特记忆。在这样的背景下,1996 年一位叫做 Brewster Kahle 的网友建立了互联网博物馆 "Internet Archive"。而他的目的也即简单又有野心,那就是备份整个互联网。

从诞生那天起,Kahle 所开发的搜索工具 Wayback Machine 就会定时抓取网上的信息,并将其备份在 Internet Archive 中。截止到 2019 年,Internet Archive 已经保存了 3300 亿个网页和页面快照,以及超 2000 万册图书、850 万份音视频。

在这里,我们不仅能找到 1977 年运行在 Atari 2600 上的初代电子游戏,还可以看到天涯社区、微博首页快照等存于中文互联网起步阶段的记忆。

从意义角度看,这类民间人士自发组织、维护的互联网档案馆。它的价值不仅在于满足人们的 " 复古欲 ",更在于为互联网这个动态环境记录 " 谁说了什么 "" 谁做了什么 ",以此在这个各路信息不断更迭、消失的时代里,为我们保留内容的 " 不可更改性 "。

一张做到赛博永生的裸照

有意思的是,互联网上越是人们想保护的信息,越容易因为服务器关闭、载体(如 U 盘、光盘等)损坏而迎来消失的命运。而那些越想被当事人删除、遗忘的信息,却越容易迎来赛博永生的抽象结局。

2017 年,阿根廷一男子在自家后院闲逛时,意外被谷歌街景车拍下了高清裸照及门牌号等信息。因为本起事件过于荒诞,所以相关照片、信息不仅迎来了各路媒体的轮番报道。男子本人也开始被网友们二创恶搞,就此诞生了大量 meme 梗图、抽象视频。在这样的背景下,尽管该男子在 2025 年终于赢得诉讼并获赔了 1.25 万美元,但上述意外造成的心理创伤却大概率会伴其一生。

那么问题就来了。为什么那些严肃的新闻,甚至厂商耗费大量精力开发的电子游戏历经数年后就会面临 " 消失窘况 ",而这位全力删除裸照的倒霉蛋却能轻易喜提 " 赛博永生 " 呢?

答案或许就在 " 人性 " 这两个字的身上。

网上之所以会存在大量的失效网页,就是因为人们不再关心这些内容。哪怕是那些有价值的信息,也大可能会因为服务器无人运营、维护而消失无踪。但 " 裸照 " 这种能激发人们猎奇欲、窥私欲的存在,它的储存模式却是非中心化的。人们往往会在取笑这名男子时下意识保存、转发相关信息,让它寄生在多个不同的服务器里,静待下一个吃瓜乐子人发现并传播这位阿根廷倒霉蛋的裸照。

正如识字率低下的中世纪,人们在签订契约时通常会当众鞭打一位男孩,直到在男孩、围观群众的脑子里深深刻下 " 小汤姆在老亚伯签合同的那天,被人抽了个半死 " 的信息,让双方的交易永远流传在当地的酒馆故事集里一样。

参考:

果壳:有四成网页在近十年内消失,但一张裸照能活到永远

新浪科技:在线内容难逃短命结局:研究称 2013 年的网页有 38% 当前已无法访问

极客公园:Internet Archive:记录那些被遗忘的互联网

游民星空:向经典致敬!网上游戏厅 Internet Archive 容纳数百款上世纪老游戏

IT 之家:阿根廷警察被谷歌街景相机拍到裸照,获赔 1.25 万美元

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

维基百科 internet 互联网 数据分析 纽约
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论