原标题:新研究揭示《纽约时报》文章网页存在严重的深层链接失效问题 来源:cnBeta.COM
来自哈佛大学法学院的一支研究团队,刚刚对《纽约时报》网站上的文章链接展开了一番调查。结果发现,将近 1/4 文章中的深层链接都已失效。在追溯到 1996 年的老文章目录的时候,更是有半数以上的链接已经“腐烂”,毫无疑问地揭示了相关背景资料(上下文)在网络时代维持生存的困难程度。
据悉,本次研究得到了《纽约时报》数字团队的帮助,涉及超过 55 万篇文章,其中包含超过 220 万个指向外部网站的链接。
调查发现,这些链接中有 72% 属于“深埋”状态,或指向特定的页面、而不是一般的网站。可以预见的是,随着时间的推移,会有更多链接可能断开。
届时那些曾经提供了有价值的见解、重要背景、或有争议主张的证据的链接,不是几次易手就是停止了服务。
在相对较近的 2018 年文章中,有 6% 的链接无法访问。而在较早的 1998 年文章中,已有高达 72% 的链接掉了链子。
如果很难想象网页链接一片灰是个什么样子,只需在 Twitter 封禁了唐纳德·特朗普的账号之后,再点进一篇有关他的文章里面。
至于这项研究为何选择了《纽约时报》这个例子,部分原因是这家传统纸媒的存档做得相当不错。然而在网页链接的“腐烂”问题上,《纽约时报》电子版也未能幸免。
2019 年的时候,BuzzFeed News 曾报道过一个底下产业。其存在的最大价值,就是通过向营销商付款购买域名,以利用《泰晤士报》或 BCC 等大型媒体中的“死链”,来宣传产品或达成其它目的。
链接“腐烂”不仅影响到了新闻行业,想象一下,如果哪天承载了 Rick Astley 经典曲目《Never Gonna Give You Up》的视频链接也凉了,那互联网的乐趣必然也大幅消减了。
庆幸的是,尽管没有十全十美的补救方法,一些非盈利组织仍在努力记住互联网的历史。比如在维基百科上,就有指向 Wayback Machine 等网页存档服务的链接。
此外还有一个名叫 Perma.cc 的项目,其旨在提供网页存档的原始版本和来源链接,以解决法律引文和学术期刊中可能遇到的链接“腐烂”问题。