Home Smartwatch El archivo de Wayback Machine se desploma misteriosamente

El archivo de Wayback Machine se desploma misteriosamente

41

Wayback Machine de Internet Archive es un recurso invaluable que hace exactamente lo que dice el nombre de la organización sin fines de lucro: archiva Internet. Internet Archive es responsable de archivar alrededor 500 millones de páginas web al día.

Sin embargo, ha habido un cambio alarmante en la plataforma en los últimos meses. Según un nuevo informe de Laboratorios NiemannLa Wayback Machine de Internet Archive está archivando muy pocos sitios web en estos días. Aún más: muchos de estos sitios web están relacionados con noticias.

Wayback Machine archivó 1,2 millones de instantáneas de las páginas de inicio de 100 sitios web de noticias importantes entre el 1 de enero y el 15 de mayo de 2025, según un informe de Neiman Lab. Sin embargo, de repente, a mediados de mayo, eso cambió.

Wayback Machine tomó solo 148.628 instantáneas de las páginas de inicio de esos mismos 100 sitios web de noticias entre el 17 de mayo y el 1 de octubre de 2025. Eso supone una caída del 87 por ciento en el número de páginas archivadas entre los primeros cuatro meses del año y los cinco meses anteriores.

Ver también:

El Internet Archive acaba de convertirse en la Biblioteca Federal de EE. UU.

La página de inicio de CNN, por ejemplo, fue archivada 34.524 veces entre el 1 de enero y el 15 de mayo por Wayback Machine. Desde entonces, sólo 1.903 instantáneas de la página de inicio han estado en Wayback Machine.

Velocidad de la luz triturable

No está claro exactamente qué está pasando. Mark Graham, director de Wayback Machine, dijo a Nieman Lab que “una falla en ciertos proyectos de archivo en mayo… creó menos archivos para algunos sitios”. Según Graham, algunas de las instantáneas que faltan aún no se han indexado y pronto se agregarán al archivo de Wayback Machine.

Como señala Nieman Lab, un retraso de cinco meses debido a problemas de indexación es inusual. Según Graham, Internet Archive ha experimentado retrasos debido a “varias razones operativas”, como la “asignación de recursos”. Internet Archive no especificó ni proporcionó más información a Niemann Labs sobre este tema.

Los periódicos se han conservado durante mucho tiempo como registros históricos. Sin embargo, en la era de Internet, la mayoría de los periódicos recientemente han dejado de estar archivados, con la excepción de los gigantes de los medios heredados. Los sitios web de los medios de comunicación han ocupado su lugar como registros históricos. Y, desde 1996, Internet Archive es responsable de preservar esos archivos de páginas web.

Sin embargo, la organización sin fines de lucro ha tenido dificultades en los últimos años. Según un informe de Nieman Lab, el coste de Internet Archive en 2023 fue de 32,7 millones de dólares. Se necesitan muchos recursos no sólo para rastrear Internet sino también para almacenar los datos. La organización sin fines de lucro generó 23 millones de dólares en ingresos sólo ese mismo año.

Además, el Internet Archive fue victimizado el pasado mes de octubre. Violación masiva de datos Lo que desconectó el sitio con Wayback Machine. Se necesitaron varias semanas para restaurar completamente el sitio.

Enlace fuente