¿Qué pasa cuando la memoria de internet, esa especie de álbum familiar donde quedan guardadas versiones viejas de una nota, empieza a cerrarse por miedo a la inteligencia artificial? La pregunta ya no es teórica: afecta a medios, lectores y también a la forma en que se conserva la historia digital.

El hallazgo surge de un conflicto cada vez más visible entre organizaciones informativas y el Internet Archive, la institución detrás de la Wayback Machine. Unos 245 medios y grupos periodísticos de nueve países ya intentan bloquear a sus rastreadores, los programas automatizados que copian y archivan páginas web, para evitar que ese material termine alimentando modelos de IA.

El uso de archivos de noticias por empresas de IA podría suponer una grave vulneración de los derechos de autor.

La pieza clave es doble. Por un lado, el Internet Archive guarda más de un billón de páginas web desde 1996. Por otro, esos archivos resultan muy valiosos para entrenar sistemas de IA porque están fechados, ordenados y accesibles por URL y API (puertas de acceso automáticas a datos).

Mark Graham, director de la Wayback Machine, sostiene que el archivo se convirtió en “daño colateral” de una pelea mayor. La responsabilidad, subraya, recae en las empresas de IA y no en la tarea de preservación histórica.

En lenguaje técnico, el entrenamiento de modelos (proceso de aprendizaje con grandes volúmenes de datos) necesita texto abundante, limpio y natural. Y los archivos periodísticos ofrecen justo eso: lenguaje de alta calidad, contexto y fechas claras.

Ahí aparece el interruptor del conflicto. Lo que para historiadores y verificadores es una herramienta de transparencia, para muchos medios se volvió un engranaje que puede facilitar un uso sin permiso de contenidos protegidos por derechos de autor.

El archivo como registro y como riesgo

Más de 20 grandes medios ya bloquearon ia_archiverbot, el principal rastreador del Internet Archive. En total, al menos uno de los cuatro rastreadores del archivo está bloqueado por 241 sitios informativos. Una parte importante de esos cierres corresponde a publicaciones de USA Today Co, lo que deja a cientos de medios locales fuera del registro histórico automático.

El Internet Archive activó medidas para restringir descargas masivas y frenar cierta extracción automatizada de información.

El problema no nace solo del archivo, sino de lo que otros hacen con él. Varias redacciones mantienen demandas abiertas contra compañías como OpenAI y Perplexity por presuntas infracciones de copyright. The New York Times, por ejemplo, afirma que su trabajo original se usa de forma ilegal para construir herramientas que luego compiten con el propio medio.

Además, el valor de estos archivos no es menor. Las páginas archivadas sirven como fuente primaria para historiadores y también para detectar cambios posteriores a una publicación. Sin ese respaldo, una nota podría modificarse, quitar una cita o corregir una declaración sin dejar rastro visible. La Wayback Machine actúa, en ese punto, como el cableado oculto de una casa: no se ve, pero sostiene la trazabilidad del sistema.

La oportunidad de una salida intermedia

No todos eligieron bajar la persiana por completo. Algunas organizaciones, como The Guardian, exploran límites parciales en lugar de un bloqueo total. El Internet Archive también activó medidas para restringir descargas masivas y frenar cierta extracción automatizada.

Esa salida intermedia podría ser la oportunidad más razonable. Proteger el trabajo periodístico sin apagar la memoria pública evita un daño doble: el económico para las redacciones y el histórico para la sociedad.

Mientras Fight for the Future impulsa una petición contra los bloqueos, firmada por 100 periodistas, el debate revela algo más profundo. La disputa ya no trata solo de robots que copian páginas, sino de quién controla el registro de lo que alguna vez estuvo publicado.

Y en un internet donde todo puede reescribirse en segundos, conservar ese archivo sigue siendo una pieza clave para que la memoria no dependa solo de quien tiene el dedo sobre el interruptor.

0 0 votos
Valoración del artículo
Suscribirte
Notificar sobre
guest
0 Comentarios
Más Antiguos
Más Nuevos Más Votados
Comentarios en línea
Ver todos los comentarios