El choque de trenes era absolutamente inevitable. Llevamos años viendo cómo los modelos fundacionales devoran Internet entero sin pedir permiso, pero la factura acaba de llegar a la mesa. Microsoft y OpenAI se enfrentan desde hoy a una macrodemanda histórica por haber utilizado presuntamente el trabajo de cientos de periodistas para alimentar a sus inteligencias artificiales. La tregua ha terminado.

Y no hablamos de un simple blog enfadado por perder tráfico. La demanda colectiva, presentada este 24 de junio de 2026 en el Tribunal Federal del Distrito Sur de Nueva York, agrupa a más de 400 periódicos y webs sin permiso previo ni ningún tipo de compensación económica. El objetivo de las tecnológicas era muy claro: entrenar y afinar la sintaxis de gigantes como ChatGPT y Copilot.

Para que te hagas una idea de la magnitud del problema, el representante legal de los medios de comunicación, Matthew Platkin, ha sido tajante en sus declaraciones. Ha calificado este movimiento judicial como la mayor acción legal emprendida por periódicos locales y regionales contra empresas de IA multimillonarias en toda la historia. Una auténtica declaración de guerra.

El rastreo salvaje que se saltó las suscripciones de los usuarios

Si analizamos la parte técnica del conflicto, el método usado por las acusadas no sorprenderá a nadie del sector del software. La denuncia afirma que ambas compañías construyeron su inmensa biblioteca digital usando técnicas de scraping automatizado. Esos bots rastreadores peinan la red a una velocidad de vértigo, copiando la estructura y el texto para inyectarlo directamente en sus pipelines de entrenamiento.

También te puede interesar:Microsoft ofrece miles de dólares a quienes encuentren vulnerabilidades en su IA
scraping automatizado

Lo verdaderamente escandaloso del asunto es qué tipo de datos se llevaron en sus redes. Los demandantes aseguran que las tecnológicas no solo rascaron contenido de acceso gratuito y abierto al público. Las herramientas de extracción se saltaron hábilmente los muros de pago de medios que viven de forma exclusiva de las cuotas de sus suscriptores.

Es decir, consumieron artículos premium y reportajes de investigación protegidos sin abonar ni una sola licencia. Un contenido extremadamente jugoso, por cierto, ya que los LLM (Grandes Modelos de Lenguaje) necesitan textos largos, rigurosos y bien estructurados para mejorar su precisión y no sonar como un robot estropeado o generar alucinaciones.

Borrar el rastro del autor: la peligrosa línea roja de la DMCA

Pero la cosa se pone todavía más turbia al repasar el escrito de la acusación. El texto legal señala que, durante este caótico proceso de ingesta de datos masiva, se eliminó información clave de gestión de derechos de autor. Borraron los metadatos de las obras originales.

Literalmente, limpiaron la autoría a los textos periodísticos para facilitar su entrada y procesamiento en los servidores de IA. Esto no es un simple despiste de programación. Según los expertos legales involucrados, esta alteración deliberada podría suponer una violación flagrante de la ley DMCA sobre protección de derechos de autor en Estados Unidos. Y eso son palabras mayores.

También te puede interesar:Microsoft ofrece miles de dólares a quienes encuentren vulnerabilidades en su IA
También te puede interesar:Microsoft revela que hasta 30% de su código ya lo escribe la IA

Por ese preciso motivo, los medios afectados no se van a conformar con una disculpa pública o un pequeño cheque en blanco. Exigen indemnizaciones económicas muy contundentes por los daños y, lo que es peor para los intereses de Sam Altman, una orden judicial que bloquee de inmediato estas prácticas de recolección en el futuro. Si un juez acepta esto último, el modelo de negocio actual de la IA generativa tendría que rediseñarse por completo.

OpenAI se escuda en el uso legítimo mientras Microsoft mira hacia otro lado

Como era de esperar, la defensa no ha tardado demasiado en sacar las garras ante la prensa. Desde OpenAI rechazan de plano todas las acusaciones y han vuelto a sacar a pasear su comodín legal favorito en los despachos: el famoso fair use o principio de uso legítimo.

La start-up detrás de ChatGPT argumenta con insistencia que devorar datos disponibles en la red para enseñar a una máquina a entender patrones humanos es una práctica totalmente legal. Además, insisten en que únicamente emplearon información que ya era pública, obviando muy convenientemente las graves acusaciones sobre los muros de pago vulnerados mediante ingeniería técnica.

OpenAI se escuda en el uso legítimo mientras Microsoft mira hacia otro lado

Curiosamente, su principal inversor y soporte de infraestructura en la nube ha preferido el mutismo más absoluto. Microsoft todavía no ha emitido ninguna respuesta oficial ni comunicado ante esta bomba judicial. Una estrategia de silencio sepulcral que contrasta enormemente con sus agresivas campañas de marketing para integrar Copilot en cada rincón de nuestros ordenadores.

Ahora la pelota está en el tejado de los implacables tribunales neoyorquinos. El desenlace de esta colosal batalla marcará las reglas del juego de los derechos de autor para la próxima década tecnológica. Si los editores logran demostrar el robo sistemático y la destrucción de metadatos, la burbuja de la IA extractiva podría llevarse su primer gran pinchazo regulatorio. Tocará preparar las palomitas.

0 0 votos
Valoración del artículo
Suscribirte
Notificar sobre
guest
0 Comentarios
Más Antiguos
Más Nuevos Más Votados