MetaCentaurOne Big, Beautiful Bill (BBB)microsoftDeepseekAmazonGenesis AICloudflareOpenAIThinking Machines Lab (TML)GrammarlySongscriptionClaude 3.7 SonnetCursorGoogle

Meta entrena su inteligencia artificial con contenido académico pirateado

 | mayo 20, 2025 07:00
meta introduce función de memoria en sus aplicaciones

Meta, la compañía matriz de Facebook, Instagram y WhatsApp, ha sido señalada por utilizar bases de datos piratas para alimentar sus modelos de inteligencia artificial generativa. Entre los recursos utilizados se encuentra Library Genesis (LibGen), una plataforma conocida por alojar copias ilegales de libros académicos y materiales protegidos por derechos de autor.

Según una investigación publicada por The Atlantic, la empresa de Mark Zuckerberg habría incluido sin permiso miles de publicaciones académicas —muchas de ellas bajo copyright— en los datos de entrenamiento de sus modelos de lenguaje.

Esta práctica ha despertado una oleada de críticas no solo por las posibles implicaciones legales, sino por el carácter ético de la operación, considerando que Meta es una de las compañías que más se beneficia de un ecosistema digital regulado.

Qué es LibGen y por qué representa una paradoja

LibGen es una base de datos informalmente conocida como el Sci-Hub de los libros. Contiene millones de títulos, muchos de ellos académicos, disponibles de manera gratuita y sin consentimiento de sus autores ni editoriales. Para investigadores de todo el mundo, especialmente en países sin acceso a bibliotecas bien financiadas, esta plataforma ha sido una solución de facto para acceder al conocimiento.

Paradójicamente, este tipo de piratería surgió como respuesta a un sistema editorial considerado injusto, que limita el acceso al conocimiento y se beneficia económicamente del trabajo de investigadores que, en su mayoría, no reciben compensación alguna por sus publicaciones. Las editoriales académicas suelen vender los libros a precios exorbitantes, restringiendo el acceso a instituciones con capacidad económica.

Por eso, que una megacorporación como Meta utilice LibGen para entrenar sus sistemas de IA plantea una contradicción esencial: se apropia de una herramienta que nació como acto de resistencia frente al poder corporativo, para fortalecer justamente el poder de una corporación tecnológica.

También te puede interesar:Lace AI: el Software de IA que aumenta los ingresos en empresas de servicios

Un problema legal, ético o sistémico

La utilización de contenido pirateado por parte de Meta podría significar una infracción directa a los derechos de autor, abriendo la puerta a futuras demandas de editoriales y autores. Sin embargo, más allá de la legalidad, lo que se pone en tela de juicio es la lógica extractivista que parece guiar el desarrollo de la inteligencia artificial en el sector privado.

“El problema no es la piratería”, señala uno de los académicos cuyo trabajo fue incluido sin autorización, “sino la forma en que una empresa multimillonaria, que durante años ha explotado los datos personales con fines publicitarios, ahora hace lo mismo con el contenido cultural e intelectual”.

Este nuevo episodio ocurre mientras Meta enfrenta otros frentes judiciales, como el juicio antimonopolio impulsado por la FTC (Comisión Federal de Comercio) de Estados Unidos, cuyo desenlace podría cambiar el curso del crecimiento de las grandes tecnológicas.

Tal patrón evidencia una falla sistémica: el marco legal de derechos de autor actual no está preparado para enfrentar los desafíos de la IA generativa. Mientras tanto, las big tech avanzan, muchas veces en zonas grises o directamente fuera de la ley.

¿El acceso abierto como solución?

En respuesta a este contexto, muchas instituciones académicas y científicos están impulsando el modelo de acceso abierto, que promueve la publicación de investigaciones sin barreras de suscripción ni pago. Aunque hay avances —como los acuerdos entre universidades y editoriales para cubrir tarifas de publicación—, el acceso abierto sigue siendo una alternativa desigual, dominada por cuestiones de privilegio geográfico y económico.

Plataformas como Sci-Hub y LibGen surgieron como paliativos a este sistema excluyente, pero su uso sigue siendo ilegal en muchos países. El problema de fondo persiste: la industria editorial científica ha convertido el conocimiento en un lujo, y ahora se enfrenta a una nueva amenaza: su explotación masiva por parte de inteligencias artificiales comerciales.

También te puede interesar:Escándalo en Meta: Chatbots de celebridades podrían hablar de sexo con menores

El gran dilema: ¿Piratería o extractivismo?

Meta, al usar LibGen, no está haciendo un acto de rebeldía contra el sistema de derechos de autor, como podría sugerir una lectura idealista. En cambio, instrumentaliza una práctica nacida como resistencia para alimentar una máquina de lucro. Esto vacía de sentido el gesto original y agrega una capa más de explotación.

El verdadero problema no es la IA”, concluye el autor de la nota original, “sino las condiciones en las que se crea, los actores implicados y sus fines”. No se trata de demonizar la inteligencia artificial, que puede tener aplicaciones valiosas, sino de cuestionar el modelo de desarrollo extractivo y opaco que están adoptando las grandes tecnológicas.

En este escenario, la pregunta no es solo cómo regular la IA, sino también cómo repensar el valor y la circulación del saber en la era digital.

Copyright © gptzone.net

La Newsletter Diaria Sobre Inteligencia Artificial. Además: Portal de Noticias, Tutoriales, Tips y Trucos de ChatGpt, Openai e Inteligencia Artificial.

Nuestra web está alojada en:

hosting raiola

Suscríbete a nuestra Newsletter Diaria sobre IA

 

Suscríbete a GptZone y recibe cada día TOTALMENTE GRATIS:

 

  • 📰 Noticias Exclusivas de Inteligencia Artificial.
  • 🤖 Prompts Creativos y prácticos.
  • 🎥 Videos Inspiradores sobre IA.
  • 🛠️ Apps Recomendadas para revolucionar tu día a día.

Te has suscrito Satisfactoriamente!

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram