MetaManus AIxaiHalftimeRedditDeep FakesQuentinALIAHalo: Campaign EvolvedOpenAIyoutubeMistral AIDoublespeedAgentes IABlaise Agüera y Arcas

¿Tiene Sentido ALIA-40b? IA Soberana Española Entre el Ridículo Inicial y el Futuro

 | diciembre 30, 2025 00:06

¿Alguna vez te pasó que compraste un electrodoméstico “nuevo” y, al enchufarlo, parecía no entender nada? Enciende, hace ruido, pero no responde como esperabas. Algo parecido ocurrió con ALIA, el modelo de IA español que llegó al público con promesa grande y resultados, al principio, difíciles de justificar.

Sin embargo, el hallazgo central no es que “España no pueda” hacer IA, sino que el lanzamiento fue prematuro. El proyecto ALIA-40b, coordinado por el Barcelona Supercomputing Center (BSC-CNS), se presentó como una familia de modelos en castellano y lenguas cooficiales, con pilotos anunciados en la Agencia Tributaria y en atención primaria.

ALIA-40b rendía peor que responder al azar.

Por su parte, el propio BSC-CNS lo describió como el modelo fundacional multilingüe público más avanzado de Europa, con 40.000 millones de parámetros (engranajes internos del modelo) y un entrenamiento con MareNostrum 5.

No obstante, las pruebas iniciales lo dejaron cerca de modelos abiertos de 2023, y un estudio de la Universidad de Valencia llegó a detectar algo más incómodo: en exámenes tipo test de matemáticas, ALIA-40b rendía peor que responder al azar.

Aitor González-Agirre, uno de los responsables del proyecto, lo plantea como una decisión “estratégica” ajena al criterio técnico. Es decir, se mostró un motor cuando todavía estaba en etapa de banco de pruebas.

ALIA salió a la calle como si fuera un auto al que le faltara la puesta a punto. Arranca, pero el volante tiembla y el tablero no da información clara. La clave está en un mecanismo del entrenamiento llamado tasa de aprendizaje (velocidad de cambio del modelo): al principio se usa alta para aprender rápido y al final se baja para pulir detalles.

Sin embargo, el equipo planeaba llegar a 12 billones de tokens (pedacitos de texto) y tuvo que frenar cerca de 2,3 billones, cuando todavía estaba en “marcha rápida”. Se usó un scheduler coseno (reloj que baja la velocidad) justamente para terminar suave, pero el proceso se interrumpió antes de llegar a esa fase fina. El resultado, según sus desarrolladores, quedó “crudo”.

El cableado que faltaba: datos, cómputo y una ventana más grande

Por su parte, el BSC-CNS informó que ALIA se entrenó durante más de ocho meses con 6,9 billones de tokens en 35 lenguas europeas, con una versión final prevista de hasta 9,2 billones. Sin embargo, el acceso al supercomputador MareNostrum 5 se fue achicando: de cientos de nodos especializados, hoy el equipo trabaja con apenas 16 nodos dedicados, lo que vuelve inviable seguir entrenando desde cero a gran escala.

Es decir, mientras empresas como OpenAI pueden probar “cientos de hornadas” y elegir la mejor, ALIA tuvo menos margen para ensayo y error. Y además no cuenta con una plataforma pública de inferencia (uso del modelo en vivo), tipo chat, que permita recoger interacciones reales y ajustar comportamiento con datos de uso.

No obstante, el panorama no quedó congelado. Los desarrolladores aseguran que, tras completar la fase inicial, el comportamiento mejoró, y que ALIA es hoy el mejor modelo en euskera y el segundo en catalán y gallego en comparativas internas con alternativas como Apertus-8b, Qwen y Llama-3.

También se amplió la ventana de contexto (cantidad de texto que recuerda) de 4.000 a 160.000 tokens, una pieza clave que al inicio estaba fuera de alcance por recursos.

En otras palabras, el motor ya no está solo “encendido”: empieza a sincronizar sus engranajes. La oportunidad ahora es que se convierta en infraestructura pública, bajo licencia Apache, para quienes necesiten una IA soberana y transparente. Si el plan se sostiene, a finales de año debería aparecer una versión con instrucciones, más cercana a lo que el usuario espera cuando abre un chat.

Copyright © gptzone.net

La Newsletter Diaria Sobre Inteligencia Artificial. Además: Portal de Noticias, Tutoriales, Tips y Trucos de ChatGpt, Openai e Inteligencia Artificial.

Nuestra web está alojada en:

hosting raiola

Suscríbete a nuestra Newsletter Diaria sobre IA

 

Suscríbete a GptZone y recibe cada día TOTALMENTE GRATIS:

 

  • 📰 Noticias Exclusivas de Inteligencia Artificial.
  • 🤖 Prompts Creativos y prácticos.
  • 🎥 Videos Inspiradores sobre IA.
  • 🛠️ Apps Recomendadas para revolucionar tu día a día.

Te has suscrito Satisfactoriamente!

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram