Hay una guerra fría en la inteligencia artificial, y ya no va de quién es más listo, sino de quién es más barato. Como NVIDIA anunció ayer, la compañía ha conseguido reducir hasta cinco veces el coste por token al ejecutar el modelo DeepSeek V4 en sus GPUs Blackwell. Y lo más salvaje de todo es que no han tocado ni un solo tornillo físico de sus servidores.
Lo han hecho exclusivamente mediante optimizaciones de software en un tiempo récord de aproximadamente un mes. El hardware se queda quieto. Este movimiento responde a una realidad innegable del mercado actual, donde las empresas están empezando a huir de los modelos mastodónticos si eso implica arruinarse pagando la factura mensual de la nube. El usuario medio ahora exige pura eficiencia.
Y el motivo cae por su propio peso. Operar IA a escala masiva supone un gasto operativo monstruoso para cualquier start-up o gigante tecnológico. Si logras bajar drásticamente el coste de servir el modelo en producción, tus márgenes de beneficio por fin respiran. Puedes permitirte bajar los precios a tus clientes finales o simplemente absorber mucho más tráfico de usuarios con la misma infraestructura que ya tienes comprada. Una jugada redonda.
El monstruo bajo el capó de DeepSeek V4 Pro
Si nos fijamos en las tripas técnicas, estamos ante un auténtico bicho del procesamiento. La versión DeepSeek V4 Pro es un modelo de tipo Mixture-of-Experts (MoE) que alberga un asombroso total de 1,6 billones de parámetros. Sin embargo, su verdadera magia reside en que solo enciende unos 49.000 millones durante cada inferencia. Esto lo hace ridículamente rápido y ligero en comparación con su gigantesco tamaño total.
También te puede interesar:G-Assist de Nvidia: Ahora con Plugins para Spotify, Twitch y Gemini
A ello se le suma una brutal ventana de contexto que soporta hasta 1 millón de tokens. Te haces una idea de lo que significa esto, ¿verdad? Puedes meterle de golpe bases de datos enteras, manuales de código kilométricos o hacer que un agente autónomo analice cientos de documentos sin perder el hilo. Ni se inmuta.
Una auténtica masacre en la guerra de precios
Aquí es donde la cosa se pone seria y las calculadoras echan humo. La variante DeepSeek V4 Flash tiene un precio de derribo: 0,14 dólares por millón de tokens de entrada y 0,28 dólares para la salida. Por su parte, el hermano mayor, la versión Pro, se queda en 0,435 y 0,87 dólares respectivamente. Es un coste tan agresivo que han roto el mercado por completo.
Evidentemente, la competencia queda retratada de la peor forma posible. Si comparamos estas cifras con las alternativas de código cerrado, la diferencia asusta. Un modelo como GPT-5.4 mini llega a ser hasta un 1.507% más caro, mientras que el Claude Haiko 4.5 supera el 1.680% de sobreprecio frente a la versión Flash de DeepSeek. Un abismo financiero para cualquier desarrollador.
Y si nos vamos a la liga de los pesos pesados, la sangría se repite. Frente al V4 Pro, operar un modelo como GPT-5.4 se dispara un 1.624% en precio, y el Claude Sonnet 5 cuesta más de un 1.000% extra. Así de simple.
También te puede interesar:G-Assist de Nvidia: Ahora con Plugins para Spotify, Twitch y GeminiLa magia negra de NVIDIA con Blackwell
Pero claro, esta rebaja brutal en el coste operativo no ocurre por simple inercia. Para lograr ese abaratamiento extremo, los ingenieros de NVIDIA han exprimido el software de la arquitectura Blackwell hasta límites insospechados. Han integrado técnicas de vanguardia como el serving desagregado y un mayor paralelismo diseñado en exclusiva para las redes MoE.

Básicamente, han hecho que la memoria y los procesadores se comuniquen de forma impecable. Aprovechan el ancho de banda masivo de la tecnología NVLink, utilizan la precisión NVFP4 y optimizan los kernels a muy bajo nivel. Incluso logran solapar el cálculo matemático puro con la comunicación de red, añadiendo predicción de múltiples tokens en tiempo real. Todo este cóctel técnico permite disparar el rendimiento hasta 20 veces en escenarios específicos.
Como era de esperar, NVIDIA no orquesta todo esto por mero amor al open-source. Su objetivo es venderte la foto completa. Nos están diciendo a la cara que Blackwell no es solo un trozo de silicio muy caro, sino una plataforma integral que fusiona hardware, red y herramientas de software como CUDA, vLLM o Dynamo. Proveedores reales como DigitalOcean, Baseten, Deep Infra e Hippocratic AI ya están sacando partido a esta infraestructura hiperoptimizada.
En el fondo, el mensaje de la compañía es muy nítido: puede que nuestras tarjetas gráficas duelan al comprarlas, pero gracias al software, somos la opción más barata para operar IA a largo plazo. Utilizan un modelo abierto y económico como DeepSeek para demostrar que su hardware es indispensable. Veremos si la competencia basada en la nube responde a este golpe sobre la mesa. La pelota está ahora mismo en el tejado de los que siguen vendiendo IA a precio de oro.

Me dedico al SEO y la monetización con proyectos propios desde 2019. Un friki de las nuevas tecnologías desde que tengo uso de razón.
Estoy loco por la Inteligencia Artificial y la automatización.











