Inicio Hardware IA NVIDIA Reduce x5 el Coste por Token de DeepSeek con sus Chips...

NVIDIA Reduce x5 el Coste por Token de DeepSeek con sus Chips Blackwell

Por

02/07/2026

Hay una guerra fría en la inteligencia artificial, y ya no va de quién es más listo, sino de quién es más barato. Como NVIDIA anunció ayer, la compañía ha conseguido reducir hasta cinco veces el coste por token al ejecutar el modelo DeepSeek V4 en sus GPUs Blackwell. Y lo más salvaje de todo es que no han tocado ni un solo tornillo físico de sus servidores.

Lo han hecho exclusivamente mediante optimizaciones de software en un tiempo récord de aproximadamente un mes. El hardware se queda quieto. Este movimiento responde a una realidad innegable del mercado actual, donde las empresas están empezando a huir de los modelos mastodónticos si eso implica arruinarse pagando la factura mensual de la nube. El usuario medio ahora exige pura eficiencia.

Y el motivo cae por su propio peso. Operar IA a escala masiva supone un gasto operativo monstruoso para cualquier start-up o gigante tecnológico. Si logras bajar drásticamente el coste de servir el modelo en producción, tus márgenes de beneficio por fin respiran. Puedes permitirte bajar los precios a tus clientes finales o simplemente absorber mucho más tráfico de usuarios con la misma infraestructura que ya tienes comprada. Una jugada redonda.

El monstruo bajo el capó de DeepSeek V4 Pro

Si nos fijamos en las tripas técnicas, estamos ante un auténtico bicho del procesamiento. La versión DeepSeek V4 Pro es un modelo de tipo Mixture-of-Experts (MoE) que alberga un asombroso total de 1,6 billones de parámetros. Sin embargo, su verdadera magia reside en que solo enciende unos 49.000 millones durante cada inferencia. Esto lo hace ridículamente rápido y ligero en comparación con su gigantesco tamaño total.

También te puede interesar:G-Assist de Nvidia: Ahora con Plugins para Spotify, Twitch y Gemini

DeepSeek Rebaja Para Siempre, un 75% del Precio de su Modelo IA Insignia: V4-Pro

A ello se le suma una brutal ventana de contexto que soporta hasta 1 millón de tokens. Te haces una idea de lo que significa esto, ¿verdad? Puedes meterle de golpe bases de datos enteras, manuales de código kilométricos o hacer que un agente autónomo analice cientos de documentos sin perder el hilo. Ni se inmuta.

Una auténtica masacre en la guerra de precios

Aquí es donde la cosa se pone seria y las calculadoras echan humo. La variante DeepSeek V4 Flash tiene un precio de derribo: 0,14 dólares por millón de tokens de entrada y 0,28 dólares para la salida. Por su parte, el hermano mayor, la versión Pro, se queda en 0,435 y 0,87 dólares respectivamente. Es un coste tan agresivo que han roto el mercado por completo.

Evidentemente, la competencia queda retratada de la peor forma posible. Si comparamos estas cifras con las alternativas de código cerrado, la diferencia asusta. Un modelo como GPT-5.4 mini llega a ser hasta un 1.507% más caro, mientras que el Claude Haiko 4.5 supera el 1.680% de sobreprecio frente a la versión Flash de DeepSeek. Un abismo financiero para cualquier desarrollador.

Y si nos vamos a la liga de los pesos pesados, la sangría se repite. Frente al V4 Pro, operar un modelo como GPT-5.4 se dispara un 1.624% en precio, y el Claude Sonnet 5 cuesta más de un 1.000% extra. Así de simple.

También te puede interesar:G-Assist de Nvidia: Ahora con Plugins para Spotify, Twitch y Gemini

También te puede interesar:Estados Unidos Bloquea la Venta de chips de IA a Emiratos Árabes por Temor a Filtraciones a China

La magia negra de NVIDIA con Blackwell

Pero claro, esta rebaja brutal en el coste operativo no ocurre por simple inercia. Para lograr ese abaratamiento extremo, los ingenieros de NVIDIA han exprimido el software de la arquitectura Blackwell hasta límites insospechados. Han integrado técnicas de vanguardia como el serving desagregado y un mayor paralelismo diseñado en exclusiva para las redes MoE.

NVIDIA Apoya a DeepSeek V4 con Soporte para Blackwell Ultra

Básicamente, han hecho que la memoria y los procesadores se comuniquen de forma impecable. Aprovechan el ancho de banda masivo de la tecnología NVLink, utilizan la precisión NVFP4 y optimizan los kernels a muy bajo nivel. Incluso logran solapar el cálculo matemático puro con la comunicación de red, añadiendo predicción de múltiples tokens en tiempo real. Todo este cóctel técnico permite disparar el rendimiento hasta 20 veces en escenarios específicos.

Como era de esperar, NVIDIA no orquesta todo esto por mero amor al open-source. Su objetivo es venderte la foto completa. Nos están diciendo a la cara que Blackwell no es solo un trozo de silicio muy caro, sino una plataforma integral que fusiona hardware, red y herramientas de software como CUDA, vLLM o Dynamo. Proveedores reales como DigitalOcean, Baseten, Deep Infra e Hippocratic AI ya están sacando partido a esta infraestructura hiperoptimizada.

En el fondo, el mensaje de la compañía es muy nítido: puede que nuestras tarjetas gráficas duelan al comprarlas, pero gracias al software, somos la opción más barata para operar IA a largo plazo. Utilizan un modelo abierto y económico como DeepSeek para demostrar que su hardware es indispensable. Veremos si la competencia basada en la nube responde a este golpe sobre la mesa. La pelota está ahora mismo en el tejado de los que siguen vendiendo IA a precio de oro.

Aitor Wilzig

Me dedico al SEO y la monetización con proyectos propios desde 2019. Un friki de las nuevas tecnologías desde que tengo uso de razón.
Estoy loco por la Inteligencia Artificial y la automatización.

gptzone.net

0 0 votos

Valoración del artículo

0 Comentarios

Más Antiguos

Más Nuevos Más Votados

NVIDIA Reduce x5 el Coste por Token de DeepSeek con sus Chips Blackwell

El monstruo bajo el capó de DeepSeek V4 Pro

Una auténtica masacre en la guerra de precios

La magia negra de NVIDIA con Blackwell

OTRAS NOTICIAS

¿Estamos Delegando el Pensamiento en ChatGPT? La Ciencia Lanza una Advertencia

Casa Blanca Pide a OpenAI Retrasar Lanzamiento de GPT-5.6 por Seguridad Nacional

EE UU Reabre el Acceso a Fable 5 con Bloqueos del 99 % a...

Hacienda Española Usa una IA Israelí Para Aumentar Inspecciones en Móviles y Ordenadores

TE INTERESA

Gemini Spark Llega a Mac: el Asistente de IA de Google...

Incluso más noticias

Google Estrena Nano Banana 2 Lite y Gemini Omni Flash para...

El Primer Dispositivo de OpenAI es el Codex Micro, un Teclado...

SpaceX Desarrolla un Prototipo de Dispositivo de IA Tipo Móvil, Aunque...

CATEGORÍA POPULAR

DOMINA LA IA EN 3 MINUTOS AL DÍA (GRATIS)

Suscríbete a nuestra Newsletter Diaria sobre IA:

You have Successfully Subscribed!

Google y SpaceX Impulsan un Proyecto para Hacer Funcionar a la...

SK Hynix Domina el 61 % del Mercado HBM y Complica...

IBM Presenta el Primer Chip de 0,7 Nanómetros que Multiplican por...