NetflixMetaAnthropicAmazon Connect HealthAgentes IAwhatsappGPT-5.4ChatGPTIA / Inteligencia ArtificialTeam MiraiStephen ThalerGPT‑5.3 InstantQwen 3.5 SmallAsk GeminiGPT codex

OpenAI Estrena GPT-5.4 Thinking: la IA Más Avanzada Para que ChatGPT Controle Tu Ordenador

 | marzo 6, 2026 05:31

OpenAI acaba de lanzar GPT-5.4, el nuevo modelo que empuja a ChatGPT hacia un terreno mucho más cercano al mundo laboral: tareas complejas, flujos profesionales y automatización real. Ya no se trata únicamente de mejoras técnicas o de rendimiento en benchmarks —que también las hay—, sino de un cambio claro en la dirección del producto.

De hecho, estamos ante el primer modelo comercial de OpenAI con capacidad nativa para controlar un ordenador, un detalle que cambia bastante el panorama para los llamados agentes de IA. Estos sistemas no solo responden preguntas, sino que pueden ejecutar acciones paso a paso dentro de una interfaz, interactuando con programas y procesos de forma mucho más directa.

Ahora bien, lo verdaderamente interesante no está en las demos espectaculares que suelen acompañar estos lanzamientos, sino en lo que ocurre cuando el modelo se enfrenta al mundo real. Es decir, cuando tiene que trabajar con hojas de cálculo complejas, documentos extensos o decisiones donde hay dinero de por medio, situaciones donde se pone a prueba si la inteligencia artificial realmente puede integrarse en flujos profesionales.

GPT-5.4 quiere ser el modelo “serio” para trabajo

Desde el principio queda claro que OpenAI ha orientado GPT-5.4 hacia entornos profesionales y tareas de alta complejidad, escenarios donde una IA necesita sostener el rendimiento mucho más allá de un prompt creativo o una pregunta curiosa. La idea es que el modelo pueda mantener coherencia y precisión incluso cuando el trabajo se vuelve largo o técnicamente exigente.

Entre las mejoras más visibles están las relacionadas con la creación de hojas de cálculo, presentaciones y documentos estructurados. En otras palabras, el enfoque se aleja del clásico “te escribo un texto bonito” y se acerca más a algo como “te organizo una propuesta completa, calculo escenarios y dejo el material listo para enviar”.

Además, OpenAI insiste en que el modelo está pensado para analizar y procesar grandes volúmenes de información. Esto resulta especialmente relevante cuando se trabaja con datos, informes extensos o historiales largos de decisiones que necesitan ser interpretados de forma coherente.

Sin embargo, cualquiera que haya utilizado inteligencia artificial en este tipo de contextos conoce bien el problema que aparece cuando el contexto se queda corto. Cuando el modelo no tiene suficiente información, intenta rellenar los huecos, y ahí es precisamente donde suelen aparecer las temidas alucinaciones.

Un millón de tokens de contexto suena exagerado… pero cambia mucho

Una de las mejoras más llamativas de GPT-5.4 es su ventana de contexto de hasta un millón de tokens. En términos simples, esto significa que el modelo puede mantener en memoria una cantidad de información muchísimo mayor mientras trabaja.

En la práctica, esa diferencia permite que la IA maneje documentos extremadamente largos, mantenga tareas de larga duración y haga referencias internas sin perder el hilo. No es una mejora menor, porque representa la diferencia entre analizar un documento aislado y poder trabajar con repositorios completos de información, múltiples informes o históricos enteros de decisiones.

Sin embargo, aquí aparece un matiz importante que muchos usuarios podrían pasar por alto. Este contexto ampliado no está disponible dentro de ChatGPT, ya que el millón de tokens está reservado para Codex y la API.

Ese detalle revela bastante sobre la estrategia de producto de OpenAI. Mientras que ChatGPT sigue orientado al uso general, el verdadero despliegue de potencia parece concentrarse en el entorno developer y empresarial, donde estas capacidades pueden integrarse en sistemas más complejos.

Controlar un ordenador: el salto hacia agentes de IA reales

Quizá el elemento más interesante de GPT-5.4 no sea que escriba mejor o que tenga más contexto, sino su capacidad para controlar un ordenador de forma nativa dentro de su uso comercial. Este cambio altera bastante el paradigma de lo que una inteligencia artificial puede hacer dentro de un flujo de trabajo digital.

Hasta ahora, muchas automatizaciones con IA dependían de integraciones externas, scripts o herramientas conectadas de forma improvisada. Con GPT-5.4, en cambio, el modelo está pensado para ejecutar acciones directamente dentro de un entorno informático, interactuando con programas y procesos.

El impacto de esta función es evidente en el desarrollo de agentes de inteligencia artificial, sistemas capaces de completar tareas complejas mediante varios pasos y decisiones intermedias. Estos agentes no solo generan respuestas, sino que pueden ejecutar acciones, verificar resultados y continuar el proceso hasta completar el objetivo.

Eso sí, cualquiera que haya trabajado con bots que se pierden entre ventanas o clics sabe que el desafío real no está en mover el ratón. El verdadero reto está en mantener el objetivo, validar los resultados y evitar errores a lo largo del proceso, algo que requiere bastante más que automatizar clics.

Por supuesto, esta capacidad abre puertas enormes en áreas como operaciones internas, análisis de datos, soporte técnico o procesos administrativos. Al mismo tiempo, también introduce nuevas necesidades relacionadas con controles, permisos y sistemas de trazabilidad, especialmente cuando la IA tiene acceso a herramientas sensibles.

Una interacción más humana: interrumpir el razonamiento en tiempo real

Otra novedad interesante de GPT-5.4 aparece en la forma en que los usuarios pueden interactuar con el modelo. Por primera vez, ChatGPT permite interrumpir el proceso de razonamiento mientras la IA está trabajando, lo que cambia bastante la dinámica de uso.

Hasta ahora era necesario esperar a que el modelo terminara su respuesta completa para corregirlo o redirigirlo. Con esta nueva función, el usuario puede intervenir mientras el modelo todavía está procesando la tarea, lo que permite ajustar el rumbo antes de que el resultado final se genere.

OpenAI logra esto mostrando un plan preliminar del razonamiento del chatbot, algo que permite entender hacia dónde se dirige la respuesta antes de que se complete. Gracias a eso, el usuario puede corregir instrucciones o añadir contexto sin tener que empezar de nuevo.

En el fondo, esta función dice bastante sobre el público al que apunta GPT-5.4. Está claramente pensado para personas que trabajan con iteraciones rápidas, requisitos cambiantes y poco margen para procesos largos, algo muy común en entornos profesionales.

Más fiabilidad y menos errores

OpenAI también ha querido respaldar el lanzamiento con cifras concretas sobre la mejora en la calidad de las respuestas. Según la compañía, GPT-5.4 es un 33 % menos propenso a realizar afirmaciones falsas que GPT-5.2, una reducción considerable si se tiene en cuenta el historial de problemas con las alucinaciones.

Además, las respuestas completas generadas por el nuevo modelo tienen un 18 % menos de probabilidades de contener errores en comparación con la versión anterior. Esto no significa que el sistema sea perfecto, pero sí apunta a una mejora tangible en la fiabilidad del modelo.

En entornos profesionales, esa diferencia puede traducirse en menos revisiones manuales, menos correcciones y menos tiempo perdido verificando información. Aun así, la verdadera prueba sigue siendo el uso real, especialmente cuando el modelo se enfrenta a datos poco comunes o estructuras complejas.

Por ejemplo, muchos usuarios se preguntan qué ocurre cuando la IA tiene que interpretar excepciones legales, bases de datos desordenadas o archivos de Excel con fórmulas heredadas durante años. Ese tipo de situaciones suelen ser el verdadero examen para cualquier sistema de inteligencia artificial.

Disponibilidad y transición entre modelos

En cuanto a disponibilidad, GPT-5.4 ya aparece en algunos planes de pago de ChatGPT, concretamente en Plus, Pro y Team. Dentro de la plataforma se muestra con la etiqueta “GPT-5.4 Thinking”, lo que refuerza la idea de que OpenAI está posicionando estos modelos como versiones más analíticas o reflexivas.

Al mismo tiempo, la empresa ha confirmado que GPT-5.2 Thinking seguirá disponible solo hasta junio, momento en el que será retirado definitivamente. Esta decisión marca un calendario claro para quienes todavía dependen del modelo anterior.

En la práctica, esto obliga a muchas empresas a evaluar la transición con cierta rapidez, especialmente si sus flujos de trabajo están optimizados para el comportamiento de GPT-5.2. No se trata de un cambio inmediato, pero tampoco será un proceso que pueda aplazarse durante años.

La API sube de precio y deja claro su público objetivo

El lanzamiento también trae cambios en la estructura de precios dentro de la API. OpenAI ofrece dos variantes principales: GPT-5.4 y GPT-5.4 Pro, y ambas llegan con tarifas más altas que sus predecesoras.

En el caso del modelo base, GPT-5.4 cuesta 2,5 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida. Esto representa un incremento frente a GPT-5.2, que tenía un coste de 1,75 dólares por entrada y 14 por salida.

La versión avanzada, GPT-5.4 Pro, eleva todavía más la apuesta con 30 dólares por millón de tokens de entrada y 180 dólares por millón de tokens de salida. También aquí se observa una subida respecto a GPT-5.2 Pro, que estaba en 21 dólares por entrada y 168 por salida.

En el fondo, el mensaje es bastante claro. Se trata de un modelo más potente con una tarifa más premium, algo habitual cuando aparece una nueva generación tecnológica.

Para muchas empresas, sin embargo, el cálculo no gira únicamente en torno al precio por token. Si el modelo logra automatizar suficientes tareas o reducir horas de trabajo humano, el coste puede convertirse en un factor secundario frente al impacto en productividad.

Un chatbot que empieza a parecer herramienta de producción

Si se juntan todas las piezas —control de ordenador, contexto masivo en API y Codex, menor tasa de alucinaciones y un enfoque claramente profesional—, GPT-5.4 empieza a sentirse menos como un simple chatbot y más como una herramienta de producción dentro del entorno digital.

La gran incógnita, como siempre, será la respuesta del mercado y de la competencia. Habrá que ver si otras compañías consiguen lanzar agentes igual de funcionales o si OpenAI logra consolidar esta nueva etapa.

En cualquier caso, el movimiento apunta a algo interesante. La promesa de “dejar que la IA haga el trabajo por ti” empieza a acercarse un poco más a la realidad, aunque todavía queda por ver si ese ideal se convertirá realmente en una rutina cotidiana dentro de las empresas.

Copyright © gptzone.net

La Newsletter Diaria Sobre Inteligencia Artificial. Además: Portal de Noticias, Tutoriales, Tips y Trucos de ChatGpt, Openai e Inteligencia Artificial.

Nuestra web está alojada en:

hosting raiola

Suscríbete a nuestra Newsletter Diaria sobre IA

 

Suscríbete a GptZone y recibe cada día TOTALMENTE GRATIS:

 

  • 📰 Noticias Exclusivas de Inteligencia Artificial.
  • 🤖 Prompts Creativos y prácticos.
  • 🎥 Videos Inspiradores sobre IA.
  • 🛠️ Apps Recomendadas para revolucionar tu día a día.

Te has suscrito Satisfactoriamente!

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram