Cuando te sientas a crear algo visual, lo normal es ir saltando entre varias herramientas: el editor de imágenes por un lado, el chat con tu equipo por otro y la documentación en otra pestaña. Con la nueva función Images en ChatGPT, esa forma de trabajar cambia bastante. Ahora vas a poder pensar tu idea, pulir el texto y generar la imagen final sin salir de la misma conversación.
En este artículo te contamos qué trae esta actualización de OpenAI, cómo se integra con el chat y qué puedes hacer tú, tanto si usas ChatGPT en la web, en el móvil o a través de la API. Verás que no es solo “un modelo nuevo”, sino una forma distinta de mezclar texto e imagen para crear contenido visual más rápido y con más control.
La nueva experiencia Images en ChatGPT es una actualización que sustituye a la herramienta de imágenes anterior por un sistema unificado dentro del propio chat. Ya no tienes una sección separada ni un modo independiente, sino que las imágenes pasan a ser parte natural de la conversación, igual que los mensajes de texto.
Con esta versión vas a poder crear y editar imágenes directamente desde ChatGPT, escribiendo instrucciones en lenguaje natural. Pides una escena, corriges detalles, cambias el estilo y sigues hablando con el modelo sin cambiar de entorno. Esto hace que el contenido visual deje de ser un añadido aislado y se convierta en una pieza más de tu flujo de trabajo habitual.
¿Qué hace distinto al modelo de Images en ChatGPT frente a versiones anteriores? El cambio clave está en la fidelidad: las imágenes que genera respetan mucho mejor lo que describes en tu texto. Si explicas un personaje, un encuadre o un objeto concreto, el sistema lo refleja con más precisión y menos sorpresas raras.
Este modelo de imagen también está ajustado para que haya mayor consistencia entre varias generaciones de una misma idea. Si le pides repetir una escena con pequeños cambios, vas a poder mantener el estilo, la composición y la atmósfera visual sin que cada nueva versión se “desmadre” hacia algo totalmente distinto. Una competencia directa con Nano Banana Pro.
Cuando escribes un prompt detallado, quieres que el modelo lo respete, no que improvise demasiado. La nueva función Images en ChatGPT mejora justo eso: entiende mejor las instrucciones y se ajusta más al contenido, al tono y al estilo que describes. Esto se nota tanto en escenas complejas como en ideas sencillas.
Sigues teniendo margen creativo. Puedes indicar estilos como “ilustración plana”, “cartel retro” o “mockup de app” y el sistema combina esa estética con los elementos que explicas. De esta forma, vas a poder repetir el mismo estilo en campañas, presentaciones o materiales educativos sin que cada imagen parezca de un proyecto distinto.
Uno de los puntos más delicados en la generación de imágenes con IA ha sido siempre el texto dentro de la propia imagen. Con Images en ChatGPT se ha trabajado especialmente el renderizado de tipografías, para reducir letras deformadas, palabras ininteligibles y carteles que no se podían leer bien.
Ahora vas a poder crear banners, portadas o propuestas de logotipos donde el texto integrado se vea más limpio y coherente. No es magia perfecta, pero en muchos casos tendrás un resultado que ya puedes presentar como boceto serio o usar como base para un diseño final.
Si nunca has usado generación visual en ChatGPT, empezar con Images es bastante directo. Todo se hace en el mismo chat donde ya escribes tus preguntas o pides que te redacte textos. La diferencia es que ahora el resultado puede ser una imagen, una explicación o una mezcla de ambos.
También te puede interesar:ChatGPT Amplía el Modo de Voz Avanzada para Usuarios Gratuitos de Europa
Con todo, lo más interesante es que puedes mezclar esto con texto generado. Por ejemplo, pides primero el guion de una campaña, luego un eslogan y, justo después, una serie de imágenes alineadas con el mensaje que has trabajado en la misma conversación.
La nueva función Images en ChatGPT no se queda solo en crear imágenes desde cero. También vas a poder hacer ediciones sobre imágenes ya generadas o sobre material que hayas subido tú, sin abrir un editor externo ni usar otra herramienta.
Entre las operaciones de edición más útiles están el inpainting, los cambios de fondo y la sustitución de elementos. Esto te permite corregir detalles concretos sin rehacer toda la escena visual desde el principio.
Para que te hagas una idea, estas son algunas de las ediciones que puedes pedir a Images en ChatGPT en lenguaje natural, dentro de la conversación:
No todo será perfecto en el primer intento. Lo normal es ir pidiendo ajustes finos: “haz el fondo menos saturado”, “pon el logo más grande” o “quita una de las personas para que la escena esté más despejada”. Esa conversación iterativa es justo donde Images en ChatGPT gana fuerza.
Otra de las grandes novedades de Images en ChatGPT es la comprensión visual. Ya no solo mandas texto; también puedes subir fotos, capturas de pantalla o gráficos para que el modelo los entienda y hable sobre ellos contigo.
Esto convierte las imágenes en entradas de primera clase dentro del chat, igual que un mensaje de texto. A partir de ahí, vas a poder pedir descripciones, resúmenes o transformaciones basadas en lo que aparece en la foto que has subido.
Cuando adjuntas una imagen a la conversación, la función Images en ChatGPT puede hacer varias cosas útiles dependiendo de lo que necesites en ese momento. Algunas peticiones típicas son:
Imagina que subes el boceto de un cartel hecho a mano. Puedes pedir: “describe este cartel y crea una versión digital más limpia con los mismos textos y colores aproximados”. Images en ChatGPT te responde con una imagen nueva que respeta la base de tu idea, pero con un acabado más pulido.
OpenAI ha diseñado Images en ChatGPT para que funcione codo con codo con los modelos de texto GPT. Eso quiere decir que, en la misma sesión, pasas de una lluvia de ideas escrita a una propuesta visual sin cambiar de herramienta ni de pestaña.
Esta integración hace que el texto y la imagen sean iguales en importancia dentro del flujo. Ya no es que el chat “tenga un modo imagen”, sino que el contenido visual se entiende como una salida tan natural como un párrafo bien redactado o un esquema de trabajo.
Con la nueva función Images en ChatGPT puedes plantear conversaciones bastante completas, donde el modelo te acompañe desde la idea inicial hasta un prototipo visual razonable. Algunos escenarios típicos son:
Con todo, la idea principal es que vas a poder pasar de la ideación textual a la producción visual en un único flujo continuo. No se rompe la conversación, no cambias de interfaz y no pierdes contexto entre una fase y otra.
La actualización de Images en ChatGPT está llegando primero a los planes de pago de ChatGPT. Esto incluye a quienes usan las suscripciones de nivel superior, que suelen recibir antes las funciones nuevas y los modelos más recientes.

OpenAI tiene previsto ir extendiendo esta capacidad a usuarios gratuitos de forma progresiva. Esto significa que, aunque no veas la opción desde el primer día, con el tiempo irás teniendo acceso a la nueva experiencia unificada de imágenes dentro del chat.
La función Images en ChatGPT no se limita al navegador. También está disponible en las aplicaciones móviles oficiales, tanto en Android como en iOS. En los tres entornos la idea es la misma: el chat es el centro del flujo de trabajo, y el contenido visual aparece integrado en el hilo de mensajes.
Si sueles trabajar desde el ordenador, te resultará cómodo tener una conversación larga y ver las imágenes en grande. Si estás fuera y solo tienes el móvil, vas a poder lanzar prompts rápidos, revisar resultados y hacer pequeños ajustes visuales sin necesidad de esperar a volver al escritorio.
Para quienes quieren integrar estas capacidades en sus propias aplicaciones, OpenAI ofrece la Images API. A través de esta interfaz, desarrolladores y empresas pueden conectar sus servicios al mismo modelo de imágenes que usa ChatGPT en la experiencia unificada.
Esto abre la puerta a que surjan herramientas de diseño internas, asistentes visuales dentro de productos ya existentes o servicios de generación de contenido que combinen texto e imagen sin depender de la interfaz oficial de ChatGPT.
Si formas parte de un equipo de desarrollo, la nueva Images API de OpenAI te permite construir funciones personalizadas sobre la base de este modelo de imagen. Algunos ejemplos prácticos que se están explorando son:
OpenAI quiere impulsar esta adopción tanto entre usuarios finales como entre desarrolladores. Por eso mantiene el acceso doble: a través de las suscripciones de ChatGPT para uso directo, y mediante la API para quien necesite soluciones integradas en sus propios productos.
Aunque cualquier persona puede sacar partido de Images en ChatGPT, hay varios perfiles para los que esta actualización encaja especialmente bien. La compañía menciona, entre otros, a creadores de contenido, equipos de marketing, docentes y equipos de producto que necesitan prototipar visualmente con rapidez.
En estos casos, el tiempo que se ahorra al no cambiar de herramienta y la capacidad de mantener la coherencia visual entre iteraciones tienen un impacto directo en el día a día. El chat se convierte en un espacio donde piensas, decides y pruebas ideas visuales sin un proceso técnico complicado.
Para que veas cómo se traduce esto en la vida real, aquí van algunos ejemplos concretos de uso de Images en ChatGPT según el perfil:

Aunque te salgas de estos perfiles, cualquier persona que combine texto e imagen en su trabajo diario puede usar Images en ChatGPT como apoyo para pensar mejor las ideas visuales antes de pasarlas a un diseño definitivo.
Con el lanzamiento de Images en ChatGPT, OpenAI mantiene los controles de seguridad que ya aplicaba a sus herramientas de imagen anteriores. Eso incluye filtros para bloquear contenido inapropiado, sensible o que choque con sus normas de uso establecidas.
La compañía sigue aplicando políticas claras sobre qué tipo de imágenes se pueden generar. Si intentas pedir contenido que vaya contra esas normas, el sistema lo detecta y responde de forma acorde, normalmente explicando que no puede crear ese tipo de imagen o proponiendo alternativas más seguras.
Esta combinación de funciones nuevas y controles heredados forma parte de la estrategia más amplia de sistemas multimodales de OpenAI, donde texto, imágenes y otros medios comparten la misma interfaz y las mismas líneas rojas de seguridad.
Con todo lo que incluye Images en ChatGPT —generación desde texto, edición directa, comprensión de imágenes y una integración muy estrecha con los modelos de texto GPT— vas a poder pasar de la idea al contenido visual en un solo espacio.
Tanto si escribes, diseñas, enseñas o desarrollas productos digitales, esta actualización te da una forma rápida y controlada de trabajar con imágenes dentro del propio chat, aprovechando un modelo más fiel al prompt, más consistente entre iteraciones y alineado con las políticas de uso y seguridad de OpenAI.
Me dedico al SEO y la monetización con proyectos propios desde 2019. Un friki de las nuevas tecnologías desde que tengo uso de razón.
Estoy loco por la Inteligencia Artificial y la automatización.