La carrera entre las grandes tecnológicas por dominar la inteligencia artificial generativa no da tregua. Este mes, Google ha dado un paso clave al actualizar su modelo Gemini 2.0 Flash para permitir la edición de imágenes, una funcionalidad que hasta ahora era dominio exclusivo de ChatGPT desde que introdujo su revolucionaria función de edición estilo Studio Ghibli, que se volvió viral a inicios de 2025.
Con esta mejora, Gemini no solo es capaz de analizar imágenes, como ya hacía desde sus primeras versiones, sino que ahora también permite modificarlas de forma directa. El usuario puede subir una foto y pedirle a la IA que cambie el fondo, añada objetos, elimine elementos del entorno o incluso aplique un nuevo estilo visual, incluyendo efectos inspirados en animaciones o simulaciones 3D.
Entre las nuevas funcionalidades más destacadas de Gemini están:
Esto significa que ahora puedes trabajar con Gemini de forma muy similar a como lo harías con herramientas de edición fotográfica profesional, pero solo con texto. Según Google, el modelo es capaz de entender el sujeto principal de la imagen y aplicar las modificaciones de forma coherente, sin regenerar por completo la escena.
Además, esta actualización también permite tomar una imagen generada previamente por Gemini y ajustarla, en lugar de crear una completamente nueva. Este nivel de continuidad representa una mejora sustancial frente a versiones anteriores.
Aunque Google ha alcanzado en términos de funcionalidad lo que OpenAI ya ofrecía, la comparación en cuanto a calidad aún deja matices. Las primeras pruebas indican que ChatGPT sigue ofreciendo resultados más refinados, especialmente en estilos artísticos complejos. Sin embargo, el hecho de que Gemini ya pueda emular ese proceso es un avance importante en su competitividad.
También te puede interesar:Google Presenta Gemini 2.5, sus Nuevos Modelos con RazonamientoLa función aún no está completamente disponible en todos los países (por ejemplo, en España se espera su despliegue en los próximos días), pero ha comenzado a activarse progresivamente en otros mercados.
Esta actualización refuerza la idea de que la edición de imágenes mediante inteligencia artificial será una de las principales batallas del sector en 2025. Mientras Meta avanza con su modelo de generación de mundos virtuales y Adobe integra IA en Photoshop, Google y OpenAI se disputan el control de la creatividad instantánea.
Puedes leer más sobre la evolución de los modelos de lenguaje multimodal como Gemini en la documentación oficial de Google DeepMind o revisar cómo ChatGPT introdujo sus capacidades visuales en esta nota de OpenAI.
En definitiva, Google escuchó a su comunidad, respondiendo con una herramienta que promete ser tan poderosa como accesible. Lo que antes requería software profesional y habilidades técnicas, ahora puede resolverse con un simple comando de texto. Y eso, en sí mismo, marca una nueva era en la edición digital.
También te puede interesar:Google permite que su IA sea accesible para menores de 13 años: así funciona Gemini con Family LinkMe dedico al SEO y la monetización con proyectos propios desde 2019. Un friki de las nuevas tecnologías desde que tengo uso de razón.
Estoy loco por la Inteligencia Artificial y la automatización.