Google está calentando motores para que Gemini deje de ser solo “el chat que responde” y se convierta en una especie de estudio creativo en el bolsillo. La apuesta es clara: vídeos por plantillas (Veograms) y, además, generación de música dentro de la misma interfaz.
La batalla ya no gira únicamente en torno a quién tiene el LLM más avanzado, sino a quién permite crear más contenido en menos tiempo, sin obligar al usuario a lidiar con prompts interminables o demasiado técnicos.
Este se trata de un movimiento que marca un giro evidente hacia la creación de vídeo estructurada y guiada. En lugar de empezar desde cero con instrucciones abiertas como “hazme un vídeo de X con estilo Y”, el usuario podría elegir una plantilla con una estructura predefinida y generar el contenido dentro de ese marco visual.
Pero esto no es solo un capricho de diseño o de interfaz. Google parece haber entendido algo fundamental: la mayoría de las personas no quiere aprender prompting avanzado, sino obtener resultados decentes de forma rápida y sin fricción. En ese sentido, Gemini busca que hacer un vídeo se parezca más a elegir un filtro que a programar un prompt.
Los Veograms funcionan como plantillas de vista preestablecidas, una especie de “layout creativo” que guía el proceso de generación. Primero se selecciona una estructura o temática general y, a partir de ahí, se define la intención y los detalles, en lugar de construir todo manualmente desde cero.
También te puede interesar:Función ‘Ask Gemini’ en Google Meet: Resume Todo lo que ha Pasado en la VideollamadaAquí está la clave del enfoque: el sistema está claramente orientado a acelerar la creación para usuarios que quieren publicar ya, no para quienes disfrutan afinando prompts como si estuvieran ajustando un motor. A esto se suma que los Veograms ya han aparecido en pruebas limitadas, lo que indica que no se trata de una idea teórica, sino de una función que Google lleva tiempo probando y midiendo.
La diferencia real llegará con un despliegue amplio. Si Google abre esta función a más usuarios, el impacto será directo: la generación de vídeo se vuelve más accesible para personas que hoy se frustran porque no saben exactamente cómo pedir lo que quieren.
Las plantillas tienen una ventaja poco llamativa, pero crucial: reducen la variabilidad. Se sacrifica parte de la libertad creativa total a cambio de resultados más coherentes y repetibles, especialmente cuando el usuario no domina el lenguaje de prompts.
Este enfoque encaja con una tendencia clara en las herramientas creativas con IA: pasar de “escribe cualquier cosa” a “elige un formato ganador y personalízalo”. Sin embargo, también abre una pregunta incómoda: si todos usan las mismas plantillas, ¿acabaremos viendo vídeos demasiado parecidos entre sí?
La IA generativa ya arrastra esa sensación de contenido homogéneo cuando se abusa de estilos predefinidos, y las plantillas podrían acentuar ese efecto si no se gestionan bien.
Referencias en código interno apuntan a que Google trabaja en herramientas de generación musical integradas en Gemini. No se trataría solo de escribir letras o recomendar playlists, sino de crear pistas de audio desde cero.
También te puede interesar:Sin Fotógrafo ni Estudio: Crea Fotos Profesionales Gratis, con Google GeminiExisten muestras tempranas que cubren géneros como rock, jazz y lo-fi, lo que sugiere que Google está probando variedad y no limitándose a un único estilo de demostración. Además, todo indica que esta función aparecería en la misma interfaz de Gemini y permitiría crear y descargar archivos de audio directamente.
El gran asterisco aquí es el modelo subyacente. No está confirmado si estas funciones llegarán con un modelo completamente nuevo o si serán una capa de producto construida sobre tecnología ya existente dentro del ecosistema de Google. Para el usuario final, en realidad, eso importa poco, siempre que el resultado suene bien y no tarde una eternidad en generarse.
Lo realmente interesante no son los Veograms o la música por separado, sino la combinación de ambas funciones. Si se lanzan de forma general, supondrían un paso importante para posicionar a Gemini como un espacio creativo multimodal, donde se puede trabajar con vídeo, audio y texto sin salir de la plataforma.
Esto permitiría comprimir en un solo lugar un flujo que hoy suele requerir tres aplicaciones distintas: una para el guion, otra para el vídeo y otra para la música. Sin embargo, competir como “todo en uno” es arriesgado si cada pieza se queda a medias.

Si Google ejecuta bien esta estrategia, Gemini podría pasar de ser un simple asistente a una herramienta creativa real, de esas que se abren para producir y no solo para preguntar. Pero si se queda en plantillas demasiado limitadas y música de demostración, el mercado no tardará en castigarlo.
Al final, esta es solo la primera fase de una guerra donde la IA no gana por ser más inteligente, sino por ser más útil, más rápida y más efectiva cuando el usuario quiere crear algo y publicarlo ya.
Me dedico al SEO y la monetización con proyectos propios desde 2019. Un friki de las nuevas tecnologías desde que tengo uso de razón.
Estoy loco por la Inteligencia Artificial y la automatización.