Sora supera el millón de descargas en menos de cinco días y lo hace con una fórmula familiar que engancha a primera vista. La app de OpenAI, disponible solo por invitación y en iOS desde el 30 de septiembre (y ahora en Android), mezcla scroll infinito con vídeos generados por IA de hasta 10 segundos.
El hito llega más rápido que el debut de ChatGPT, a pesar de que Sora no está abierta al gran público. En la App Store de Estados Unidos se ha situado entre las más descargadas, una señal clara de demanda. El formato recuerda al estilo de TikTok: entras, deslizas y ves una secuencia sin fin de clips nuevos. Falta un detalle que te interesa conocer y llega enseguida.
Lo que hace diferente a Sora es el “cameo”, un avatar hiperrealista que copia tu cara y tu voz para insertarte en vídeos generados por IA. Puedes limitar dónde aparece según permisos y palabras bloqueadas, y también, si lo permites, que otros te incluyan. El cameo puede representar a otras personas, y eso abre un frente delicado sobre identidad y consentimiento.
Ahora mismo abundan clips de cámaras corporales simuladas que detienen personajes de ficción y memes deepfake con figuras históricas o religiosas como Martin Luther King Jr. y Jesucristo. Para algunos, el gancho está en que todo el contenido es claramente artificial, así evitas dudas sobre autenticidad que sí tienes en redes sociales tradicionales. Para otros, esto es justo el problema.
Entre empleados y ex empleados de la compañía hay críticas a esta dirección de producto respecto a la promesa inicial de “beneficiar a la humanidad”. Uno de ellos la ha descrito como “una máquina infinita de basura de TikTok generada por IA”. El comentario no es aislado y refleja un debate interno sobre el propósito de la plataforma y su impacto cultural.
La adopción tan rápida importa por dos motivos prácticos. Primero, muestra hambre de nuevas formas de crear y consumir vídeos, incluso si duran 10 segundos. Segundo, presiona a rivales como Veo 3 de Google DeepMind o Gen-4 de Runway, que ya generan clips casi indistinguibles de una grabación real o de efectos CGI. El ejemplo de Netflix con la serie El Eternauta confirma que la frontera ya es muy fina.
También te puede interesar:Se ha Filtrado Sora, el Generador de Vídeo de OpenAiSora parte de la técnica de difusión latente, que recrea imágenes o vídeo a partir de ruido, pero lo hace en un espacio comprimido que ahorra cálculo. Encima añade transformers para mantener la coherencia entre fotogramas, así los objetos, la luz y el movimiento no “saltan”. Según Tim Brooks, el modelo divide los clips en pequeños cubos de datos que trata como secuencias comparables.
La generación de vídeo exige mucha más energía y cálculo que imagen o texto, y esa es la trampa que asoma en segundo plano. Veo 3 ya integra sonido y vídeo a la vez, con sincronización labial y efectos ajustados a la escena. Como dijo Demis Hassabis, la IA deja atrás “la era muda” y empieza a tratar audio y vídeo como un único dato dentro del mismo modelo de difusión.
Interesa otro cruce técnico. Aunque la difusión manda en imagen, vídeo y audio, empieza a mezclarse con los grandes modelos de lenguaje. DeepMind ha probado variantes de difusión para generar texto, y eso podría reducir el coste energético de los LLM en el futuro. Si ese camino madura, vas a poder pedir guion y clip final en un flujo unificado con menos consumo.
La pregunta del dinero está abierta. La generación de vídeo por IA es muy costosa en energía y dinero y, por ahora, Sora permite crear vídeos ilimitados y gratuitos. OpenAI participa en un proyecto de medio billón de dólares (500.000 millones) para centros de datos y energía, lo que encaja con esta ambición. Sam Altman admite que tendrá que monetizar con anuncios personalizados y compras dentro de la app, pero no hay detalles cerrados.
El impacto ambiental preocupa y crecerá a medida que entren más usuarios. Altman no ha dado la huella de carbono estimada de un clip de 10 segundos, y la comunidad pedirá transparencia pronto. Si ves límites en la cantidad diaria de generación o etiquetas de eficiencia, prepárate para una fase de ajuste en costes y en consumo.
Legalmente, el terreno es delicado. Sora facilita crear deepfakes de famosos y usa música o personajes con derechos. OpenAI ha optado por un sistema de exclusión a solicitud de los titulares, una política poco común que probablemente acabe en más demandas. Altman reconoce que recibe muchas peticiones de control y promete herramientas, aunque advierte que habrá casos límite difíciles de arbitrar.
También te puede interesar:Sora de OpenAI ya Disponible en Europa y Reino UnidoEl cameo añade otra capa. Bill Peebles ha anunciado que puedes bloquear la aparición de tu avatar en vídeos políticos o que incluyan ciertas palabras. Falta comprobar su eficacia en la práctica. Si un cameo se usa de forma indebida, no se descarta litigio. Aquí pesa tanto la tecnología como la moderación y las sanciones dentro de la plataforma.
Su acceso sigue restringido por invitación, así que el impacto real aún no se puede medir por completo. La gran incógnita es cultural: ¿podrá Sora generar vídeos tan atractivos como para desplazar nuestra atención del contenido real hacia lo sintético y, si lo hace, qué tipo de creatividad nativa emergerá en ese entorno?
Señales a vigilar en las próximas semanas:
Sora es la app que mezcla scroll infinito y vídeos generados por IA con adopción récord y muchas aristas por resolver. Vas a poder crear, probar cameos y explorar formatos nuevos, pero también tendrás que navegar reglas de derechos, costes energéticos y controles de identidad. El siguiente hito será cuando Sora salga de la invitación y marque su modelo de negocio; entonces sabremos si este impulso inicial se convierte en hábito sostenido.
Directora de operaciones en GptZone. IT, especializada en inteligencia artificial. Me apasiona el desarrollo de soluciones tecnológicas y disfruto compartiendo mi conocimiento a través de contenido educativo. Desde GptZone, mi enfoque está en ayudar a empresas y profesionales a integrar la IA en sus procesos de forma accesible y práctica, siempre buscando simplificar lo complejo para que cualquiera pueda aprovechar el potencial de la tecnología.