Si estás cansado de hablar con chatbots planos en una ventanita de texto, te interesa seguir de cerca lo que está haciendo Lemon Slice. Esta startup quiere que los agentes de IA se parezcan más a una videollamada interactiva en tiempo real que a un simple cuadro de chat, y para eso está creando avatares de IA en vídeo en directo que reaccionan mientras tú hablas o escribes.
En lugar de vídeos estáticos o animaciones poco creíbles, su modelo Lemon Slice-2 promete algo distinto: avatares que mueven la cara y el cuerpo de forma natural, que cambian de estilo al vuelo y que se conectan a bases de conocimiento para actuar como profesor, vendedor o terapeuta, según lo que necesites.
Lemon Slice-2 es el corazón de la propuesta de Lemon Slice, un modelo de difusión de propósito general que genera avatares de IA en vídeo en directo a partir de una única imagen. No necesitas un rodaje profesional ni mil fotos, basta con subir una cara y el sistema se encarga de animarla con voz y gestos.
Este modelo cuenta con unos 20.000 millones de parámetros, una cifra alta que suele implicar más capacidad para captar detalles sutiles de movimiento y expresión. Está pensado para ser práctico: funciona en una sola GPU, lo que abre la puerta a que muchas empresas puedan usar estos avatares de IA en vídeo en directo sin una infraestructura de superordenador.
Una de las ventajas más claras de Lemon Slice-2 es que vas a poder crear un avatar digital completo usando solo una imagen. Subes la foto, el modelo aprende la cara y, a partir de ahí, genera vídeo en directo a unos 20 fotogramas por segundo, suficiente para que la conversación se vea fluida y natural.
El sistema se inspira en otros modelos de vídeo avanzados tipo Veo3 o Sora, pero se orienta de forma específica a avatares de IA en vídeo en directo. No renderiza solo labios moviéndose: genera el vídeo de extremo a extremo, con movimientos de cabeza, parpadeos y expresiones adaptadas al contexto del diálogo.
Frente a soluciones que solo soportan caras humanas o estilos tipo videojuego, Lemon Slice ha elegido un enfoque generalista. Su modelo de difusión está entrenado para trabajar con caracteres humanos y no humanos, lo que quiere decir que vas a poder tener tanto un profesor humanoide como una mascota virtual que te explique un producto.
Este enfoque “todo en uno” evita tener que entrenar modelos separados por sector o personaje. Requiere muchos datos y cómputo, algo que la compañía asume como inversión clave para que sus avatares de IA en vídeo en directo no se queden por debajo del fotorrealismo ni se limiten a estilos muy concretos.
La gran diferencia entre un vídeo normal y los avatares de IA en vídeo en directo de Lemon Slice está en la interacción. Aquí no ves un vídeo pregrabado, sino un personaje digital conectado a una base de conocimiento que responde a tus preguntas en tiempo real y adapta su lenguaje a cada usuario.
Cada avatar puede “vestirse” con un rol distinto. Si lo conectas a tu documentación de empresa, se convierte en agente de atención al cliente. Si lo enlazas a un temario escolar, se comporta como un profesor particular. Y si lo orientas a bienestar, puede acompañar en tareas de apoyo en salud mental con un enfoque más empático y pausado.
Aunque Lemon Slice no ha publicado nombres concretos, indica que ya se usan sus avatares de IA en vídeo en directo en sectores como educación, aprendizaje de idiomas, comercio electrónico y formación corporativa. Imagina un curso tipo YouTube, pero con un “profe avatar” que responde a tus dudas al momento en lugar de dejarte solo con los comentarios.
En un ecommerce, el mismo sistema puede hacer de asesor de compras en vídeo: un personaje que te enseña productos, aclara detalles y te guía por el proceso de pago. En formación interna, un avatar corporativo puede explicar procesos, hacer pequeñas preguntas de repaso y acompañar a empleados nuevos durante sus primeras semanas.
Lo interesante es que no estás atado a un solo uso. Un mismo motor puede dar vida a un avatar profesor, otro vendedor y otro “coach” de bienestar, según la base de conocimiento que conectes. El modelo de lenguaje que hay detrás se ajusta al contexto y a la intención con la que se diseña el agente.
Gracias a esta flexibilidad, vas a poder desplegar una familia de avatares de IA en vídeo en directo coherentes con tu marca, pero con funciones distintas: uno para soporte, otro para onboarding y otro para formación avanzada, todos compartiendo el mismo núcleo tecnológico.
Si quieres llevar estos avatares de IA en vídeo en directo a tu propio proyecto, Lemon Slice ofrece dos caminos principales: su API para desarrolladores y un widget embebible para integrarlo en páginas web sin pelearte con una integración compleja.
Con estos dos mecanismos vas a poder probar rápido, iterar y, si te funciona, escalar la presencia de avatares en diferentes puntos de tu servicio, desde el “chat de ayuda” hasta páginas de producto o plataformas de curso.
La compañía expone Lemon Slice-2 mediante una API para desarrolladores. Esto te permite controlar el ciclo completo del avatar de IA en vídeo en directo desde tu backend: crear el personaje, mandar el texto que debe decir, recibir el stream de vídeo y gestionar estados de sesión.
Una integración típica con la API podría seguir estos pasos:
Este enfoque por API es ideal si quieres que los avatares de IA en vídeo en directo estén totalmente integrados con tu lógica interna, tu sistema de usuarios y tus herramientas ya existentes.
Si no tienes tiempo o recursos para una integración profunda, Lemon Slice ofrece un widget embebible que puedes añadir a tu web con una sola línea de código. Es similar a integrar un chat flotante, pero en versión avatar de vídeo.
Con este widget, vas a poder colocar un pequeño recuadro de vídeo en la esquina de tu sitio, listo para que el usuario abra una conversación con un avatar de IA en vídeo en directo. Este enfoque resulta práctico para pruebas rápidas o para negocios que todavía no tienen un equipo técnico amplio.
Una vez creado el personaje, no estás atado a un único aspecto. Puedes modificar el fondo, el estilo y la apariencia sin tener que volver a entrenar o subir otra imagen. Esto permite adaptar el avatar de IA en vídeo en directo a campañas concretas, temporadas o distintos apartados de tu web.
Por ejemplo, podrías tener el mismo avatar con un fondo neutro para soporte general, otro con estética “aula” para tus cursos y otro con una escena de tienda para tu catálogo. Todo se apoya en el mismo motor, pero cambia el envoltorio visual para encajar mejor en cada contexto.
Si alguna vez has visto un avatar que te parecía algo raro, casi humano pero no del todo, has sentido el famoso valle inquietante. La cofundadora Lina Colucci insiste en que muchas soluciones actuales aportan incluso “valor negativo” al producto porque generan rechazo y cansancio en interacciones largas.
Según Colucci, los movimientos rígidos, la sincronización de labios imprecisa o las expresiones vacías hacen que el usuario prefiera, al final, volver al chat de texto. Ese es el freno principal para que los avatares de IA en vídeo en directo se adopten en masa, más que el coste o la tecnología de fondo.
Lemon Slice apuesta por su propio modelo generalista de difusión de vídeo para acercarse lo máximo posible al comportamiento humano natural. Jared Friedman, de Y Combinator, comenta que el objetivo es cruzar ese “valle inquietante” y llegar a una especie de “test de Turing del avatar”, donde cueste distinguir si estás hablando con una persona real o con un sistema.
Al generar el vídeo de extremo a extremo, sin parches ni módulos desconectados, el modelo no tiene un techo de calidad tan claro. Teóricamente, cuanto más se entrena y más datos maneja, más se acerca al fotorrealismo y a microgestos que dejan de molestar al ojo humano durante conversaciones largas.
La parte visual es solo una cara de la moneda. En los avatares de IA en vídeo en directo la voz tiene tanto peso como la imagen, porque marca el ritmo, la emoción y la sensación de naturalidad en cada respuesta.
Lemon Slice se apoya en tecnología de ElevenLabs para generar voces que suenan claras, con tonos variados y diferentes acentos. Gracias a esto, cada avatar puede tener una “personalidad sonora” distinta, desde un profesor tranquilo hasta un agente comercial más enérgico.
Una preocupación lógica con avatares realistas es el riesgo de clonación no autorizada. Para mitigar esto, la empresa afirma que incorpora sistemas de protección para impedir que se creen avatares usando caras o voces sin permiso.
Estos mecanismos incluyen controles internos antes de aceptar nuevas imágenes y limitaciones sobre cómo se usan las voces generadas. Aunque no dan todos los detalles públicos, el objetivo es que sus avatares de IA en vídeo en directo no se conviertan en una herramienta fácil para el fraude o la suplantación.
El contenido que genera un avatar también puede meterte en problemas si no lo vigilas. Por eso, Lemon Slice usa grandes modelos de lenguaje para moderar las respuestas asociadas a sus avatares, filtrando mensajes inadecuados, dañinos o contrarios a las políticas de cada cliente.
La idea es que estos modelos actúen como filtro previo o capa de control, de manera que tus avatares de IA en vídeo en directo mantengan un tono adecuado y respeten normas de seguridad, privacidad y contenido sensible en contextos como educación o salud mental.
El espacio de los avatares de IA en vídeo en directo está bastante animado. Lemon Slice no está sola: compite con proyectos de generación de vídeo como D-ID, HeyGen y Synthesia, y con creadores de avatares digitales como Genies, Soul Machine, Praktika o AvatarOS.
Muchas de estas soluciones adoptan enfoques más acotados: se centran en ciertos estilos de personaje, sectores concretos o tipos de animación específicos. Esa especialización puede acelerar resultados en nichos concretos, pero también limita el rango de casos de uso que se pueden cubrir con un único modelo.
El socio de Matrix Partners, Ilya Sukhar, cree que la ventaja de Lemon Slice está en su apuesta por un modelo generalista, entrenado con la lógica de “escalar datos y cómputo” que ya ha funcionado en otras áreas de la IA, la famosa “bitter lesson”.
Al no diseñarse solo para un vertical, el modelo puede adaptarse a nuevos sectores con menos fricción. Jared Friedman destaca que este planteamiento sin techo de calidad es lo que podría permitir que los avatares de IA en vídeo en directo de Lemon Slice se acerquen al fotorrealismo mientras otros sistemas quedan limitados por su diseño inicial.
No todos los contextos piden un vídeo. Hay tareas donde el texto sigue siendo más cómodo y rápido. Sukhar señala que los avatares de IA en vídeo en directo encajan especialmente bien en entornos donde el vídeo ya domina, como el aprendizaje tipo YouTube frente a textos largos y densos.
Imagina que estás viendo una lección de matemáticas y, en un momento, puedes “parar” al profesor avatar para preguntarle dudas y recibir una explicación personalizada al momento. Ese formato híbrido entre vídeo y chat promete subir bastante el nivel de engagement respecto a las clases grabadas tradicionales.
En educación, un avatar de IA en vídeo en directo puede acompañar al alumno paso a paso, adaptar ejemplos y repetir explicaciones de forma paciente, algo que a veces se echa en falta con profesores humanos saturados. En idiomas, puede servir como compañero de conversación disponible las 24 horas.
En comercio electrónico, un avatar puede hacer demostraciones sencillas, explicar cómo funciona un producto y resolver dudas de posventa sin obligar al usuario a leer largos textos de ayuda. En formación corporativa, un mismo personaje puede guiar a nuevos empleados por los procesos clave, evaluar su comprensión y redirigirlos a recursos internos cuando sea necesario.
Lemon Slice se fundó en 2024 por Lina Colucci, Sidney Primas y Andrew Weitz, con la idea clara de que el vídeo tiene que ser tan interactivo como un chat de IA moderno. No quieren que los avatares sean solo un vídeo bonito, sino una capa “viva” sobre agentes conversacionales tipo ChatGPT.
De momento, la startup funciona con un equipo reducido, unas ocho personas, lo que suele traducirse en ciclos de desarrollo rápidos y bastante foco técnico. Su ambición es crecer en dos frentes: ingeniería y go-to-market, para llevar sus avatares de IA en vídeo en directo a más empresas.
Para impulsar ese plan, Lemon Slice ha cerrado una ronda seed de 10,5 millones de dólares. La operación está liderada por Matrix Partners y Y Combinator, dos nombres conocidos en el mundo startup por apoyar proyectos muy técnicos en fases tempranas.
En la lista de inversores también aparecen perfiles individuales llamativos: el CTO de Dropbox, Arash Ferdowsi, el CEO de Twitch, Emmett Shear, y el dúo musical The Chainsmokers, que llevan tiempo invirtiendo en tecnología. Esta mezcla de capital y experiencia refuerza la apuesta por los avatares de IA en vídeo en directo como pieza importante del futuro de la interacción online.
El dinero no se quedará quieto. Lemon Slice planea usar buena parte del capital para pagar los altos costes de cómputo que implica entrenar modelos de difusión de vídeo, especialmente uno de propósito general como Lemon Slice-2.
El resto se destinará a contratar más perfiles de ingeniería y de ventas y crecimiento. El objetivo es seguir mejorando la calidad de los avatares de IA en vídeo en directo, ampliar la base de clientes y asegurar que esta tecnología no se queda en una demo curiosa, sino que llega a productos que la gente use a diario.
Todo apunta a que los avatares de IA en vídeo en directo van a ganar peso en los próximos años, sobre todo allí donde el vídeo ya manda y el texto se queda corto. Lemon Slice quiere adelantarse a ese cambio con un modelo de difusión generalista, capaz de generar rostros humanos y no humanos a partir de una sola imagen, conectado a bases de conocimiento y reforzado por voces naturales y sistemas de seguridad.
Me dedico al SEO y la monetización con proyectos propios desde 2019. Un friki de las nuevas tecnologías desde que tengo uso de razón.
Estoy loco por la Inteligencia Artificial y la automatización.