Una cinta VHS de los años 90, ocho segundos útiles y una IA actual: con ese material, una madre ha recuperado una parte muy íntima de sí misma. La protagonista es Sarah Ezekiel, que perdió la voz en el año 2000, antes de que el móvil con cámara fuese algo común. Falta un detalle clave para entender cómo fue posible con tan poco…
En la única grabación que quedaba de Sarah, conservada en una cinta VHS, solo hablaba durante ocho segundos. Ese mismo 2000, una enfermedad de la motoneurona le arrebató la voz y, poco después del nacimiento de su hijo pequeño, también la movilidad de las manos. Hoy esa ausencia tiene respuesta gracias a la clonación de voz, pero el camino no fue sencillo ni rápido.
Se quedó al cuidado de sus dos hijos, Aviva y Eric, en una situación muy dura. Eric, hoy con 25 años, solo recuerda a su madre ya paralizada. Aviva, con 28, guarda un instante nítido: el día en que notó que su madre era diferente porque no podía cortar unas fresas sola. Quedaba margen para una vuelta parcial.
Cinco años tras el diagnóstico, Sarah empezó a usar tecnología de seguimiento ocular. Con la mirada componía palabras y frases que un sintetizador reproducía con voz robótica, similar a la que empleó Stephen Hawking.
Gracias a ese sistema volvió a sentirse parte del mundo, retomó la pintura y se volcó como voluntaria en la asociación de afectados. Faltaba algo más humano: timbre, acento y emoción.
Ese salto llegó con un proyecto de Smartbox, que anunció voces clonadas gratuitas para un millón de personas en riesgo de perder la voz o que ya la habían perdido. Para Sarah pedían un audio base y solo existían esos ocho segundos en VHS, con ruido, conversaciones solapadas y una tele de fondo. El reto era transformar un recorte casi inservible en una clonación de voz creíble y cercana.
También te puede interesar:La Condición que Según el CEO de Perplexity, Aravind Srinivas, Definirá si la IA se Gana o no la Confianza en los NegociosSimon Poole, de Smartbox, se puso a ello. Primero aisló la voz de Sarah con la herramienta Voice Isolator de ElevenLabs, separándola del caos sonoro. El resultado inicial era plano, sin entonación y con un acento extraño, así que recurrió a otra aplicación entrenada con miles de voces para “rellenar” huecos y devolver personalidad. Cuando logró algo convincente, envió a Sarah varias frases con su nueva voz.
El primer impacto fue emocional. Sarah escuchó esas frases y se emocionó casi hasta el llanto. Un amigo que la conoció antes de la enfermedad la calificó de “impresionante” por su realismo. Aviva admite que le sigue sorprendiendo oírla a diario, y Eric lo resume mejor: “Ha sido una diferencia increíble porque ahora detecto alegría o enfado en su entonación”.
La clonación de voz devolvió matices que un sintetizador plano no podía dar.
Los datos y testimonios proceden de la propia familia, de Smartbox y del técnico responsable del proceso, y encajan con el material disponible: una cinta de los años 90 con solo 8 segundos aprovechables y la pérdida de voz en 2000. La clonación de voz no fue magia instantánea, sino un encaje fino entre aislamiento de audio y modelos generativos entrenados.
Por eso esa cinta es oro. La clonación de voz no es perfecta. A veces aparece un acento raro o una entonación forzada, y hay palabras que requieren ajustes. Con todo, el cambio en su día a día es claro.
Para Smartbox, el plan de ofrecer voces clonadas gratuitas a un millón de personas supone un salto social, y también un reto técnico y ético. Cuando el material previo es mínimo, la clonación de voz se apoya en modelos amplios y en la validación de quienes conocieron esa voz.
También te puede interesar:El CEO de Klarna usa un avatar de IA para presentar resultados financierosSarah lo explica con una frase sencilla que lo resume todo: “es mejor que ser un robot”. Echando de menos su voz auténtica, ha recuperado parte de su identidad, y tú vas a poder imaginar lo que significa hablar con tus hijos con tu propio timbre. Con ocho segundos, una cinta vieja y mucha ingeniería, la clonación de voz ha hecho posible lo que parecía perdido.
Directora de operaciones en GptZone. IT, especializada en inteligencia artificial. Me apasiona el desarrollo de soluciones tecnológicas y disfruto compartiendo mi conocimiento a través de contenido educativo. Desde GptZone, mi enfoque está en ayudar a empresas y profesionales a integrar la IA en sus procesos de forma accesible y práctica, siempre buscando simplificar lo complejo para que cualquiera pueda aprovechar el potencial de la tecnología.