Imagínate poder crear audio estéreo con inteligencia artificial directamente desde tu móvil, sin gastar datos ni depender de servidores lejanos. Así es como Stability AI presenta Stable Audio Open Small, una solución que presume de ser la más rápida y eficiente para generar muestras de sonido y efectos de manera local, sin preocuparte por licencias ni tiempos de espera.
Esta nueva tecnología de generación de audio dirigida a móviles llega tras una alianza con el fabricante de chips Arm, responsable de la mayoría de los procesadores que llevan tanto los teléfonos como muchas tabletas que usamos cada día. Más allá de la novedad técnica, este esfuerzo busca romper la barrera del coste y la complejidad en la creación de sonido digital, permitiendo un acceso mucho más sencillo para desarrolladores, estudiantes, creadores y pequeñas empresas.
¿Qué hace diferente a Stable Audio Open Small? Mientras servicios populares como Suno y Udio necesitan conexión a Internet y procesan el audio en la nube, el nuevo modelo de Stability AI funciona de forma local directamente en el móvil. Para ti, esto significa que puedes crear efectos de sonido estés donde estés, sin preocuparte por el consumo de datos ni la privacidad.
El modelo ha sido optimizado específicamente para procesadores Arm, que llevan la mayoría de smartphones Android y muchas tablets. Así, vas a poder generar hasta 11 segundos de audio estéreo en menos de 8 segundos, algo extremadamente sencillo y rápido para probar fragmentos de batería, instrumentos y pequeños efectos que dotan de vida a tu proyecto.
A la hora de crear audio con IA, uno de los mayores dolores de cabeza puede ser el copyright. Muchos de los competidores, como Suno y Udio, habrían entrenado sus modelos con música protegida por derechos, lo que introduce riesgos legales importantes. Por el contrario, la alternativa de Stability AI ha salido airosa en este aspecto gracias a una decisión fundamental.
Stable Audio Open Small solo ha sido entrenado con canciones y muestras procedentes de Free Music Archive y Freesound, dos bibliotecas referencia de música libre de derechos. Así, vas a poder evitarte cualquier susto relacionado con la propiedad intelectual, algo que normalmente solo preocupa a empresas grandes, pero que cada día afecta más a particulares y pequeños creadores.
No todo es magia en la generación de efectos de sonido por IA. Stable Audio Open Small brilla en muestras cortas, piezas instrumentales simples y efectos como riffs de batería o sonidos ambientales. Si sueñas con generar voces lúcidas o canciones completas con una calidad digna de radio, aquí llegan algunas limitaciones importantes que debes conocer.
Para empezar, este modelo no es capaz de producir voces realistas ni canciones elaboradas. Solo admite instrucciones en inglés, así que si piensas probar comandos en español, mejor tenlo en cuenta. A esto se suma el sesgo en cuanto a estilos musicales: al estar entrenado principalmente con música occidental, los ritmos orientales, africanos o latinoamericanos pueden sonar más pobres o artificiales.
Si buscas una alternativa fácil y gratis para hacer pruebas o bocetos de audio sin comprometer la legalidad, este modelo cubre la mayoría de necesidades de creadores amateurs y estudiantes.
La licencia de Stable Audio Open Small es bastante clara y, en parte, restrictiva. Vas a poder usar y descargar el modelo de forma totalmente gratuita si eres investigador, aficionado o si tu empresa tiene menos de un millón de dólares de ingresos al año. Para desarrolladores profesionales o compañías que superen ese umbral, la cosa cambia y tendrás que pagar una licencia específica.
Esto abre la puerta a un abanico increíble de pequeños proyectos y startups para experimentar con la IA generadora de audio sin costes, algo que hasta hace poco era impensable.
No todo es perfecto. Hay detalles que merecen tu atención si pretendes usar Stable Audio Open Small en el ámbito profesional. Por un lado, el modelo responde solo a comandos en inglés. Además, como te adelantaba antes, no puede crear voces ni canciones complejas.
El rendimiento también varía bastante si te mueves fuera de estilos musicales occidentales debido al sesgo en los datos de entrenamiento.
Para la mayoría de efectos básicos, bases rápidas y fragmentos funcionales orientados a pruebas, la rapidez y sencillez de este sistema lo convierte en una opción difícil de igualar para usuarios móviles.
Y si tienes curiosidad técnica, el tamaño de este modelo es de 341 millones de parámetros, más ajustado que “gigantes” que solo funcionan desde servidores remotos.
Stability AI no solo es conocida por este modelo; fue la empresa que revolucionó la generación de imágenes con Stable Diffusion. En el último año, la compañía vivió momentos de turbulencia, con salidas importantes en su dirección, problemas internos y la pérdida de alianzas, como la ruptura con Canva.
Tras recibir apoyo económico de inversores clave como Eric Schmidt y Sean Parker, la empresa ha dado un giro estratégico, renovando su equipo directivo y sumando nombres llamativos como el cineasta James Cameron al consejo. Últimamente, además de este modelo de audio, han lanzado varios sistemas nuevos de generación de imágenes, lo que demuestra que la apuesta por la inteligencia artificial práctica sigue más viva que nunca.
En resumen: Stable Audio Open Small de Stability AI pone al alcance de cualquiera la generación de audio vía inteligencia artificial desde el móvil, sin ataduras legales y con una velocidad que marca diferencias frente a alternativas de creación de música con IA.
Puedes generar efectos, fragmentos instrumentales y piezas sonoras sencillas en segundos, siempre que aceptes sus limitaciones en voces y géneros no occidentales. Recuerda que la licencia permite el uso libre para particulares y pequeñas empresas, pero exige condiciones distintas si tu proyecto crece.
Si eres curioso o creativo, esta herramienta es el paso lógico para experimentar sin miedo a meterte en líos legales, todo de forma inmediata y desde la palma de tu mano.
Me dedico al SEO y la monetización con proyectos propios desde 2019. Un friki de las nuevas tecnologías desde que tengo uso de razón.
Estoy loco por la Inteligencia Artificial y la automatización.