¿Qué falta para que un robot deje de ser una máquina que “entiende” y empiece, de verdad, a hacer las cosas? Esa distancia, que parece pequeña cuando uno da una orden en voz alta, suele ser la más difícil: pasar de las palabras al movimiento sin romper nada en el camino.
Alibaba acaba de mostrar su respuesta con Qwen-Robot, su primera familia de inteligencia artificial encarnada, es decir, modelos diseñados no solo para comprender órdenes, sino para ejecutarlas con motores y articulaciones. El hallazgo salió de Tongyi Lab y ya entró en pilotos con clientes empresariales de Alibaba Cloud.
Hasta ahora, los modelos de Alibaba podían reconocer objetos y entender instrucciones. La pieza clave que faltaba era el mecanismo físico. Qwen-Robot busca cerrar ese cableado: convertir lenguaje natural en acciones reales, con un despliegue que ya no se queda dentro del laboratorio.

La central del sistema se divide en varios módulos. Qwen-RobotNav lleva la navegación, Qwen-RobotManip se ocupa de agarrar y mover objetos, Qwen-RobotWorld anticipa qué puede pasar en el entorno, y Qwen-RobotClaw coordina todo para que funcione como un único engranaje.
En una demostración, un robot cuadrúpedo Unitree Go2 recorrió un apartamento desconocido siguiendo órdenes habladas. Lo hizo con una sola cámara de baja resolución y sin mapas previos del lugar. Además, la latencia de inferencia, el tiempo que tarda la IA en responder, fue de 196 milisegundos.
Del lenguaje al movimiento físico
Ese dato importa porque revela una respuesta casi inmediata para tareas básicas. En la práctica, es como si el robot pudiera mirar una habitación nueva y decidir su siguiente paso sin necesitar un plano pegado en la pared.
En manipulación, el avance también tiene una base concreta. Alibaba entrenó a Qwen-RobotManip con más de 38.000 horas de datos abiertos sobre interacción con objetos. Y lanzó Chat2Robot, una plataforma de código abierto desde el navegador que permite transformar instrucciones cotidianas en acciones robóticas ejecutables.

Pero el sistema todavía no está listo para todo. En la prueba RoboChallenge, Qwen-RobotManip obtuvo una puntuación de proceso de 59,83 y una tasa de éxito del 45 %. Es decir, aún falla más de lo que acierta cuando la tarea se vuelve compleja. Eso lo deja lejos de entornos exigentes como una fábrica o una cocina. En esos espacios, un pequeño error no es una anécdota: puede ser una caída, un golpe o una pieza mal colocada.
La oportunidad de Alibaba en la carrera robótica
La ventaja de Alibaba está en que no empieza de cero. Reutiliza su modelo lingüístico Qwen, ya muy extendido, con una familia que se acerca a los mil millones de descargas. Esa base madura funciona como el cableado ya instalado de una casa: permite añadir nuevos aparatos sin rehacer toda la estructura.
Además, el amplio ecosistema de desarrolladores de Qwen puede acelerar la expansión hacia robots más útiles. Mientras tanto, la carrera global sigue abierta. Google DeepMind, NVIDIA y varias startups empujan en la misma dirección, y China suma músculo industrial con empresas como Tencent, Unitree, UBTech o Xiaomi.
Por ahora, Qwen-Robot no resuelve todos los problemas de la robótica. Pero sí revela un cambio importante: el robot ya no solo oye y reconoce, también empieza a conectar cada orden con una acción. Y esa pieza clave puede ser el interruptor que acerque estas máquinas a la vida diaria.

Directora de operaciones en GptZone. IT, especializada en inteligencia artificial. Me apasiona el desarrollo de soluciones tecnológicas y disfruto compartiendo mi conocimiento a través de contenido educativo. Desde GptZone, mi enfoque está en ayudar a empresas y profesionales a integrar la IA en sus procesos de forma accesible y práctica, siempre buscando simplificar lo complejo para que cualquiera pueda aprovechar el potencial de la tecnología.







