Mira MuratiChatGPTIA / Inteligencia ArtificialSam AltmanMetaLlama 4SoraDeloitteAnthropicAgentes IAAlexandr WangTinkerProxusNvidiamicrosoft

Modelos IA de Google DeepMind para Robots: Desde Buscar en Internet, Hasta Realizar Tareas

 | septiembre 26, 2025 05:14

Gemini Robotics 1.5 es la nueva apuesta de Google DeepMind para que los robots pasen de “hacer lo que les pides” a pensar lo que conviene hacer. Podrás entender por qué este avance cambia la forma de planificar acciones físicas, cómo entra en juego la web para obtener ayuda y qué significa que un robot aprenda de otro.

Te contamos qué hace cada modelo, cómo se coordinan y qué ejemplos reales ya funcionan. Hay matices sobre acceso y uso que conviene conocer. Si te interesa la robótica práctica, aquí encuentras pistas claras para empezar a trabajar con Gemini Robotics 1.5 y su versión de razonamiento.

Qué es Gemini Robotics de DeepMind y para qué sirve en tareas reales

Gemini Robotics es un modelo de IA pensado para que un robot ejecute tareas de varios pasos con comprensión del entorno. La idea es pasar de órdenes sueltas a planes completos: percibir, decidir y actuar en secuencia. Con este enfoque, puedes resolver acciones físicas cotidianas sin guiones rígidos ni atajos frágiles.

La directiva de robótica de DeepMind, Carolina Parada, lo resumió bien: estos modelos cooperan para que los robots “piensen varios pasos por delante” antes de moverse en el mundo físico. El sistema no va solo; se apoya en otra pieza clave que amplía el razonamiento y la búsqueda en internet.

Diferencias clave entre Gemini Robotics 1.5 y Gemini Robotics-ER 1.5

Para entender el conjunto, conviene separar papeles. Gemini Robotics-ER 1.5 añade un bloque de razonamiento y acceso a herramientas digitales. Mientras tanto, Gemini Robotics 1.5 integra visión y lenguaje para ejecutar la tarea física paso a paso con precisión.

AspectoGemini Robotics 1.5Gemini Robotics-ER 1.5
Rol principalEjecución física con visión y lenguajeRazonamiento y obtención de información
Uso de internetNo consulta directamenteUsa herramientas como Google Search
SalidaAcciones coordinadas por pasosInstrucciones en lenguaje natural
Aprendizaje entre robots, transferencia entre configuracionesComplementa con conocimiento externo

Cómo se reparten el trabajo Gemini Robotics-ER 1.5 y el modelo ejecutor

La cadena funciona así: Gemini Robotics-ER 1.5 analiza la tarea, consulta fuentes en la web si hace falta y traduce lo relevante a instrucciones en lenguaje natural. Luego, Gemini Robotics 1.5 combina esas instrucciones con su visión del entorno para ejecutar los pasos de forma fiable.

También te puede interesar:Google AI Studio ahora disponible como PWA

No todo depende de la búsqueda online. Si la información ya está clara, Gemini Robotics 1.5 planifica y actúa en local, lo que reduce esperas y evita dudas cuando el contexto es conocido.

Cómo planifican varios pasos por delante los robots con Gemini Robotics 1.5

¿Qué cambia en la práctica? Gemini Robotics 1.5 entiende la escena, anticipa subobjetivos y decide el orden correcto de acciones. Esta planificación evita errores típicos, como agarrar un objeto antes de despejar el área o mezclar elementos incompatibles.

Cómo planifican robots con Gemini Robotics

El comentario de Parada encaja aquí: al “pensar varios pasos por delante”, el robot reduce idas y venidas, ahorra tiempo y minimiza fallos. En tareas con incertidumbre, el sistema puede consultar la web a través de Gemini Robotics-ER 1.5 para aclarar normas o condiciones cambiantes.

Ejemplos de tareas complejas resueltas con Gemini Robotics 1.5

Para aterrizarlo, mira tres escenarios que ya se han probado con los modelos:

  • Separar ropa por colores: detecta tonos, agrupa prendas y organiza montones listos para lavar y doblar.
  • Hacer una maleta según el clima de Londres: consulta la previsión y prepara prendas acordes a lluvia, temperatura y actividad.
  • Clasificar residuos: verifica normativas locales en la web, identifica contenedores y deposita cada material donde corresponde.

Con Gemini Robotics 1.5 resuelve estas tareas sin programar reglas manuales para cada detalle. Si hay cambios en las normas o necesidades especiales, Gemini Robotics-ER 1.5 busca la información y ajusta las instrucciones.

Aprendizaje entre robots con Gemini Robotics 1.5: transferencia entre ALOHA2, Franka y Apollo

Una novedad potente es que Gemini Robotics 1.5 permite que los robots aprendan unos de otros, incluso si su cuerpo no es igual. DeepMind ha mostrado que lo aprendido por el robot ALOHA2, con dos brazos, se puede replicar en un robot bimanual Franka y en el humanoide Apollo de Apptronik.

 robot bimanual Franka

Las diferencias mecánicas importan. El mérito es que el modelo abstrae la habilidad y la adapta, sin obligarte a reentrenar desde cero cada robot. Vas a poder acelerar proyectos al compartir destrezas entre plataformas.

¿Un solo modelo para robots muy distintos, incluidos humanoides?

Sí. Un único modelo puede controlar robots variados, desde bimanuales hasta humanoides. Esto reduce costes y tiempos en integración, y abre la puerta a flotas mixtas donde cada equipo aporta su especialidad y, Comparte habilidades comunes mediante Gemini Robotics 1.5.

Qué mejora frente a los modelos presentados en marzo

Las versiones anteriores cumplían instrucciones individuales de forma general. Eran útiles, pero se quedaban cortas cuando surgían cadenas de decisiones o dependencias entre pasos. Ahora, la combinación de Gemini Robotics 1.5 y Gemini Robotics-ER 1.5 aporta comprensión y resolución de problemas para tareas físicas que cambian sobre la marcha.

Esto se nota cuando la tarea exige secuencias, necesita consultar contexto externo o requiere elegir “qué va antes”. Si la labor es simple y directa, el sistema no complica las cosas y actúa con rapidez.

Uso de internet con Gemini Robotics-ER 1.5: buscar ayuda y convertirla en pasos claros

Cuando falta información, Gemini Robotics-ER 1.5 usa herramientas digitales, incluida Google Search, para encontrar datos relevantes: normativas locales, guías de uso o condiciones del entorno. Luego sintetiza lo hallado en instrucciones en lenguaje natural listas para ejecutar.

Piensa en un robot que debe separar residuos en diferentes ciudades. Las reglas cambian por barrio y por tipo de contenedor. Con esta capa de razonamiento, vas a poder adaptar el comportamiento en segundos sin reprogramar. Si la conexión falla, el robot mantiene capacidades básicas gracias a Gemini Robotics 1.5.

Disponibilidad y cómo acceder: Gemini Robotics-ER 1.5 en la API de Gemini y acceso a socios

Si quieres probarlo, hay una diferencia clara de acceso. Gemini Robotics-ER 1.5 está disponible para desarrolladores a través de la Gemini API en Google AI Studio. Por su parte, Gemini Robotics 1.5 está limitado a ciertos socios seleccionados.

Puedes prototipar la parte de razonamiento y búsqueda con la API, simular tareas y preparar tu integración. Cuando tengas acceso al modelo ejecutor, vas a poder conectar ambos bloques sin rehacer el trabajo.

Pasos básicos para empezar como desarrollador en Google AI Studio

  1. Abre Google AI Studio y crea un proyecto con acceso a la Gemini API.
  2. Define la tarea objetivo y los datos que el robot deberá consultar en la web.
  3. Genera prompts que pidan a Gemini Robotics-ER 1.5 instrucciones claras en lenguaje natural.
  4. Valida las instrucciones en un entorno de simulación o con pruebas controladas.
  5. Ajusta el formato de salida para que encaje con el plan de ejecución de Gemini Robotics 1.5 cuando tengas acceso.

Casos de uso donde brilla Gemini Robotics 1.5: hogar, logística y normativas locales

En casa, Gemini Robotics 1.5 organiza prendas, prepara equipaje y planifica tareas repetitivas con criterio. En logística, coordina picking por pasos, agrupa paquetes y verifica condiciones antes de mover carga. Con normativas locales, cruza reglas actuales y adapta la acción al lugar y al momento.

Vas a poder orquestar acciones compuestas sin escribir reglas a mano para cada caso. Conviene supervisar los primeros despliegues para confirmar que la información externa es correcta y que la escena real coincide con lo que el robot “ve”.

En pocas palabras, Gemini Robotics 1.5 lleva a los robots de ejecutar órdenes simples a resolver tareas complejas con planificación, mientras que Gemini Robotics-ER 1.5 aporta razonamiento y consultas a la web para completar la información.

Copyright © gptzone.net

La Newsletter Diaria Sobre Inteligencia Artificial. Además: Portal de Noticias, Tutoriales, Tips y Trucos de ChatGpt, Openai e Inteligencia Artificial.

Nuestra web está alojada en:

hosting raiola

Suscríbete a nuestra Newsletter Diaria sobre IA

 

Suscríbete a GptZone y recibe cada día TOTALMENTE GRATIS:

 

  • 📰 Noticias Exclusivas de Inteligencia Artificial.
  • 🤖 Prompts Creativos y prácticos.
  • 🎥 Videos Inspiradores sobre IA.
  • 🛠️ Apps Recomendadas para revolucionar tu día a día.

Te has suscrito Satisfactoriamente!

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram