Google está preparando una nueva capacidad para Gemini llamada Auto Browse. El hallazgo aparece en la sección de herramientas, con un ícono de cursor, aunque todavía no está disponible públicamente. Por su ubicación y diseño, todo indica que apunta a que el asistente navegue la web de forma autónoma dentro de Chrome.
Además, el código incluye comprobaciones para detectar si Gemini se ejecuta dentro de una extensión (un “agregado” del navegador). Esa pieza clave sugiere una integración en la barra lateral: Gemini quedaría a un costado y, sin salir del chat, podría interactuar con pestañas y sitios en nombre del usuario.
Este mecanismo se alinea con la tendencia de “agentes” de navegación, marcada por productos como Perplexity Comet y OpenAI Atlas. La idea central es delegar tareas complejas: buscar, abrir, comparar y sintetizar, sin que la persona haga cada clic.
Y, sobre todo, empuja a Gemini más allá del rol de “contestar preguntas”.
En este caso, la IA no solo sugiere qué leer. Ejecuta la secuencia. Abre páginas, cambia de pestaña, vuelve atrás, y arma un recorrido. Eso es un agente (software que actúa por objetivos): un engranaje que convierte una intención humana en pasos concretos dentro de la web.
Ahora bien, para que ese engranaje funcione, necesita un lugar desde donde “tocar” el navegador. Ahí entra la pista de la extensión de Chrome. Si Gemini está embebido en esa barra lateral, Auto Browse tendría acceso directo al entorno donde pasan las cosas: los botones, los campos de texto y los menús que hoy controla la mano.
Auto Browse se habría añadido recientemente al conjunto interno de herramientas de Gemini. Ese detalle sugiere un desarrollo acelerado después de la primera oleada de funciones agénticas (capacidades para actuar, no solo responder) que Chrome lanzó en septiembre, aunque con acceso limitado a un grupo pequeño en Estados Unidos.

El calendario y el despliegue gradual son una señal clásica de “prueba y ajuste”. Si un agente puede interactuar con la web, también puede equivocarse: abrir el sitio incorrecto, interpretar mal una instrucción o tocar donde no debe. Google parece estar afinando ese interruptor antes de ampliarlo.
Para los usuarios, la aplicación práctica es directa: gestionar sesiones de navegación, investigar temas o ejecutar flujos de trabajo dentro de Chrome, orquestados por Gemini. En la rutina, podría significar “buscame tres opciones, compará precios, reuní requisitos y dejame un resumen con fuentes”.
Las referencias en el código también indican que Auto Browse podría ser exclusiva de Gemini Ultra (plan premium). Esa central de control tendría sentido, sobre todo, para profesionales y usuarios avanzados que viven de investigar: analistas, periodistas, abogados, equipos de compras o marketing.
En el fondo, el cambio es cultural: la web dejaría de ser solo un mapa para explorar y empezaría a parecerse a una lista de mandados que alguien puede ejecutar por vos. Si el mecanismo se afina, el navegador se convierte en un taller y la IA en la mano que mueve herramientas.
La oportunidad, entonces, no es tener más pestañas abiertas, sino un tablero más ordenado donde cada interruptor haga lo que promete.

Directora de operaciones en GptZone. IT, especializada en inteligencia artificial. Me apasiona el desarrollo de soluciones tecnológicas y disfruto compartiendo mi conocimiento a través de contenido educativo. Desde GptZone, mi enfoque está en ayudar a empresas y profesionales a integrar la IA en sus procesos de forma accesible y práctica, siempre buscando simplificar lo complejo para que cualquiera pueda aprovechar el potencial de la tecnología.