Inicio Herramientas y Apps IA Google Prepara en Gemini un Asistente para macOS que Entiende lo que...

Herramientas y Apps IA

Google Prepara en Gemini un Asistente para macOS que Entiende lo que Ves y Dices

Por

27/06/2026

¿Cuántas veces una tarea simple en la computadora termina en una pequeña coreografía de clics, atajos y ventanas abiertas? Google quiere cambiar ese mecanismo en macOS con Gemini Desktop, una apuesta para que hablar y señalar alcance donde hoy todavía mandan el teclado y el mouse.

El hallazgo surgió en versiones de prueba de la app y revela dos piezas clave: “Speak to Window” y “Magic Pointer”. Ambas funciones siguen en desarrollo, pero muestran con bastante claridad hacia dónde apunta Google: un asistente central que entienda lo que el usuario dice y también lo que tiene delante.

Google busca un asistente central que entienda lo que el usuario dice y también lo que tiene delante.

La primera herramienta se activa al mantener presionada la tecla FN. Desde ahí, Gemini podría redactar correos, resumir textos, revisar documentos, generar contenido o crear imágenes sin que la persona tenga que escribir cada instrucción a mano.

La clave no es solo la voz. El sistema interpretaría el contexto de la ventana activa, es decir, la aplicación o documento que está abierto en ese momento, para responder con más precisión.

También te puede interesar:La Gente está Usando el Editor de Fotos de Gemini para Eliminar Marcas de Agua

Ahí aparece el verdadero interruptor de esta idea. En lugar de funcionar como un asistente que espera órdenes sueltas, Gemini empieza a parecerse a un copiloto que ya mira el tablero del auto antes de contestar.

La segunda función, “Magic Pointer”, profundiza ese cableado. Permite que la IA siga el movimiento del cursor en tiempo real, de modo que pueda identificar exactamente qué parte de la pantalla está observando el usuario.

Un asistente que ve la misma “mesa” que el usuario

Así, si una persona apunta a un párrafo de una web, a una imagen o a una celda de un documento, Gemini podría resumir ese fragmento, explicarlo, modificar contenido o generar nuevo material relacionado. Y todo sin cambiar de ventana, un detalle práctico que reduce fricción en tareas cotidianas.

Además, esta función ataca una limitación vieja de los asistentes digitales: entender a qué se refiere alguien cuando dice “esto”, “aquello” o “esa parte”. Con “Magic Pointer”, el señalamiento deja de ser ambiguo y se convierte en un dato concreto.

También te puede interesar:La Gente está Usando el Editor de Fotos de Gemini para Eliminar Marcas de Agua

También te puede interesar:Google lanza las funciones de vídeo en tiempo real de Gemini

Un asistente que ve la misma “mesa” que el usuario

En términos técnicos, Google busca una interacción basada en contexto visual en tiempo real, es decir, la capacidad de leer lo que ocurre en pantalla mientras el usuario trabaja. No es un detalle menor. Es el engranaje que podría volver más natural la relación con la computadora.

Por ahora no hay fecha oficial de lanzamiento. Las herramientas fueron detectadas en compilaciones preliminares, por lo que podrían cambiar antes de llegar al público o incluso no lanzarse con esta forma final.

También apareció una posible tercera función vinculada con generación de imágenes y video, y quizás con la conexión entre varias computadoras Mac con Gemini instalado. Algunas hipótesis hablan de control remoto asistido por IA, aunque ese punto todavía no está confirmado.

Mientras tanto, el movimiento encaja con una tendencia más amplia. Google, Microsoft y Apple trabajan en asistentes que no solo escuchan, sino que también interpretan acciones en pantalla y reaccionan sobre ellas.

La oportunidad práctica del nuevo escritorio

Para el usuario sería menos tiempo describiendo lo que ve y más respuestas inmediatas

Para el usuario común, la oportunidad es concreta: menos tiempo describiendo lo que ve y más respuestas inmediatas. Si este mecanismo funciona como promete, pedir “resumí esto”, “corregí este mail” o “explicame esta imagen” podría ser tan directo como apuntar y hablar.

No reemplazaría de un día para otro al teclado ni al mouse. Pero sí podría mover el interruptor de muchas tareas repetitivas hacia una interacción más simple, como si la computadora por fin dejara de pedir instrucciones a ciegas y empezara a mirar la misma mesa de trabajo que su dueño.

Sofía Sicilia

Directora de operaciones en GptZone. IT, especializada en inteligencia artificial. Me apasiona el desarrollo de soluciones tecnológicas y disfruto compartiendo mi conocimiento a través de contenido educativo. Desde GptZone, mi enfoque está en ayudar a empresas y profesionales a integrar la IA en sus procesos de forma accesible y práctica, siempre buscando simplificar lo complejo para que cualquiera pueda aprovechar el potencial de la tecnología.

0 0 votos

Valoración del artículo

0 Comentarios

Más Antiguos

Más Nuevos Más Votados

Google Prepara en Gemini un Asistente para macOS que Entiende lo que Ves y Dices

Un asistente que ve la misma “mesa” que el usuario

La oportunidad práctica del nuevo escritorio

OTRAS NOTICIAS

OpenAI Presenta Jalapeño, su Primer Chip de IA para Inferencia con Broadcom

Estudios de Hollywood Rechazan Producir ‘Artificial’, la Película de Sam Altman Protagonizada por Andrew...

Europa Ahora Tiene a ‘eustella’, el Chatbot de IA que Compite con ChatGPT y...

El 61% de Españoles Usa IA para Apoyo Emocional Según EAE y Planeta

TE INTERESA

EEUU Reactiva Claude Mythos 5 Bajo Control Gubernamental y Acceso Limitado

Incluso más noticias

EEUU Reactiva Claude Mythos 5 Bajo Control Gubernamental y Acceso Limitado

Un Programador Pone a 16.000 Personas a Fingir ser un Chat...

Microsoft Lanza MAI-Code-1-Flash en GitHub Copilot para Generación Rápida de Código

CATEGORÍA POPULAR

DOMINA LA IA EN 3 MINUTOS AL DÍA (GRATIS)

Suscríbete a nuestra Newsletter Diaria sobre IA:

You have Successfully Subscribed!

Patronus AI Capta 50 Millones de Dólares para Probar Agentes de...

Cómo Evitar que se Agoten los Límites de Claude Code con...

Expertos Señalan que Despierta Curiosidad en Millones de Usuarios el Cambio...