¿Te imaginas preguntar a tu móvil sobre cualquier imagen o texto que tienes en pantalla y obtener una respuesta inmediata? Ahora esto es posible gracias a las nuevas mejoras de Google en accesibilidad e inteligencia artificial para Android y Chrome.
Con la integración de Gemini y nuevas funciones específicas, vas a poder hacer preguntas sobre lo que ves en la pantalla, recibir subtítulos más expresivos en tiempo real y manejar documentos PDF de forma mucho más sencilla. Todo pensado para facilitar el día a día de personas con discapacidad visual o necesidades especiales, pero también para cualquiera que busque una navegación cómoda y adaptada.
¿Para qué sirve la integración de Gemini en Android? Hasta ahora, TalkBack permitía recibir descripciones automáticas de imágenes cuando no había texto alternativo, ayudando a personas ciegas o con visión reducida. Pero la novedad es que ahora puedes hacer preguntas a Gemini sobre cualquier imagen o contenido de la pantalla, permitiendo una interacción mucho más activa y personalizada.
Piensa en recibir la foto de una guitarra. Ahora, no te quedas solo con una descripción básica: puedes preguntar “¿de qué color es?”, pedir la marca o consultar detalles del fondo. Gemini genera una respuesta en tiempo real, eliminando dudas y aportando contexto allí donde antes solo había silencio.
Esta función también sirve con tiendas online o aplicaciones: vas a poder preguntar por los materiales de un producto, saber si hay descuentos visibles en la pantalla o aclarar datos que no aparecen escritos. Así, el lector de pantalla de Android se convierte en tu guía a la hora de navegar por apps y sitios web, no solo con descripciones, sino también con respuestas útiles y mucho más naturales.
También te puede interesar:El Nuevo Google Shopping con Inteligencia Artificial¿Cuándo resulta más útil esta nueva aplicación de la inteligencia artificial en Android? A veces, solo una imagen no cuenta toda la historia. Por ejemplo, imagina que tu amigo te manda una foto de un objeto misterioso. Tú puedes preguntarle a Gemini y recibir una respuesta detallada que te saca de dudas.
Ocurre lo mismo en webs de compras y aplicaciones: si ves un artículo, vas a poder preguntar por el precio, por el material de fabricación o solicitar si hay alguna oferta visible. Incluso si un gráfico o una tabla carece de información textual, Gemini analiza y traduce los elementos visuales, rompiendo las barreras para personas con discapacidad visual o quienes necesitan una interacción guiada.
¿Qué novedades aporta la actualización de Expressive Captions en Android? A menudo, los subtítulos convencionales solo transcriben las palabras, pero no captan emociones ni matices. Con la nueva función de duración en Expressive Captions, ahora los subtítulos reflejan cuándo una persona estira una palabra, diferenciando por ejemplo entre “no” y “nooooo”.
Esta diferencia marca mucho en la interpretación, especialmente si dependes de los subtítulos para seguir un vídeo o conversación.
Además, han añadido etiquetas para sonidos no verbales, como silbidos o carraspeos. Así, si alguien hace una pausa con un silbido durante un directo, el sistema lo identifica y lo refleja al instante. Por ahora, estas mejoras están llegando primero a dispositivos con Android 15 o superior y solo en inglés, concretamente en Estados Unidos, Reino Unido, Canadá o Australia.
Así vas a poder captar no solo la información, también el tono y la intención de cada frase, consiguiendo una experiencia mucho más humana y adaptada a las necesidades de quienes requieren subtítulos.
También te puede interesar:Gemini Advanced ahora Tiene Memoria y puede recordar tus intereses y preferencias¿Te ha ocurrido que abres un PDF donde el texto solo aparece como imagen y no es posible copiar ni buscar palabras? Con la última actualización, Chrome integra Reconocimiento Óptico de Caracteres (OCR) en su versión de escritorio. Esto significa que el navegador detecta automáticamente si el PDF es un simple escaneo e identifica todos los fragmentos de texto que contiene.
A partir de ahora, vas a poder resaltar, copiar y buscar términos específicos dentro del PDF, incluso si originalmente era solo una imagen. Además, los lectores de pantalla podrán leer estos documentos sin obstáculos, dando acceso a personas con dificultades visuales a más tipos de contenido.
Todos estos avances hacen que trabajar, estudiar o consultar documentos sea más directo, ya que convierte lo estático en interactivo y adaptable según las necesidades de cada uno.
¿Quieres ver mejor el contenido de una página web sin que todo se desordene? Ahora Chrome para Android incluye la función Page Zoom, que te permite aumentar el tamaño del texto sin alterar el formato general del sitio. Así, puedes leer con más comodidad sin que las imágenes ni los menús se desplacen o solapen como ocurría antes.
Customiza el nivel de zoom a tu medida y elige si se aplica en todas las páginas que visites, solo en tu web favorita o cuando lo necesites puntualmente. Basta con abrir el menú de tres puntos en la esquina superior derecha de Chrome y ajustar el parámetro a tu gusto. Este ajuste te ayuda a adaptar cualquier web a tu capacidad visual o preferencias personales, sin sacrificar funcionalidad.
Esta función amplía la accesibilidad para usuarios que necesitan ver el contenido más grande, pero detestan perder la vista original o legibilidad de las páginas web.
También te puede interesar:Google AI Studio ahora disponible como PWACon todas estas novedades de inteligencia artificial y accesibilidad en Android y Chrome, vas a poder navegar, consultar imágenes, leer PDF o seguir subtítulos en tiempo real con una comodidad y precisión nunca vista. Google apuesta fuerte por acercar la tecnología a todos, integrando IA y accesibilidad en el núcleo de sus productos, para que nadie se quede fuera de la vida digital.
Si buscas una experiencia adaptada y sin barreras, estas herramientas mejoran el acceso y la comprensión para todos los usuarios, con especial atención a las personas con discapacidad visual o necesidades especiales. ¿Ya has probado alguna? La revolución de la accesibilidad con IA está aquí.
Me dedico al SEO y la monetización con proyectos propios desde 2019. Un friki de las nuevas tecnologías desde que tengo uso de razón.
Estoy loco por la Inteligencia Artificial y la automatización.