Google acaba de colar en Gemini un nuevo botón llamado “Responder ahora” que, siendo sinceros, te va a ahorrar más de un suspiro cuando trabajas con modelos potentes. La idea es recortar la espera sin renunciar al modelo avanzado que ya has seleccionado. Es una mejora pequeña en apariencia, pero muy significativa cuando usas Gemini de forma intensiva.
Este botón aparece mientras Gemini está “pensando” al utilizar Gemini 3 Pro o el modo de Razonamiento (Gemini 3 Flash en su variante orientada a reasoning). Más allá de su mera existencia, lo interesante es cómo funciona y qué revela sobre la estrategia de Google con la IA de cara a 2026.
Cuando utilizas modelos avanzados, lo normal es que la respuesta tarde más. En ese contexto, al lanzar una consulta con Pro o con Razonamiento, Gemini inicia su proceso y muestra el texto “Responder ahora” como una opción pulsable.
No es un botón vistoso ni llamativo: no hay marcos, iconos grandes ni efectos visuales. Es tan discreto que casi parece que Google no quiere que lo pulses demasiado. Aun así, basta tocarlo para forzar a Gemini a responder con lo que tenga en ese momento.

Esto no va de hacer trampas ni de sacrificar calidad de forma artificial. La clave es que no cambia al modo rápido, sino que genera la respuesta usando exactamente el modelo que tienes activo. No hay cambiazo ni motor alternativo: simplemente se corta antes el proceso.
Esta función no aparece por casualidad. El propio botón se menciona en el menú de tres puntos al final de la respuesta, como una pista de interfaz para quien no lo detecte a la primera.
También te puede interesar:El Nuevo Google Shopping con Inteligencia ArtificialAdemás, hay un cambio claro de enfoque. Según han señalado medios como 9to5Google, Google ya había adelantado que “Responder ahora” sustituye al antiguo botón de “saltar”. El mensaje implícito cambia: pasamos de “me salto parte del proceso” a “responde ya con este mismo modelo”, una formulación más transparente sobre lo que ocurre internamente.
Lo más llamativo es cómo se ha desplegado esta mejora. No llega acompañada de grandes anuncios ni actualizaciones visibles. El botón ya está disponible en España, tanto en la versión web como en la app.
No necesitas actualizar la aplicación: se activa mediante una actualización desde servidor, el clásico feature flag que aparece de un día para otro. Para que se muestre, basta con hacer una pregunta usando el modelo Pro o el de Razonamiento.
Si utilizas el modelo rápido habitual, no lo verás. Aquí la función solo tiene sentido cuando hay tiempo de cómputo real que recortar.
Para el usuario, la mejora es muy práctica. Muchas consultas no necesitan que la IA se tome su tiempo. Peticiones como “hazme una lista”, “resume esto” o “contesta directo” suelen activarse con procesos largos que nadie pidió.
En esos casos, tú querías una respuesta útil inmediata, no una pieza perfectamente pulida. El botón te permite decidir cuándo parar.
También te puede interesar:Gemini Advanced ahora Tiene Memoria y puede recordar tus intereses y preferencias
Para Google, el beneficio es aún más claro desde el punto de vista técnico. Reducir el tiempo de generación implica menor consumo de recursos, ya que se ejecutan menos operaciones durante la inferencia. A escala de millones de consultas diarias, esto se traduce en un ahorro real en centros de datos.
Aquí entra el elefante en la habitación: el modo de Razonamiento es caro. Está basado en técnicas de Cadena de Pensamiento (Chain-of-Thought), que consumen mucha más computación porque el modelo “trabaja” más antes de responder. Más pasos internos implican más tokens, más tiempo y más uso de hardware, llegando a multiplicar el consumo por diez o más frente al modelo rápido.
Con este botón, Google puede mantenerte en el modo premium sin que cada interacción sea una sangría de GPUs.
La llegada de “Responder ahora” encaja perfectamente con otra decisión reciente. Google ha ampliado el límite de uso del modelo de razonamiento para usuarios de AI Pro, pasando de 100 a 300 prompts diarios.
Si triplicas el uso permitido, necesitas mecanismos para que ese aumento no implique triplicar el coste. “Te dejo usar más” y “te doy un botón para cortar antes cuando no hace falta razonar tanto” son dos piezas del mismo puzle.
Todo apunta a una misma idea: controlar latencia y coste sin quitar atractivo a los modelos avanzados. Ahora el control vuelve parcialmente al usuario. Bien usado, el botón te dará velocidad; mal usado, puede traducirse en respuestas menos refinadas.
Lo interesante es precisamente eso: devuelve decisión al usuario. En IA, a veces lo más premium no es que el modelo sea más inteligente, sino que sea más obediente: que responda cuando tú lo decides, no cuando él considera que ya ha terminado de pensar.
Habrá que ver si la competencia responde con algo igual de simple y efectivo, porque esta —sin hacer ruido— es de esas mejoras que se notan todos los días.
Me dedico al SEO y la monetización con proyectos propios desde 2019. Un friki de las nuevas tecnologías desde que tengo uso de razón.
Estoy loco por la Inteligencia Artificial y la automatización.