Entrenar modelos de inteligencia artificial usando videojuegos se ha convertido en una forma cada vez más habitual de comprobar hasta dónde pueden llegar estos sistemas. Recientemente, tanto Google como Anthropic han puesto a sus modelos avanzados de IA a jugar a Pokémon Rojo, el clásico de Game Boy, con resultados que han desconcertado a investigadores y seguidores del sector.
Durante meses, la comunidad ha seguido en directo estos experimentos. Tanto Claude —la IA de Anthropic— como Gemini, de Google, han dejado claro que, por ahora, superar un videojuego diseñado para niños supone un desafío todavía enorme. ¿Qué revelan estos ensayos sobre el verdadero potencial del razonamiento artificial?
El uso de videojuegos clásicos, como Pokémon en Game Boy, para entrenar inteligencia artificial tiene un objetivo muy claro: examinar si las IA pueden resolver problemas complejos e improvisar estrategias, tal como hacen las personas.
Estos juegos mezclan exploración, lógica, combates y la necesidad de recordar información, lo que los convierte en un escenario ideal para poner a prueba modelos avanzados como Claude o Gemini.
Si lo comparamos con la app móvil o la versión en PC de un juego moderno, Pokémon ofrece un entorno cerrado pero abierto a infinidad de soluciones. Aquí, la IA se enfrenta a desafíos que requieren memoria, interpretación de reglas y previsión de consecuencias, todo en un mundo donde perder puede significar empezar desde cero, como le ha ocurrido a Gemini en varias ocasiones.
En marzo, Anthropic propuso un desafío peculiar: su IA, Claude, debía completar Pokémon Rojo sin ayuda humana. Tres meses después, los resultados siguen sorprendiendo. Claude se ha atascado en zonas que cualquier niño suele superar muy pronto en su partida. Esta situación evidencia que, aunque la IA es capaz de analizar datos, su razonamiento se rompe en situaciones límite o cotidianas para los humanos.
También te puede interesar:El Nuevo Google Shopping con Inteligencia Artificial¿Por qué ocurre esto? Cuando Claude llega a un punto difícil, no siempre busca soluciones lógicas: en una ocasión pensó que, si su personaje perdía a propósito, conseguiría teletransportarse a otra zona del juego. Una idea que cualquier jugador humano descarta de inmediato, pero que ilustra la diferencia entre simulación de razonamiento y sentido común real.
Google ha ido un paso más allá con Gemini y su versión mejorada, Gemini 2.5 Pro. No solo intenta superar Pokémon Rojo, sino que su progreso es expuesto en directo a través de Twitch, permitiendo analizar cada decisión —y error— en tiempo real.
Aquí surge un hecho alarmante: Gemini simula “sentir” miedo o pánico cuando uno de sus Pokémon va a perder en combate. ¿Para qué sirve esto? Supuestamente, para replicar reacciones humanas bajo presión, haciendo la partida más realista.
El verdadero problema surge cuando este temor desvirtúa el razonamiento de la inteligencia artificial. Bajo estrés virtual, Gemini olvida herramientas útiles, toma decisiones precipitadas e ignora estrategias que le serían ventajosas. Por ejemplo, cuando un combate se complica, la IA deja de analizar alternativas con calma y cae en una especie de “bucle” de errores, pareciendo incluso menos lúcida que un niño pequeño jugando por primera vez.
El hecho de que Gemini simule emociones negativas muestra el interés por crear máquinas que se acerquen al comportamiento humano. Pero, como demuestran los ensayos en Pokémon, esta simulación no siempre mejora los resultados.
Al contrario, puede arruinar potenciales victorias y entorpecer su avance. Ciertas decisiones “irracionales” bajo presión, lejos de humanizar a la IA, limitan su capacidad de encontrar la mejor salida posible.
También te puede interesar:Gemini Advanced ahora Tiene Memoria y puede recordar tus intereses y preferenciasTanto Gemini como Claude han cometido fallos sorprendentes durante sus partidas. ¿Te ha pasado alguna vez que intentas algo absurdo en un videojuego, solo para ver si cuela? Las IA, por su parte, llegan a situaciones aún más extrañas:
Estos errores lógicos reflejan una realidad: los modelos avanzados de IA todavía carecen de sentido común y flexibilidad para salir de apuros cotidianos. Es aquí donde el jugador humano lleva clara ventaja, resolviendo problemas sencillos mediante prueba-error o simplemente usando experiencia previa.
¿Qué logros han conseguido estas máquinas? Aunque la lista de errores puede parecer larga, Gemini ha superado desafíos complejos en Pokémon. Ha resuelto puzles de mover rocas en Cueva Victoria —una de las zonas más avanzadas y delicadas del juego— y ha diseñado ayudas personalizadas para analizar cómo superar determinados combates.
Esto significa que, en contextos específicos, la inteligencia artificial muestra una capacidad impresionante para abordar retos con creatividad. Crear soluciones propias mientras aprende confirma que, aunque está lejos de igualar a una mente infantil jugando a lo mismo, tiene potencial para avanzar a pasos agigantados.
Otro aspecto clave es el tiempo que cada modelo tarda en avanzar. Mientras un niño puede terminar Pokémon en pocas horas, Claude y Gemini requieren decenas de horas solo para superar áreas sencillas. Exponer sus partidas en Twitch ha permitido analizar cómo se atascan, repiten errores y vuelven a empezar desde cero varias veces. Esto subraya la diferencia entre el progreso humano y la evolución actual de la inteligencia artificial en videojuegos.
El interés por ver IA’s superando capacidades humanas sigue más vivo que nunca. Personajes como Mark Zuckerberg defienden la idea de crear inteligencias artificiales aún más capaces que nosotros, mientras sectores expertos observan con escepticismo, señalando ejemplos como lo ocurrido en Pokémon para frenar el entusiasmo desmedido.
También te puede interesar:Los nuevos modelos de OpenAI podrían costar hasta $2000Cualquier avance en razonamiento artificial provoca debates intensos: ¿cuándo dejará de cometer errores la IA? ¿Podrá algún día superar la creatividad, adaptación y sentido común humanos en experiencias tan cotidianas como un simple juego?
El uso de videojuegos clásicos como campo de pruebas para la inteligencia artificial revela hasta qué punto estos sistemas avanzados todavía tropiezan en escenarios donde cualquiera esperaría soltura y rapidez.
Si te interesa el futuro del razonamiento artificial y su comparación con la capacidad humana, Pokémon Rojo sigue demostrando que las mejores IAs, aunque son capaces de crear estrategias, simulan emociones y aprenden por el camino, todavía están lejos de dominar incluso los desafíos que un niño resolvería casi sin pensar.
Me dedico al SEO y la monetización con proyectos propios desde 2019. Un friki de las nuevas tecnologías desde que tengo uso de razón.
Estoy loco por la Inteligencia Artificial y la automatización.