Inicio Curiosidades IA 2025 Prometía la era AGI, Pero la realidad de la IA Apenas...

Curiosidades IA

2025 Prometía la era AGI, Pero la realidad de la IA Apenas Alcanza un 2,5% del Potencial Humano

Por

10/11/2025

124

En 2025 se prometía el gran salto: los agentes de inteligencia artificial iban a gestionar proyectos enteros sin supervisión. Microsoft hablaba de trabajadores IA y muchas hojas de ruta señalaban este año como el despegue. A la par, un estudio independiente ha puesto un número a esa promesa y, si tienes expectativas altas, te interesa verlo con calma.

Empresas Apuestan por IAs Entrevistadoras y Descubren Beneficio que Cambia la Percepción de Todos

El equipo de Scale AI probó en 2025 a los principales modelos con encargos freelance reales, no con ejercicios de laboratorio. Cuarenta jueces actuaron como clientes y evaluaron entregas en diseño de producto, desarrollo de videojuegos, análisis de datos y redacción científica. Así midieron si esos agentes de inteligencia artificial podían planificar, coordinar recursos y entregar como un profesional.

El resultado sorprende por lo claro. El modelo con mejor rendimiento, Manus, solo consiguió que el 2,5% de sus trabajos fuesen aceptados por los “clientes”. Grok rondó el 2,1%, Claude quedó en cifras similares, GPT-5 llegó al 1,7% y Gemini 2.5 Pro apenas al 0,8%. Dicho de forma llana: menos de tres de cada cien encargos serían aprobados por un cliente real.

Esto importa porque ilustra la brecha entre brillar en benchmarks y responder a un briefing con expectativas cambiantes. Los agentes de inteligencia artificial han mejorado en velocidad y coherencia, pero todavía no muestran el criterio práctico que requiere una entrega profesional. Tú puedes pedirles una planificación, y la dan, pero cuando el contexto se mueve, se pierden con matices y prioridades.

Con todo, el 2,5% no es trivial. Es un salto real respecto a años previos y confirma la rapidez del sector. Aun así, la autonomía prometida no aparece: estos sistemas siguen necesitando tu revisión para ajustar el tono, interpretar limitaciones de tiempo y coste, y negociar expectativas. Ahí está el agujero entre “agente autónomo” y “asistente potente”.

Resultados reales de agentes de inteligencia artificial en 2025

La metodología fue directa y útil para ti como lector: encargos reales evaluados por 40 jueces simulando a clientes, con entregables que debían ser “publicables” o “entregables” tal cual.

Ese marco expone una trampa común. Los agentes de inteligencia artificial pasan tests estandarizados, pero cuando toca lidiar con requisitos ambiguos, dependencias y cambios de alcance, su tasa de acierto cae de golpe.

el boom de los agentes de IA podría estar inflado por el hype

Voces del sector piden prudencia desde hace meses. Andrej Karpathy, cofundador de OpenAI, insiste en rebajar el hype: “Los agentes aún no están ahí; falta criterio y autonomía.” La narrativa de los trabajadores IA prendió fuerte en 2025. El estudio devuelve el foco a lo que tú ves en el día a día: buenas ideas iniciales, pero mucha corrección humana después.

¿Dónde se atascan? No priorizan bien, no contextualizan con suficiente profundidad y no leen expectativas personales o subjetivas. Si les pides coordinar un rediseño con plazos y dependencias cruzadas, vas a poder obtener listas ordenadas y avances parciales, pero fallan al resolver ambigüedades, al negociar renuncias y al sostener el hilo del proyecto cuando cambia el rumbo.

El siguiente hito razonable apunta a la segunda mitad de 2026, con nuevos modelos y mejores herramientas de orquestación. El propio estudio sugiere que la ruta pasa por combinar agentes de inteligencia artificial con supervisión humana ligera. Si los briefings mejoran y las evaluaciones usan criterios de cliente ciego, vas a poder medir avances de forma más justa y repetible.

La foto de hoy es nítida: la mejor IA solo logra un 2,5% de aceptación en encargos reales, y eso deja claro que 2025 no será todavía el año en que los agentes sustituyan personas en proyectos complejos. El progreso es constante. Si trabajas con estos sistemas, piensa en ellos como copilotos que aceleran borradores, pruebas y documentación, y mantén el criterio final tú mismo.

Sofía Sicilia

Directora de operaciones en GptZone. IT, especializada en inteligencia artificial. Me apasiona el desarrollo de soluciones tecnológicas y disfruto compartiendo mi conocimiento a través de contenido educativo. Desde GptZone, mi enfoque está en ayudar a empresas y profesionales a integrar la IA en sus procesos de forma accesible y práctica, siempre buscando simplificar lo complejo para que cualquiera pueda aprovechar el potencial de la tecnología.