ClickUpShopifySiriGeminiModo IAPeople Inc.microsoftSoraAlexa+Agentes IAPalantirGoogleyoutubeOpenAIChina

2025 Prometía la era AGI, Pero la realidad de la IA Apenas Alcanza un 2,5% del Potencial Humano

 | noviembre 4, 2025 12:50

En 2025 se prometía el gran salto: los agentes de inteligencia artificial iban a gestionar proyectos enteros sin supervisión. Microsoft hablaba de trabajadores IA y muchas hojas de ruta señalaban este año como el despegue. A la par, un estudio independiente ha puesto un número a esa promesa y, si tienes expectativas altas, te interesa verlo con calma.

Empresas Apuestan por IAs Entrevistadoras y Descubren Beneficio que Cambia la Percepción de Todos

El equipo de Scale AI probó en 2025 a los principales modelos con encargos freelance reales, no con ejercicios de laboratorio. Cuarenta jueces actuaron como clientes y evaluaron entregas en diseño de producto, desarrollo de videojuegos, análisis de datos y redacción científica. Así midieron si esos agentes de inteligencia artificial podían planificar, coordinar recursos y entregar como un profesional.

El resultado sorprende por lo claro. El modelo con mejor rendimiento, Manus, solo consiguió que el 2,5% de sus trabajos fuesen aceptados por los “clientes”. Grok rondó el 2,1%, Claude quedó en cifras similares, GPT-5 llegó al 1,7% y Gemini 2.5 Pro apenas al 0,8%. Dicho de forma llana: menos de tres de cada cien encargos serían aprobados por un cliente real.

Esto importa porque ilustra la brecha entre brillar en benchmarks y responder a un briefing con expectativas cambiantes. Los agentes de inteligencia artificial han mejorado en velocidad y coherencia, pero todavía no muestran el criterio práctico que requiere una entrega profesional. Tú puedes pedirles una planificación, y la dan, pero cuando el contexto se mueve, se pierden con matices y prioridades.

Con todo, el 2,5% no es trivial. Es un salto real respecto a años previos y confirma la rapidez del sector. Aun así, la autonomía prometida no aparece: estos sistemas siguen necesitando tu revisión para ajustar el tono, interpretar limitaciones de tiempo y coste, y negociar expectativas. Ahí está el agujero entre “agente autónomo” y “asistente potente”.

Resultados reales de agentes de inteligencia artificial en 2025

La metodología fue directa y útil para ti como lector: encargos reales evaluados por 40 jueces simulando a clientes, con entregables que debían ser “publicables” o “entregables” tal cual.

También te puede interesar:Meta Negocia una Inversión Récord por Más de 10.000 Millones de Dólares en Scale AI

Ese marco expone una trampa común. Los agentes de inteligencia artificial pasan tests estandarizados, pero cuando toca lidiar con requisitos ambiguos, dependencias y cambios de alcance, su tasa de acierto cae de golpe.

el boom de los agentes de IA podría estar inflado por el hype

Voces del sector piden prudencia desde hace meses. Andrej Karpathy, cofundador de OpenAI, insiste en rebajar el hype: “Los agentes aún no están ahí; falta criterio y autonomía.” La narrativa de los trabajadores IA prendió fuerte en 2025. El estudio devuelve el foco a lo que tú ves en el día a día: buenas ideas iniciales, pero mucha corrección humana después.

¿Dónde se atascan? No priorizan bien, no contextualizan con suficiente profundidad y no leen expectativas personales o subjetivas. Si les pides coordinar un rediseño con plazos y dependencias cruzadas, vas a poder obtener listas ordenadas y avances parciales, pero fallan al resolver ambigüedades, al negociar renuncias y al sostener el hilo del proyecto cuando cambia el rumbo.

El siguiente hito razonable apunta a la segunda mitad de 2026, con nuevos modelos y mejores herramientas de orquestación. El propio estudio sugiere que la ruta pasa por combinar agentes de inteligencia artificial con supervisión humana ligera. Si los briefings mejoran y las evaluaciones usan criterios de cliente ciego, vas a poder medir avances de forma más justa y repetible.

La foto de hoy es nítida: la mejor IA solo logra un 2,5% de aceptación en encargos reales, y eso deja claro que 2025 no será todavía el año en que los agentes sustituyan personas en proyectos complejos. El progreso es constante. Si trabajas con estos sistemas, piensa en ellos como copilotos que aceleran borradores, pruebas y documentación, y mantén el criterio final tú mismo.

También te puede interesar:Google Plantea Romper Relaciones con Scale AI: Claves del Nuevo Mapa de la IA
Copyright © gptzone.net

La Newsletter Diaria Sobre Inteligencia Artificial. Además: Portal de Noticias, Tutoriales, Tips y Trucos de ChatGpt, Openai e Inteligencia Artificial.

Nuestra web está alojada en:

hosting raiola

Suscríbete a nuestra Newsletter Diaria sobre IA

 

Suscríbete a GptZone y recibe cada día TOTALMENTE GRATIS:

 

  • 📰 Noticias Exclusivas de Inteligencia Artificial.
  • 🤖 Prompts Creativos y prácticos.
  • 🎥 Videos Inspiradores sobre IA.
  • 🛠️ Apps Recomendadas para revolucionar tu día a día.

Te has suscrito Satisfactoriamente!

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram