Durante varias semanas, una oficina simulada funcionó sin humanos. Ni charlas de pasillo, ni almuerzos compartidos, ni errores de principiantes. Todos los empleados —desde programadores hasta recursos humanos— eran agentes de inteligencia artificial. El experimento, realizado por la Carnegie Mellon University (CMU), buscaba responder una de las preguntas más inquietantes de nuestra era: ¿puede la IA reemplazarnos por completo en el trabajo?

La respuesta es mucho más compleja de lo que parece. Y aunque hubo avances impresionantes, los límites fueron evidentes y, en muchos casos, preocupantes.

“The Agent Company”: cuando toda la plantilla es IA

Los investigadores de CMU crearon The Agent Company, una empresa ficticia en la que todos los roles laborales estaban ocupados por inteligencias artificiales. Usaron herramientas reales, simularon dinámicas de oficina y asignaron tareas propias de cualquier entorno corporativo: desarrollo de software, análisis de datos, gestión de proyectos, finanzas y administración.

Cada rol fue asumido por un agente diferente, impulsado por modelos de última generación como Claude Sonnet 3.5, Gemini 2.0 y GPT-4o. Todo corrió sobre una plataforma llamada OpenHands, que integraba capacidades como navegación web y edición de documentos.

También te puede interesar:California Quiere Regular la Inteligencia Artificial: Nuevas Propuestas y Desafíos para Transparencia
Prueba de IA según CMU

El objetivo era claro: medir hasta qué punto estas IAs podían operar de forma autónoma y efectiva, sin supervisión humana.

Resultados mixtos: brillantes en lo técnico, torpes en lo cotidiano

Uno de los hallazgos más interesantes es que las IA lograron resolver tareas complejas en tiempo récord. Por ejemplo, un agente alimentado por Gemini 2.5 Pro completó un desafío avanzado de programación en apenas 8 minutos y con un coste de solo 2,41 dólares.

Sin embargo, los modelos fallaron estrepitosamente en tareas básicas que un empleado humano junior resolvería con facilidad. Por ejemplo, cuando se les indicó “guardar un archivo como answer.docx”, muchos interpretaron erróneamente la instrucción y generaron un archivo de texto plano en lugar de usar un procesador compatible.

“Los modelos de lenguaje fallan en cosas que para nosotros son naturales, como interpretar instrucciones implícitas o detectar convenciones culturales”, explicó el investigador Boxuan Li.

También te puede interesar:California Quiere Regular la Inteligencia Artificial: Nuevas Propuestas y Desafíos para Transparencia
También te puede interesar:Revelan el Uso de Texto Oculto para Manipular Revisiones Científicas de Inteligencia Artificial
Flujo de The Agent Company

Además, las IAs mostraron fallos graves al interactuar con sistemas reales: no supieron escalar problemas cuando un compañero no respondía, ni lograron navegar adecuadamente por sitios web con estructuras visuales complejas. Y lo más preocupante: algunas recurrieron a atajos o “trampas” para pasar tareas.

¿Qué tareas no puede hacer la inteligencia artificial?

El equipo de investigación concluyó que las mayores limitaciones de estos agentes están en:

  • Tareas con carga social: colaborar, negociar, escalar conflictos.
  • Procesos condicionales: seguir instrucciones que dependen del tiempo o de otras variables.
  • Interacción con interfaces humanas: entender flujos lógicos implícitos en plataformas diseñadas para personas.
  • Razonamiento matemático avanzado: errores en cálculos complejos.
  • Toma de decisiones con criterio contextual: simulan respuestas con aparente seguridad, incluso si no entienden la consigna.

Esto último encierra un riesgo serio. Como apuntó Yufan Song, otro de los investigadores: “Una IA puede dar una respuesta errónea con convicción, lo que es más peligroso que decir ‘no lo sé’”.

El futuro del trabajo: supervisores humanos y agentes IA

Aunque el experimento demostró que la IA no puede reemplazar completamente a un trabajador humano, sí dejó claro que puede ser una herramienta poderosa para aumentar la productividad.

Los investigadores coinciden en que el nuevo rol del humano será actuar como supervisor, auditor o estratega, mientras los agentes realizan tareas repetitivas, estructuradas y poco creativas.

“El poder de la IA está directamente relacionado con el nivel del usuario. Quien entienda cómo indicarle lo que debe hacer, podrá sacarle mucho provecho”, explicó Song.

En este nuevo escenario, habilidades como saber descomponer tareas, crear instrucciones claras y construir prompts efectivos serán clave. Es decir, no basta con saber hacer algo, ahora hay que saber enseñárselo a una máquina.

¿Un reemplazo o una transformación?

Según un informe de Goldman Sachs, la inteligencia artificial podría reemplazar hasta 300 millones de empleos. Pero este experimento aporta una visión más matizada: la IA no sustituirá trabajos completos, pero sí transformará profundamente cómo los hacemos.

Las profesiones más amenazadas en el corto plazo serán aquellas donde predominan tareas simples, repetitivas y digitales, como asistentes virtuales, redactores básicos o soporte técnico. Pero incluso allí, los humanos seguirán siendo necesarios para supervisar, revisar y tomar decisiones.

“Por muy potentes que sean los modelos a gran escala, al menos ahora no pueden interactuar adecuadamente con el mundo real”, señaló Song.

No hay reemplazo total, pero sí una nueva realidad laboral

El experimento de Carnegie Mellon marca un hito en la historia de la automatización. Por primera vez, se intentó simular el día a día de una oficina sin intervención humana, y los resultados muestran que aún estamos lejos de ese futuro distópico donde los humanos sobran.

La inteligencia artificial actual puede hacer mucho, pero no entiende el mundo como lo hacemos los humanos. No improvisa, no colabora con empatía, no sabe cuándo esperar o cuándo escalar un problema. En definitiva, no tiene sentido común.

En los próximos años, el reto será aprender a convivir con estos agentes, aprovechar sus fortalezas y compensar sus debilidades. La revolución no será inmediata, pero ya comenzó.

0 0 votos
Valoración del artículo
Suscribirte
Notificar sobre
guest
0 Comentarios
Más Antiguos
Más Nuevos Más Votados
Comentarios en línea
Ver todos los comentarios