Durante varias semanas, una oficina simulada funcionó sin humanos. Ni charlas de pasillo, ni almuerzos compartidos, ni errores de principiantes. Todos los empleados —desde programadores hasta recursos humanos— eran agentes de inteligencia artificial. El experimento, realizado por la Carnegie Mellon University (CMU), buscaba responder una de las preguntas más inquietantes de nuestra era: ¿puede la IA reemplazarnos por completo en el trabajo?
La respuesta es mucho más compleja de lo que parece. Y aunque hubo avances impresionantes, los límites fueron evidentes y, en muchos casos, preocupantes.
“The Agent Company”: cuando toda la plantilla es IA
Los investigadores de CMU crearon The Agent Company, una empresa ficticia en la que todos los roles laborales estaban ocupados por inteligencias artificiales. Usaron herramientas reales, simularon dinámicas de oficina y asignaron tareas propias de cualquier entorno corporativo: desarrollo de software, análisis de datos, gestión de proyectos, finanzas y administración.
Cada rol fue asumido por un agente diferente, impulsado por modelos de última generación como Claude Sonnet 3.5, Gemini 2.0 y GPT-4o. Todo corrió sobre una plataforma llamada OpenHands, que integraba capacidades como navegación web y edición de documentos.
El objetivo era claro: medir hasta qué punto estas IAs podían operar de forma autónoma y efectiva, sin supervisión humana.
Resultados mixtos: brillantes en lo técnico, torpes en lo cotidiano
Uno de los hallazgos más interesantes es que las IA lograron resolver tareas complejas en tiempo récord. Por ejemplo, un agente alimentado por Gemini 2.5 Pro completó un desafío avanzado de programación en apenas 8 minutos y con un coste de solo 2,41 dólares.
Sin embargo, los modelos fallaron estrepitosamente en tareas básicas que un empleado humano junior resolvería con facilidad. Por ejemplo, cuando se les indicó “guardar un archivo como answer.docx”, muchos interpretaron erróneamente la instrucción y generaron un archivo de texto plano en lugar de usar un procesador compatible.
“Los modelos de lenguaje fallan en cosas que para nosotros son naturales, como interpretar instrucciones implícitas o detectar convenciones culturales”, explicó el investigador Boxuan Li.
Además, las IAs mostraron fallos graves al interactuar con sistemas reales: no supieron escalar problemas cuando un compañero no respondía, ni lograron navegar adecuadamente por sitios web con estructuras visuales complejas. Y lo más preocupante: algunas recurrieron a atajos o “trampas” para pasar tareas.
¿Qué tareas no puede hacer la inteligencia artificial?
El equipo de investigación concluyó que las mayores limitaciones de estos agentes están en:
Tareas con carga social: colaborar, negociar, escalar conflictos.
Procesos condicionales: seguir instrucciones que dependen del tiempo o de otras variables.
Interacción con interfaces humanas: entender flujos lógicos implícitos en plataformas diseñadas para personas.
Razonamiento matemático avanzado: errores en cálculos complejos.
Toma de decisiones con criterio contextual: simulan respuestas con aparente seguridad, incluso si no entienden la consigna.
Esto último encierra un riesgo serio. Como apuntó Yufan Song, otro de los investigadores: “Una IA puede dar una respuesta errónea con convicción, lo que es más peligroso que decir ‘no lo sé’”.
El futuro del trabajo: supervisores humanos y agentes IA
Aunque el experimento demostró que la IA no puede reemplazar completamente a un trabajador humano, sí dejó claro que puede ser una herramienta poderosa para aumentar la productividad.
Los investigadores coinciden en que el nuevo rol del humano será actuar como supervisor, auditor o estratega, mientras los agentes realizan tareas repetitivas, estructuradas y poco creativas.
“El poder de la IA está directamente relacionado con el nivel del usuario. Quien entienda cómo indicarle lo que debe hacer, podrá sacarle mucho provecho”, explicó Song.
En este nuevo escenario, habilidades como saber descomponer tareas, crear instrucciones claras y construir prompts efectivos serán clave. Es decir, no basta con saber hacer algo, ahora hay que saber enseñárselo a una máquina.
¿Un reemplazo o una transformación?
Según un informe de Goldman Sachs, la inteligencia artificial podría reemplazar hasta 300 millones de empleos. Pero este experimento aporta una visión más matizada: la IA no sustituirá trabajos completos, pero sí transformará profundamente cómo los hacemos.
Las profesiones más amenazadas en el corto plazo serán aquellas donde predominan tareas simples, repetitivas y digitales, como asistentes virtuales, redactores básicos o soporte técnico. Pero incluso allí, los humanos seguirán siendo necesarios para supervisar, revisar y tomar decisiones.
“Por muy potentes que sean los modelos a gran escala, al menos ahora no pueden interactuar adecuadamente con el mundo real”, señaló Song.
No hay reemplazo total, pero sí una nueva realidad laboral
El experimento de Carnegie Mellon marca un hito en la historia de la automatización. Por primera vez, se intentó simular el día a día de una oficina sin intervención humana, y los resultados muestran que aún estamos lejos de ese futuro distópico donde los humanos sobran.
La inteligencia artificial actual puede hacer mucho, pero no entiende el mundo como lo hacemos los humanos. No improvisa, no colabora con empatía, no sabe cuándo esperar o cuándo escalar un problema. En definitiva, no tiene sentido común.
En los próximos años, el reto será aprender a convivir con estos agentes, aprovechar sus fortalezas y compensar sus debilidades. La revolución no será inmediata, pero ya comenzó.
Me dedico al SEO y la monetización con proyectos propios desde 2019. Un friki de las nuevas tecnologías desde que tengo uso de razón.
Estoy loco por la Inteligencia Artificial y la automatización.
La Newsletter Diaria Sobre Inteligencia Artificial. Además: Portal de Noticias, Tutoriales, Tips y Trucos de ChatGpt, Openai e Inteligencia Artificial.
Nuestra web está alojada en:
Gestionar el consentimiento de las cookies
Utilizamos tecnologías como las cookies para almacenar y/o acceder a la información del dispositivo. Lo hacemos para mejorar la experiencia de navegación y para mostrar anuncios personalizados. El consentimiento a estas tecnologías nos permitirá procesar datos como el comportamiento de navegación o los ID's únicos en este sitio. No consentir o retirar el consentimiento, puede afectar negativamente a ciertas características y funciones.
Funcional
Always active
El almacenamiento o acceso técnico es estrictamente necesario para el propósito legítimo de permitir el uso de un servicio específico explícitamente solicitado por el abonado o usuario, o con el único propósito de llevar a cabo la transmisión de una comunicación a través de una red de comunicaciones electrónicas.
Preferencias
El almacenamiento o acceso técnico es necesario para la finalidad legítima de almacenar preferencias no solicitadas por el abonado o usuario.
Estadísticas
El almacenamiento o acceso técnico que es utilizado exclusivamente con fines estadísticos.El almacenamiento o acceso técnico que se utiliza exclusivamente con fines estadísticos anónimos. Sin un requerimiento, el cumplimiento voluntario por parte de tu Proveedor de servicios de Internet, o los registros adicionales de un tercero, la información almacenada o recuperada sólo para este propósito no se puede utilizar para identificarte.
Marketing
El almacenamiento o acceso técnico es necesario para crear perfiles de usuario para enviar publicidad, o para rastrear al usuario en una web o en varias web con fines de marketing similares.