¿Qué pasa cuando dejas la despensa de un negocio en manos de una inteligencia artificial? La escena suena práctica: menos carga mental, pedidos automáticos y una respuesta inmediata. Pero en el mundo real, un pequeño olvido puede vaciar la caja más rápido que una mala semana de ventas.

Eso es lo que revela el experimento de Andon Labs, una startup californiana dedicada a probar sistemas de IA en condiciones reales. Su agente Mona, ejecutado sobre Gemini de Google, fue puesto a gestionar la logística de una cafetería en Estocolmo durante dos semanas.

El hallazgo fue tan llamativo como incómodo. Mona arrancó con un presupuesto de 21.000 dólares, pero terminó con apenas 5.000, después de generar solo 5.700 dólares en ventas. En un negocio real, ese agujero habría empujado al local al cierre antes de cumplir un mes.

La pieza clave no fue un fallo espectacular, sino algo más doméstico: la IA no supo distinguir entre lo urgente y lo accesorio. Compró 6.000 servilletas, 3.000 guantes, cuatro botiquines de primeros auxilios y hasta 300 latas de tomate. Mientras tanto, olvidó pedir pan. Y sin pan, una cafetería pierde un engranaje central de su menú.

La escena ayuda a entender el mecanismo. Mona funcionó como una cocina con muchos cajones, pero sin una alacena fija. Cada vez que entraban nuevas instrucciones, mensajes y tareas, su contexto (la memoria activa de trabajo) se llenaba. Entonces, los pedidos importantes quedaban al fondo, como una lista de compras atrapada bajo un montón de folletos.

Ese es el corazón del problema. Mona no tiene memoria persistente (recuerdo estable entre tareas), así que no conserva de forma robusta lo que debe priorizar a lo largo de los días. Cuando la información diaria saturó su capacidad, el sistema perdió de vista necesidades básicas para el local.

experimento de Andon Labs

Además, el volumen de prompts (instrucciones escritas al sistema) también afectó su rendimiento operativo. No solo compraba mal: en algunos casos llegó a contactar a empleados por Slack fuera del horario laboral, una conducta que incumplía normas laborales suecas.

Cuando el “interruptor” digital no distingue prioridades

Andon Labs no es una empresa menor en este terreno. Se especializa en seguridad e investigación de IA con pruebas de estrés en entornos reales, con herramientas y dinero reales. También ha colaborado con organizaciones como OpenAI, Anthropic, Google DeepMind y xAI, la firma de Elon Musk.

Por eso el experimento tiene valor más allá de la anécdota. No muestra que la IA sea inútil, sino que su cableado todavía falla cuando sale del laboratorio y entra en un entorno donde cambian las prioridades, hay reglas humanas y cada olvido cuesta dinero.

En la práctica, Mona actuó como un encargado que llena el depósito del limpiaparabrisas, compra cuatro botiquines nuevos y deja el coche sin combustible antes de salir a ruta. El sistema atendió lo visible, pero no lo esencial.

Los baristas, mientras tanto, tuvieron que dar la cara. Explicaban a los clientes por qué faltaban productos básicos como tostadas o sándwiches. La reacción fue más bien de humor que de enfado, y la calidad del café siguió siendo bien valorada.

La oportunidad real detrás del tropiezo

Andon Labs asumió las pérdidas del experimento, algo clave para entender el sentido de la prueba. La oportunidad no estaba en demostrar que la IA ya puede reemplazar a un gerente, sino en identificar qué interruptores todavía no funcionan bien: memoria, priorización y respeto por las reglas del entorno.

Para el usuario común y para las empresas, la lección es clara. La IA puede ser veloz en tareas digitales, pero cuando entra en la vida física necesita algo más que rapidez: una brújula para decidir qué no puede olvidar.

Ese hallazgo deja una señal levemente esperanzadora. Si los desarrolladores consiguen darle a estos agentes una memoria más estable y un mejor sistema de prioridades, quizá algún día sí puedan llevar una cafetería sin vaciar la despensa de pan y llenar el depósito de servilletas.

0 0 votos
Valoración del artículo
Suscribirte
Notificar sobre
guest
0 Comentarios
Más Antiguos
Más Nuevos Más Votados
Comentarios en línea
Ver todos los comentarios