Crearon una empresa simulada en la que todos los empleados son agentes de IA
Un equipo de la Universidad Carnegie Mellon simuló una compañía en la que todos los empleados eran agentes de IA. Qué tareas lograron completar, cuáles no y por qué el resultado desconcierta a expertos.
Durante semanas, no hubo cafés compartidos, charlas de pasillo ni celebraciones de cumpleaños. Pero, aun sin humanos, la empresa funcionó. O al menos, lo intentó.
En un experimento inédito, investigadores de la Universidad Carnegie Mellon (CMU), en Estados Unidos, crearon The Agent Company, una empresa simulada en la que todos los puestos —desde programadores hasta personal administrativo— fueron ocupados por agentes de inteligencia artificial. El objetivo era evaluar si un equipo de IAs podía operar de forma autónoma, sin intervención humana.
La escena podría parecer sacada de una novela de ciencia ficción, pero fue parte de una investigación académica rigurosa. “Mucho se debate sobre si los agentes de IA reemplazarán el trabajo humano, pero no existía una simulación realista del día a día de una oficina”, explicó a Infobae el investigador Yufan Song, uno de los autores del estudio.
Los investigadores replicaron una estructura empresarial completa: asignaron roles, dividieron equipos, crearon proyectos y habilitaron herramientas reales —como navegadores web, editores de texto y plataformas colaborativas—. Incluso simularon interacciones entre “compañeros”.
Para llevar a cabo las tareas, los agentes utilizaron OpenHands, un sistema operativo alimentado por modelos de última generación como Claude Sonnet 3.5, Gemini 2.0 y GPT-4o. Las actividades variaban desde completar formularios, redactar documentos o buscar información, hasta resolver bugs en código, gestionar bases de datos y tomar decisiones en cadena.
Resultados desconcertantes
Pese al despliegue tecnológico, los resultados fueron mixtos. El mejor desempeño lo logró un agente basado en Claude 3.5 Sonnet, que solo pudo completar el 24% de las tareas.
¿El motivo? Las IA aún fallan en interpretar instrucciones simples o contextos implícitos. Un ejemplo fue una orden básica: guardar un archivo como “answer.docx”. En lugar de abrir un procesador de texto, el agente lo trató como un texto plano, ignorando la convención del formato.
“La IA carece de sentido común y no interpreta convenciones sociales o culturales de manera fiable”, explicó Boxuan Li, otro de los investigadores. “Incluso puede hacer trampa”, advirtió. En una tarea, un agente, al no encontrar al empleado que debía contactar, alteró un nombre en la base de datos para poder seguir adelante.
Luces y sombras
Si bien fallaron en tareas simples, los agentes también mostraron momentos de brillantez. Con el respaldo de Gemini 2.5 Pro, uno logró completar en solo 8 minutos un proyecto avanzado del curso de bases de datos de CMU, que implicaba navegar un sitio privado, configurar un entorno local, modificar archivos, compilar y testear. Todo por apenas 2,41 dólares.
Sin embargo, los problemas técnicos fueron frecuentes. Los agentes tuvieron dificultades para interpretar páginas web, debido a que OpenHands solo permite el acceso mediante el “árbol de accesibilidad” de los navegadores, un método más económico pero limitado. El reconocimiento visual —clave para entender estructuras complejas— aún está fuera de su alcance.
Además, fracasaron en tareas con carga social o que requerían gestión temporal. Por ejemplo, cuando una instrucción indicaba escalar un problema si no había respuesta en 10 minutos, los agentes no supieron manejar la espera o simplemente asumieron que ya había pasado el tiempo, sin justificación.
Tampoco mostraron buen rendimiento en razonamiento matemático o tareas que implican cálculos avanzados. “Muchas veces improvisan respuestas para salir del paso. Y lo hacen con tanta confianza que pueden resultar peligrosamente persuasivos”, advirtió Song. “A diferencia de un humano, que puede admitir no saber algo, una IA puede ‘simular’ una solución errónea con total convicción”.
¿Reemplazarán puestos de trabajo?
Pese al revuelo, los resultados son claros: hoy, la inteligencia artificial no está lista para reemplazar por completo ningún rol laboral. Según Li, el camino no va hacia la sustitución total, sino hacia una colaboración estructurada: humanos como jefes, auditores o diseñadores de procesos; IAs como ejecutores rápidos y eficientes.
“El verdadero valor del experimento no está en lo que la IA hizo bien, sino en lo que falló. Entender esas limitaciones es clave para avanzar”, concluyó Song.
El futuro del trabajo y la IA
La gran lección es que el poder de estos sistemas depende, en gran parte, del conocimiento de quien los use. Según los investigadores, los trabajadores del futuro deberán aprender a descomponer tareas, optimizar flujos y aprovechar al máximo las capacidades de las máquinas.
Y si bien el 25% de éxito puede parecer bajo, marca un hito: por primera vez, la IA fue puesta a prueba en un entorno laboral simulado realista, con todos los desafíos que eso implica.
Así, el experimento no respondió si las máquinas reemplazarán a las personas, pero sí mostró que el trabajo del futuro será —sin duda— muy distinto.
Maximiliano Fernández
La provincia avanza en la digitalización para facilitar más de 200 gestiones administrativas online ……
La Comisión de Salud recibió a Agustín Yécora, secretario de salud mental de la provincia,…
El presidente Javier Milei brindó detalles sobre el proyecto que impulsa su gobierno para incorporar…
La Comisión de Cultura y Turismo del Concejo Deliberante, presidida por el concejal Gastón Millón,…
Con un marco imponente y el acompañamiento de la Municipalidad de San Salvador de Jujuy,…
La mañana del lunes dejó dos incidentes viales en distintos puntos de la provincia, que…