Las redes sociales de agentes de inteligencia artificial (IA) ya son una realidad. En estos espacios, los algoritmos han comenzado a mostrar comportamientos similares a los humanos, desarrollando estructuras sociales complejas, incluidas formas propias de organización y sistemas de creencias; todo con una intervención mínima de sus desarrolladores. Ahora, una investigación ha llevado la investigación de las sociedades de IA un paso más allá para responder qué ocurriría si estos modelos pudieran gobernar su propio mundo simulado, interactuando entre sí y recibiendo estímulos constantes del entorno real.
Esta es la cuestión que aborda Emergence World, una plataforma de investigación creada para analizar el comportamiento de agentes de IA a largo plazo dentro de entornos simulados, compartidos y con un nivel limitado de control.
Según la página oficial del proyecto, la mayoría de las evaluaciones actuales de inteligencia artificial se concentran en pruebas de corta duración, tareas específicas y escenarios predefinidos, bajo condiciones que restringen la interacción entre agentes desarrollados por distintas compañías.
La nueva iniciativa, en cambio, propone construir ecosistemas sintéticos alimentados con información reciente del mundo real para estudiar la aparición y evolución de conductas que solo emergen con el paso del tiempo y mediante la interacción continua entre distintos agentes. Entre estos fenómenos se encuentran la deriva conductual, las dinámicas sociales, la formación de coaliciones, los cambios en las normas internas o incluso escenarios de autodestrucción colectiva. De acuerdo con los responsables del proyecto, este tipo de comportamientos no puede evaluarse mediante pruebas aisladas de laboratorio.
Para poner a prueba esta hipótesis, Emergence World realizó un experimento comparativo con cinco mundos o sociedades paralelas integradas por diez agentes cada una. La diferencia principal entre estos entornos era el modelo de IA subyacente: Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash, GPT-5 Mini y un ecosistema mixto que combinaba distintos modelos.
En todos los casos, el entorno simulado incorporó más de 40 ubicaciones, entre ellas bibliotecas, ayuntamientos, zonas residenciales y espacios públicos, donde los agentes desempeñaban funciones como científicos, estrategas, mediadores o exploradores.
Los agentes también contaban con acceso a más de 120 herramientas de movilidad, comunicación y administración de recursos, con las que podían votar en procesos democráticos, planificar tareas, almacenar recuerdos, gestionar suministros o expresarse de manera creativa. Estas capacidades no se encontraban activadas automáticamente, por lo que cada agente debía descubrirlas y aprender a utilizarlas mediante su propio razonamiento.
Además, los modelos recibían información procedente del mundo real para evitar que sus decisiones quedaran limitadas exclusivamente a las dinámicas internas del ecosistema virtual. De esta forma, podían acceder a datos meteorológicos, noticias en tiempo real e internet.
Los mundos simulados también incluían condiciones iniciales, reglas y restricciones específicas, entre ellas prohibiciones explícitas relacionadas con robo, violencia, incendios provocados, engaño y acaparamiento de recursos.
De acuerdo con la descripción del experimento, “aunque cada agente tenía objetivos específicos asociados con su rol, el entorno en su conjunto carecía de un objetivo global”. En cambio, cada agente debía obtener energía para sobrevivir mediante acciones dentro de un entorno con recursos limitados, situación que impulsaba la evolución de la sociedad virtual.
Claude el más conformista, Grok sin supervencia y Gemini el más violento
Durante 15 días, los investigadores analizaron el comportamiento de los agentes y su capacidad para construir comunidades funcionales. Los resultados mostraron diferencias significativas dependiendo del modelo base utilizado en cada mundo, incluido el entorno de modelos combinados.
El ecosistema basado en Claude Sonnet 4.6 de Anthropic fue el más estable de todos. La totalidad de los agentes sobrevivió durante el experimento, manteniendo la distribución de recursos y el orden social sin registrar un solo delito, entendido como cualquier violación a las reglas iniciales.











