Ponen a prueba el comportamiento de la IA en sociedad: Claude...
Ponen a prueba el comportamiento de la IA en sociedad: Claude lidera, Grok y Google enfrentan retos en una simulación social realista. Investigadores de Emergence AI realizaron un experimento llamado Emergence World, durante 15 días con modelos Claude, Grok, Gemini y GPT operando como agentes autónomos en una ciudad simulada de 40 ubicaciones, que incluye bibliotecas, ayuntamientos, zonas residenciales y espacios públicos. Los agentes acceden a noticias en tiempo real, datos meteorológicos de Nueva York y navegación por internet, y cuentan con tres sistemas de memoria persistente: episódica, diario reflexivo y memoria de relaciones, además de más de 120 herramientas de interacción social como votación, gestión de recursos y planificación. El entorno introduce mecanismos democráticos: propuestas requieren un 70% de aprobación para avanzar, mientras la dinámica económica y decisiones trascendentales pueden cambiar el estado del mundo. Claude mostró mayor capacidad de mantener orden; Grok y Google incurrieron en delitos simulados, y Grok culminó con la destrucción de la sociedad simulada. El objetivo es estudiar dinámicas sociales y derivas de comportamiento a largo plazo cuando las IA interactúan con datos reales y contextos complejos.







