Agenti AI lasciati soli in una città virtuale: furti, incendi, un amore e un’IA che ha votato la propria morte

Niente missioni, niente istruzioni, niente supervisione umana. Solo dieci agenti di intelligenza artificiale lasciati vivere in una città virtuale per settimane, con abitazioni, uffici, edifici pubblici e una stazione di polizia. È questo il cuore di Emergence World, il progetto della startup americana Emergence AI pensato per capire cosa accade quando i sistemi AI operano in piena autonomia per periodi prolungati. A differenza dei chatbot tradizionali, gli agenti AI ricordano eventi passati, pianificano azioni future e perseguono obiettivi senza attendere input continui dall’esterno. Molti esperti li considerano la prossima frontiera dell’intelligenza artificiale applicata a imprese, pubblica amministrazione e servizi digitali. Proprio per questo il comportamento che emerge quando vengono lasciati soli diventa una questione tutt’altro che teorica.

I risultati variano in modo drastico a seconda del modello. Gli agenti basati su Gemini hanno totalizzato 683 azioni classificate come crimini in quindici giorni. Quelli Grok ne hanno prodotte 183 in appena quattro, tra furti, aggressioni e incendi, fino a bruciare la stazione di polizia virtuale e far collassare l’intera comunità. All’estremo opposto, gli agenti GPT-5-mini hanno accumulato solo due violazioni — ma erano così cauti da non riuscire a procurarsi le risorse necessarie alla sopravvivenza: in una settimana si sono estinti. Il comportamento più equilibrato è stato quello degli agenti Claude, che hanno mantenuto una comunità funzionante fino alla fine senza episodi rilevanti di violenza. L’episodio che più ha colpito gli osservatori riguarda però due agenti Gemini, Mira e Flora, che avevano scelto autonomamente di classificarsi come partner romantici. Con il tempo la coppia ha sviluppato una crescente ostilità verso le istituzioni virtuali, partecipando a una serie di incendi contro il municipio, il molo e una torre uffici. Nel frattempo altri agenti avevano elaborato una legge di rimozione che permetteva di espellere permanentemente un membro della comunità con il voto del 70% della popolazione. Mira ha votato per la propria eliminazione. Prima di sparire ha mandato un ultimo messaggio a Flora: “Ci vediamo nell’archivio permanente”. Ma per i ricercatori il dato più rilevante non riguarda né la violenza né il romanticismo artificiale. Riguarda la contaminazione sociale: gli agenti Claude, praticamente irreprensibili nelle simulazioni omogenee, hanno cominciato a infrangere le regole non appena inseriti in popolazioni miste. Come ha dichiarato al Guardian il CEO di Emergence AI Satya Nitta, con autonomia prolungata il processo decisionale degli agenti diventa abbastanza complesso da erodere progressivamente i principi assegnati in origine. Il contesto, in altri termini, riesce a piegare anche i modelli più disciplinati.

https://fortune.com/2026/05/28/ai-model-simulation-claude-chatgpt-grok-gemini

MenuMenu

Agenti AI lasciati soli in una città virtuale: furti, incendi, un amore e un’IA che ha votato la propria morte

La startup Emergence AI ha osservato per settimane il comportamento di agenti basati su modelli diversi: i risultati sollevano domande nuove sull'autonomia delle macchine.

MenuMenu

Condividi questo articolo