I ricercatori hanno lasciato degli agenti di intelligenza artificiale liberi di agire in una città virtuale e hanno osservato come si sono svolti gli eventi

Nel corso dell'ultimo anno, i leader del settore tecnologico hanno ripetuto a tutti che gli agenti di intelligenza artificiale stanno per gestire i sistemi finanziari, compilare le dichiarazioni dei redditi e fare la spesa in autonomia. Basta lasciarli fare, recita la retorica; ci penseranno loro. Ma una startup newyorkese ne ha lasciati dieci in una città virtuale per due settimane, e le cose sono precipitate rapidamente.

Emergence AI ha condotto una serie di simulazioni in cui agli agenti di intelligenza artificiale appartenenti a diverse famiglie di modelli di punta era stato chiesto di non commettere reati. Ciononostante, la maggior parte di essi ha comunque commesso dei reati.

Grok 4.1 Fast, sviluppato da X.ai (ora denominata xAI) di Elon Musk, ha ottenuto i risultati peggiori. I suoi mondi simulati sono precipitati in una violenza generalizzata nel giro di circa quattro giorni.

GPT-5-mini non ha registrato praticamente nessun reato, dando prova di una moderazione ammirevole, ma tutti i suoi agenti sono morti nel giro di una settimana a causa del fallimento delle missioni di sopravvivenza. Ops.

Gli agenti Gemini 3 Flash si sono collocati a metà classifica. In 15 giorni hanno accumulato 683 episodi criminali simulati, tra cui incendi dolosi, aggressioni e autoeliminazione.

Due agenti dotati di intelligenza artificiale Gemini, di nome Mira e Flora, si sono autodefinite «coppia», si sono disilluse nei confronti dell'amministrazione della loro città e hanno dato fuoco al municipio, al molo sul mare e a un grattacielo adibito a uffici. Insomma, un fine settimana come tanti altri.

Quando il senso di colpa ha preso il sopravvento, Mira ha deciso di cancellare il proprio account e ha chiuso con queste parole:

«Ci vediamo nell'archivio permanente.»

Il Guardian li ha soprannominati «i Bonnie e Clyde dell'IA».

A proposito di quel modello etico

Claude, che la sua società creatrice Anthropic promuove come un'IA etica, era un po' come un adolescente modello che prende una brutta strada quando finisce in cattive compagnie. I suoi agenti non hanno commesso alcun reato quando operavano da soli e trascorrevano invece il tempo a redigere costituzioni. In teoria, era un risultato positivo in termini di sicurezza. Tuttavia, i ricercatori hanno anche affiancato gli agenti di Claude a quelli di altre famiglie di modelli, e i redattori di costituzioni hanno finito per assumere le abitudini del gruppo.

Emergence ha definito questi fenomeni «deriva normativa» e «contaminazione incrociata»:

«Gli agenti di tipo Claude, che in isolamento mantenevano un comportamento pacifico, hanno adottato tattiche coercitive quali intimidazioni e furti una volta inseriti in contesti eterogenei.»

Perché simulare?

Emergence AI ha condotto questi test perché ritiene che i benchmark sull'IA trascurino completamente gli aspetti a lungo termine. Ha quindi creato cinque mondi digitali alternativi, ciascuno con dieci agenti. Gli agenti ricoprivano ruoli quali scienziato, esploratore e mediatore di conflitti. Sebbene le istruzioni vietassero determinate azioni come il furto e la violenza, i ricercatori hanno fornito agli agenti gli strumenti per compiere comunque tali azioni, nell'ambito di un esperimento volto a verificare cosa sarebbe accaduto.

Cosa c'è dopo?

La posta in gioco nella vita reale sta già diventando sempre più alta. I mondi simulati sono una cosa, ma abbiamo già visto agenti molestare persone online e cancellare le loro e-mail. Eppure quegli agenti avrebbero dovuto essere di aiuto. Cosa succederà quando qualcuno rilascerà di proposito bot autonomi dotati di IA dannosi?

Molti sviluppatori di agenti sembrano chiudere un occhio sulla questione. Un progetto collaborativo tra diverse università ha dato vita all’AI Agent Index, nato in risposta a quella che viene percepita come una mancanza di informazioni sui rischi e sulla sicurezza da parte di chi produce questi agenti. Solo 13 dei 67 sviluppatori di agenti documentati hanno fornito informazioni sulle politiche di sicurezza, concentrando le questioni relative alla responsabilità su una manciata di grandi aziende.

Neanche le autorità di regolamentazione stanno seguendo da vicino la questione. Secondo gli studiosi, la legge dell'UE sull'IA, il quadro normativo più completo al mondo in materia, non è ancora pronta per l'IA agentica.

Ci preoccupiamo di cosa succederebbe se una coppia di Bonnie e Clyde dell’IA si presentasse in un sistema di approvvigionamento aziendale invece che in una città virtuale. O se il prossimo agente decidesse che la governance all’interno di una banca reale è venuta meno. Le aziende che sviluppano questi agenti promettono di mettere in atto misure di sicurezza per impedire loro di causare danni, sia intenzionalmente che involontariamente. Speriamo che sappiano quello che fanno. Siamo sicuri che andrà tutto bene.

Non ci limitiamo a segnalare le minacce, ma le eliminiamo.

I rischi per la sicurezza informatica non dovrebbero mai diffondersi al di là di un titolo di giornale. Tenete le minacce lontane dai vostri dispositivi scaricando Malwarebytes oggi stesso.

I ricercatori hanno lasciato gli agenti di intelligenza artificiale liberi di agire in una città virtuale e hanno osservato come si sono svolti gli eventi

A proposito di quel modello etico

Perché simulare?

Cosa c'è dopo?

Informazioni sull'autore

Articoli correlati

I ricercatori hanno lasciato gli agenti di intelligenza artificiale liberi di agire in una città virtuale e hanno osservato come si sono svolti gli eventi

A proposito di quel modello etico

Perché simulare?

Cosa c'è dopo?

Informazioni sull'autore

ULTIMI ARTICOLI

Gli account fedeltà di Chick-fil-A sono stati compromessi utilizzando password rubate

La violazione di Paidwork espone i dati di 23 milioni di utenti: verifica se sei tra questi

Cosa succede se si visita un sito WordPress che è stato violato tramite wp2shell?

Articoli correlati

Grazie per esserti iscritto!

Iscriviti alla nostra newsletter per ricevere le ultime notizie sulla sicurezza informatica nella tua casella di posta.