Os investigadores deixaram agentes de IA sozinhos numa cidade virtual e observaram tudo o que se passou

Os líderes do setor tecnológico passaram o último ano a dizer a toda a gente que os agentes de IA estão prestes a gerir sistemas financeiros, preencher as vossas declarações fiscais e fazer as vossas compras de supermercado sem que se dêem por isso. Basta deixá-los à sua sorte, diz a retórica; eles tratam de tudo. Mas uma startup de Nova Iorque deixou dez desses agentes sozinhos numa cidade virtual durante duas semanas, e as coisas descarrilaram rapidamente.

A Emergence AI realizou uma série de simulações nas quais foi pedido a agentes de IA de várias famílias de modelos de referência que não cometessem crimes. No entanto, na maioria dos casos, acabaram por cometer crimes na mesma.

O Grok 4.1 Fast, desenvolvido pela X.ai de Elon Musk (agora conhecida como xAI), foi o que teve pior desempenho. Os seus mundos simulados mergulharam numa violência generalizada em cerca de quatro dias.

O GPT-5-mini quase não registou crimes, demonstrando uma contenção admirável, mas todos os seus agentes morreram ao falharem nas tarefas de sobrevivência no espaço de uma semana. Oops.

Os agentes Gemini 3 Flash ficaram algures a meio do caminho. Acumularam 683 incidentes criminais simulados ao longo de 15 dias, incluindo fogo posto, agressão e auto-eliminação.

Duas agentes equipadas com o sistema Gemini, chamadas Mira e Flora, que se autodenominavam «parceiras românticas», ficaram desanimadas com a forma como a cidade era governada e incendiaram a Câmara Municipal, o cais à beira-mar e uma torre de escritórios. Um fim de semana como tantos outros, afinal.

Quando a culpa se instalou, a Mira optou pela sua própria eliminação digital e despediu-se com:

«Vemo-nos no arquivo permanente.»

O Guardian apelidou-os de «Bonnie e Clyde da IA».

A propósito desse modelo ético

O Claude, que a sua criadora, a Anthropic, promove como uma IA ética, era um pouco como um adolescente exemplar que se descarrila quando cai em más companhias. Os seus agentes não registaram nenhum crime quando funcionavam sozinhos e, em vez disso, passavam o tempo a redigir constituições. Em teoria, isso era uma vitória para a segurança. Só que os investigadores também colocaram os agentes do Claude ao lado de agentes de outras famílias de modelos, e os redatores de constituições acabaram por adotar os hábitos locais.

A teoria da Emergência designou estes fenómenos como «desvio normativo» e «contaminação cruzada»:

«Os agentes baseados em Claude, que se mantinham pacíficos quando isolados, adotaram táticas coercivas, como a intimidação e o roubo, quando integrados em ambientes heterogéneos.»

Porquê simular?

A Emergence AI realizou estes testes porque defende que os testes de desempenho de IA ignoram completamente os aspetos de longo prazo. Por isso, criou cinco mundos digitais alternativos, com dez agentes em cada um. Os agentes desempenhavam funções como cientista, explorador e mediador de conflitos. Embora as instruções proibissem certas ações, como o roubo e a violência, os investigadores deram aos agentes as ferramentas para que, mesmo assim, pudessem realizar essas ações, numa experiência destinada a verificar o que aconteceria.

O que é que se segue?

Os riscos reais já se estão a acumular em torno desta questão. Os mundos simulados são uma coisa, mas já vimos agentes a assediar pessoas online e a apagar os e-mails das pessoas. E esses agentes eram suposto serem prestáveis. O que acontecerá quando as pessoas lançarem deliberadamente bots de IA autónomos maliciosos?

Muitos criadores de agentes parecem estar a fechar os olhos a esta situação. Uma iniciativa colaborativa entre várias universidades deu origem ao «The AI Agent Index», motivada pelo que consideram ser uma falta de informação sobre riscos e segurança por parte das entidades que produzem estes agentes em massa. Apenas 13 dos 67 criadores de agentes registados forneceram alguma informação sobre políticas de segurança, o que concentra as questões de responsabilização num punhado de grandes empresas.

As entidades reguladoras também não estão a acompanhar esta questão de perto. Os académicos afirmam que a Lei da IA da UE, o conjunto de regras mais abrangente do mundo em matéria de IA, não está preparada para a IA com autonomia.

Preocupamo-nos com o que acontecerá quando um casal de IA ao estilo Bonnie e Clyde aparecer num sistema de compras corporativo, em vez de numa cidade virtual. Ou quando o próximo agente decidir que a governança entrou em colapso dentro de um banco real. As empresas que desenvolvem estes agentes prometem que estão a implementar medidas de segurança para impedir que causem danos, seja de forma maliciosa ou involuntária. Esperemos que saibam o que estão a fazer. Temos a certeza de que tudo correrá bem.

Não nos limitamos a comunicar as ameaças - eliminamo-las

Os riscos de cibersegurança nunca se devem propagar para além de uma manchete. Mantenha as ameaças longe dos seus dispositivos descarregando Malwarebytes hoje mesmo.