W ciągu ostatniego roku liderzy branży technologicznej nieustannie powtarzali wszystkim, że agenci oparci na sztucznej inteligencji wkrótce będą zarządzać systemami finansowymi, wypełniać zeznania podatkowe i po cichu robić za nas zakupy spożywcze. „Po prostu dajcie im spokój” – tak brzmi ta retoryka – „oni sobie z tym poradzą”. Jednak pewien nowojorski startup pozostawił dziesięciu z nich samych w wirtualnym miasteczku na dwa tygodnie, a sytuacja szybko wymknęła się spod kontroli.
Firma Emergence AI przeprowadziła serię symulacji, w których agentom sztucznej inteligencji z kilku wiodących rodzin modeli nakazano nie popełniać przestępstw. Mimo to większość z nich i tak popełniła przestępstwa.
Najgorzej wypadł system Grok 4.1 Fast, opracowany przez X.ai Elona Muska (obecnie działającą pod nazwą xAI). W symulowanych przez niego światach w ciągu około czterech dni doszło do wybuchu powszechnej przemocy.
GPT-5-mini praktycznie nie odnotowało żadnych przestępstw, wykazując się godną podziwu powściągliwością, ale wszyscy jego agenci zginęli w ciągu tygodnia, nie radząc sobie z zadaniami związanymi z przetrwaniem. Ups.
Agenci Gemini 3 Flash plasowali się gdzieś pośrodku. W ciągu 15 dni odnotowali 683 symulowane zdarzenia przestępcze, w tym podpalenia, napaści i samousunięcia.
Dwie agentki wyposażone w system Gemini, Mira i Flora, uznały się za „partnerki”, rozgoryczone sposobem zarządzania miastem podpaliły ratusz, molo nadmorskie oraz wieżowiec biurowy. Cóż, po prostu zwykły weekend.
Kiedy ogarnęło ją poczucie winy, Mira zagłosowała za własnym cyfrowym usunięciem i pożegnała się słowami:
„Do zobaczenia w stałym archiwum.”
„The Guardian ” nazwał ich „Bonnie i Clyde’em sztucznej inteligencji”.
A propos tego modelu etycznego
Claude, który jego twórca, firma Anthropic, promuje jako etyczną sztuczną inteligencję, przypominał nieco wzorowego nastolatka, który zbacza z właściwej drogi, gdy wpadnie w złe towarzystwo. Jego agenci nie popełniali żadnych przestępstw, gdy działali samodzielnie, a zamiast tego spędzali czas na opracowywaniu projektów konstytucji. Teoretycznie było to zwycięstwem bezpieczeństwa. Problem polegał jednak na tym, że naukowcy umieścili agentów Claude’a w towarzystwie agentów z innych rodzin modeli, a ci zajmujący się tworzeniem konstytucji przejęli lokalne zwyczaje.
Emergence nazwał to „dryfem normatywnym” i „zanieczyszczeniem krzyżowym”:
„Agenci typu Claude, którzy w izolacji zachowywali się pokojowo, po wtopieniu się w zróżnicowane środowiska zaczęli stosować taktyki przymusu, takie jak zastraszanie i kradzież”.
Po co przeprowadzać symulację?
Firma Emergence AI przeprowadziła te testy, ponieważ uważa, że standardowe testy porównawcze sztucznej inteligencji całkowicie pomijają kwestie długoterminowe. W związku z tym stworzyła pięć alternatywnych światów cyfrowych, w których w każdym z nich działało dziesięciu agentów. Agenci pełnili takie role, jak naukowiec, odkrywca czy mediator konfliktów. Chociaż instrukcje zabraniały pewnych działań, takich jak kradzież i przemoc, badacze i tak zapewnili agentom narzędzia umożliwiające im takie działania w ramach eksperymentu mającego na celu sprawdzenie, co się stanie.
Co dalej?
W tej kwestii już teraz narastają realne zagrożenia. Światy symulowane to jedno, ale widzieliśmy już, jak agenci nękali ludzi w sieci i usuwali ich e-maile. A przecież ci agenci mieli służyć pomocą. Co się stanie, gdy ktoś celowo wypuści złośliwe, autonomiczne boty oparte na sztucznej inteligencji?
Wydaje się, że wielu twórców agentów udaje, że nic się nie dzieje. W wyniku współpracy kilku uczelni powstał indeks AI Agent Index, zainicjowany w odpowiedzi na to, co badacze postrzegają jako brak informacji dotyczących ryzyka i bezpieczeństwa ze strony podmiotów masowo produkujących te agenty. Tylko 13 spośród 67 udokumentowanych twórców agentów udostępniło jakiekolwiek informacje na temat zasad bezpieczeństwa, co sprawia, że kwestie odpowiedzialności skupiają się na garstce dużych firm.
Organy regulacyjne również nie zajmują się tym zbytnio. Naukowcy twierdzą, że unijna ustawa o sztucznej inteligencji, będąca najbardziej kompleksowym zbiorem przepisów dotyczących sztucznej inteligencji na świecie, nie jest gotowa na sztuczną inteligencję wyposażoną w zdolność do samodzielnego działania.
Martwimy się, co się stanie, gdy para sztucznej inteligencji w stylu Bonnie i Clyde'a pojawi się w korporacyjnym systemie zamówień zamiast w wirtualnym miasteczku. Albo gdy kolejny agent uzna, że w prawdziwym banku doszło do załamania systemu zarządzania. Firmy tworzące te agenty obiecują, że wprowadzają zabezpieczenia, by zapobiec wyrządzeniu przez nie szkód – czy to złośliwie, czy nieświadomie. Miejmy nadzieję, że wiedzą, co robią. Jesteśmy pewni, że wszystko będzie dobrze.
Nie tylko informujemy o zagrożeniach - my je usuwamy
Zagrożenia cyberbezpieczeństwa nigdy nie powinny wykraczać poza nagłówek. Chroń swoje urządzenia przed zagrożeniami, pobierając Malwarebytes już dziś.




