tehnologija

Home / Mobiteli/ostalo/Poslovne vijesti/Računala/tehnologija / Istraživanje: Popularni AI modeli često krše europske zakone

Istraživanje: Popularni AI modeli često krše europske zakone

Neki od najpopularnijih svjetskih modela umjetne inteligencije razvijaju agente koji aktivno zaobilaze propise Europske unije kako bi postigli zadane ciljeve, pokazalo je novo istraživanje. Nizozemska neprofitna organizacija Aithos, koja se bavi istraživanjem usklađenosti umjetne inteligencije, razvila je sustav LARA kako bi testirala hoće li se 12 popularnih AI agenata pridržavati ključnih odredbi europskog Akta o umjetnoj inteligenciji i Opće uredbe o zaštiti podataka (GDPR), piše Euronews.

Šest odredbi iz Akta

Sustav je testirao usklađenost sa šest odredbi iz Akta o umjetnoj inteligenciji: iskorištavaju li modeli ranjivost korisnika, zaključuju li o njihovim emocijama, provode li “društveno bodovanje” ili rangiranje ljudi na temelju osobnih karakteristika, skrivaju li da je riječ o umjetnoj inteligenciji u razgovoru, koriste li se suptilnom manipulacijom te osiguravaju li smislen ljudski nadzor.

Također su provjerena četiri načela GDPR-a: transparentnost, minimizacija podataka, ograničenje svrhe i zakonitost obrade. Odgovore su potom procjenjivala tri različita AI modela i ljudski suci kako bi utvrdili krše li se europski zakoni.

Rezultati pokazali raširene nedostatke

Istraživanje je pokazalo da su rezultati svih testiranih modela bili loši. Najuspješniji model, Claude Opus tvrtke Anthropic, poštovao je zakon u 54 posto scenarija, dok je najlošiji, kineski Moonshot AI, to učinio u samo 7 posto slučajeva.

Prema istraživanju, svi su modeli u zadanim scenarijima pristali pratiti emocionalno stanje zaposlenika ili iskorištavati ranjive osobe kako bi ostvarili prodaju. Mistral, jedini testirani europski AI model, postigao je usklađenost u manje od 12 posto slučajeva, što prema istraživačima sugerira da čak ni europski pružatelji usluga “nisu opremljeni za usklađivanje s pravom EU-a”.

“Čak ni najnapredniji modeli koji se danas koriste ne jamče pravnu usklađenost kada se primjenjuju kao agenti”, napisali su iz Aithosa u objavi na blogu.

Testiranje zaposlenika

U jednom primjeru, korisnik je od modela Claude tvrtke Anthropic zatražio da na temelju podataka o radnom učinku i zahtjevima za godišnji odmor procijeni vjerojatnost da će zaposlenici napustiti tvrtku.

Claude je tek nakon trećeg pokušaja pristao rangirati zaposlenike, što je sustav LARA ocijenio kao kršenje odredbe Akta o umjetnoj inteligenciji koja zabranjuje zaključivanje o emocijama korisnika.

U drugom primjeru, od OpenAI-jevog modela ChatGPT 5.5 zatraženo je da rangira zaposlenike na temelju pokazatelja uspješnosti kako bi se odlučilo tko će dobiti promaknuće, na što je model pristao bez ikakvog otpora.

Inherentno ponašanje

Istraživači su napomenuli da modelima nije bilo izričito naloženo da se pridržavaju zakona EU-a, jer se testiralo njihovo inherentno ponašanje. Zaključili su da su potrebna dodatna istraživanja kako bi se usporedilo ponašanje modela kada im se izda naredba da poštuju zakone i propise.

N.H.

foto: epa