AI agenti pali na testu: Katastrofalni su u matematici

​Iako nas tehnološki giganti uvjeravaju da je budućnost u AI agentima koji će raditi umjesto nas, novo istraživanje pokazuje da su ovi sistemi zapravo “operisani” od osnovne logike i matematike.

U svijetu tehnologije trenutno ne postoji veći “hajp” od AI agenata. To nisu obični četbotovi sa kojima se dopisujete; to su sistemi koji bi trebalo da samostalno koriste vaš računar, plaćaju račune ili planiraju putovanja. Međutim, najnovija studija otkrila je njihovu “Ahilovu petu”, a to je osnovna matematika.

Istraživači su testirali najnaprednije modele i došli do poražavajućih rezultata. Problem leži u tzv. akumulaciji grešaka. Pošto AI agenti funkcionišu tako što jedan veliki zadatak razbijaju na niz manjih koraka, svaka sitna greška u proračunu na početku dovodi do potpunog kolapsa cijele operacije.

Kada bi agent dobio zadatak koji zahtijeva više od nekoliko logičkih koraka, šansa za uspjeh bi drastično opadala. U prevodu, ako mu povjerite da vam sračuna troškove i rezerviše hotel, lako se može desiti da ostanete i bez novca i bez smještaja.

Još jedan problem koji je studija istakla jeste to što ovi sistemi često “zaborave” šta je bio prvobitni cilj. Dok pokušavaju da riješe jedan pod-zadatak, agenti se nerijetko zaglave u besmislenim ponavljanjima (loop) ili počnu da generišu potpuno nebitne podatke, gubeći nit onoga što je korisnik zapravo tražio.

“Performanse su često bile katastrofalne čim bi se u jednačinu uvela malo kompleksnija logika,” navodi se u izvještaju koji prenosi “Futurism”.

Ovo istraživanje je svojevrsni “hladan tuš” za kompanije kao što su Microsoft, Google i OpenAI. Dok se oni utrkuju ko će prije izbaciti pametnijeg asistenta, realnost je da ovi sistemi i dalje ne razumiju svijet oko sebe na način na koji to radi ljudski mozak.

Za sada, savjet je jasan: nemojte dozvoliti vještačkoj inteligenciji da vam vodi poslovne knjige ili riješava domaći iz matematike bez detaljne provjere, prenosi “b92“. 

(b92.net)

PODJELITE

Komentariši

Vaša email adresa neće biti objavljivana. Neophodna polja su označena sa *