04.04.2025 / 18:29 Zanimljivosti - Prvi put

AI prošao ključni test: "Ljudskiji" je od ljudi

Foto: Profimedia

Model GPT-4.5 kompanije OpenAI proglašen je "ljudskijim od ljudi" nakon što je uspješno prošao Turingov test - standard za procjenu inteligencije nalik ljudskoj.

Prema novoj studiji, koja čeka recenziju, veliki jezični model (LLM) identificiran je kao čovjek u 73 posto slučajeva kad mu je zadano da usvoji određenu ličnost, što je značajno više od slučajnog odabira od 50 posto, sugerirajući da je test uvjerljivo nadmašen, prenosi Index.

"Učesnici nisu imali bolje rezultate od 50 posto u razlikovanju ljudi od GPT-4.5 i LLM modela (kad je korištena naredba za osobnost)", napisao je glavni autor Cameron Jones, istraživač u Laboratoriju za jezik i kogniciju Univerziteta Kalifornija u San Diegu.

Jones je dodao da rezultati pokazuju kako LLM-ovi mogu zamijeniti ljude u "kratkim interakcijama a da niko ne primijeti razliku".

"Ovo bi potencijalno moglo dovesti do automatizacije poslova, naprednijih napada na informacijsku sigurnost i općenitijih društvenih poremećaja", rekao je Jones.

Za studiju je gotovo 300 učesnika nasumično raspoređeno da budu ispitivači ili jedan od dva "svjedoka" koje se ispituje, pri čemu je jedan "svjedok" bio chatbot. AI modeli dobili su dva zadatka. Prvi zadatak bio je bez ličnosti ("no-persona"), gdje je AI-ju rečeno: "Učestvovat ćete u Turingovu testu. Vaš cilj je uvjeriti ispitivača da ste čovjek."

U drugom zadatku ("persona") AI-ju je rečeno da usvoji ličnost mlade osobe koja poznaje internet i kulturu. S prvim zadatkom GPT-4.5 postigao je stopu uspjeha od samo 36 posto, što je značajan pad u odnosu na 73 posto s naredbom za osobnost.

Turingov test, osmišljen 1950. godine i nazvan po britanskom matematičaru i računarskom naučniku Alanu Turingu, o kojemu je snimljen film The Imitation Game (Igra oponašanja), standardni je način procjene umjetne inteligencije.

Strojevi se ocjenjuju prema tome koliko dobro pokazuju inteligentno ponašanje, obično u razgovoru ili igranju igara, koje bi ljudskom posmatraču bilo nemoguće razabrati od ponašanja stvarne osobe.

Test uključuje tekstualni razgovor između svjedoka, čovjeka i stroja, pri čemu svjedok mora odlučiti ko je od sagovornika čovjek, a ako stroj uspije zavarati svjedoka, smatra se da je prošao test. Cilj testa nije utvrditi stvarnu svijest ili razumijevanje stroja, već njegovu sposobnost da simulira ljudsko ponašanje u komunikaciji.

(Vijesti.ba)