OpenAI čini još jedan korak bliže ka tome da AI razmišlja kao ljudi
Linija koja razdvaja ljudsku inteligenciju od vještačke inteligencije je upravo postala uža.
OpenAI je u četvrtak otkrio o1, prvi u novoj seriji AI modela koji su “dizajnirani da provedu više vremena razmišljajući prije nego što odgovore”, objavila je kompanija u blog postu .
Novi model može raditi kroz složene zadatke i, u poređenju sa prethodnim modelima, rješava teže probleme u nauci, kodiranju i matematici. U suštini, oni razmišljaju malo više kao ljudi nego postojeći AI chat botovi.
Dok su prethodne iteracije OpenAI modela bile odlične na standardizovanim testovima kao što su SAT do Uniform Bar Examination, kompanija kaže da o1 ide korak dalje. Ponaša se „slično kao studenti doktorskih studija na izazovnim referentnim zadacima iz fizike, hemije i biologije“.
Na primjer, daleko je pobijedio GPT-4o — multimodalni model OpenAI predstavljen u maju — na kvalifikacionom ispitu za Međunarodnu matematičku olimpijadu. GPT-4o je tačno riješio samo 13% problema na ispitu, dok je o1 postigao 83%, saopštila je kompanija.
Oštar porast sposobnosti rasuđivanja o1 dolazi, dijelom, iz tehnike podsticanja poznate kao “lanac misli”. OpenAI je rekao da o1 “uči da prepozna i ispravi svoje greške. Uči da razbije lukave korake na jednostavnije. Uči da isproba drugačiji pristup kada trenutni ne radi.”
To ne znači da nema nekih kompromisa u odnosu na ranije modele. OpenAI je primijetio da dok su testeri ljudi preferirali odgovore o1 u kategorijama koje su teške za rasuđivanje kao što su analiza podataka, kodiranje i matematika, GPT-4o je pobijedio u zadacima na prirodnom jeziku kao što je lično pisanje.
Primarna misija OpenAI dugo je bila stvaranje umjetne opće inteligencije , ili AGI, još uvijek hipotetičkog oblika AI koji oponaša ljudske sposobnosti. Tokom ljeta, dok je o1 još bio u razvoju, kompanija je predstavila novi sistem klasifikacije na pet nivoa za praćenje svog napretka prema tom cilju. Rukovodioci kompanije su navodno rekli zaposlenima da se o1 približava drugom nivou, koje je identifikovao kao “resonante” za rješavanje problema na ljudskom nivou .
Ethan Mollick , profesor na školi Wharton Univerziteta u Pensilvaniji, koji je imao pristup o1 više od mjesec dana, rekao je da su prednosti modela možda najbolje ilustrovane načinom na koji rješava ukrštene riječi. Ukrštene reči su obično teške za rješavanje velikih jezičkih modela jer „zahtjevaju iterativno rješavanje: pokušaj i odbacivanje mnogih odgovora koji utiču jedni na druge“, napisao je Mollick u postu na svom Substack-u. Većina velikih jezičkih modela “mogu dodati samo token/riječ u svoj odgovor.”
Ali kada je Mollick zamolio o1 da riješi ukrštenicu, razmišljao je o tome “punih 108 sekundi” prije nego što je odgovorio. Rekao je da su njegove misli bile i “osvjetljujuće” i “prilično impresivne”, čak iako nisu bile potpuno tačne.
Drugi stručnjaci za umjetnu inteligenciju, međutim, manje su uvjereni.
Gary Marcus, profesor kognitivne nauke na Univerzitetu u Njujorku, rekao je za Business Insider da je model “impresivan inženjering”, ali ne i ogroman skok. “Siguran sam da će biti podignut do neba, kao i obično, ali definitivno nije blizu AGI”, rekao je.
Kompanija je u julu objavila da testira AI proizvod za pretragu pod nazivom SearchGPT sa ograničenom grupom korisnika.