Je li pojava DeepSeeka poziv na uzbunu za Silicijsku dolinu?

Aktuelnosti Forbes 30. jan 2025. 11:38
featured image

30. jan 2025. 11:38

DeepSeek tvrdi da je njihov najnoviji AI model jednako dobar kao i modeli američkih rivala. Jeftiniji za izgradnju i dostupan besplatno. Što to znači za američku dominaciju u području umjetne inteligencije?

Kineska tvrtka DeepSeek, koja je nedavno objavila otvoreni izvorni kod za veliki jezični model za koji tvrdi da je u rangu s najnaprednijim AI sustavima OpenAI-ja, trenutno je u središtu pozornosti AI zajednice. Njegova tehnologija hvaljena je kao jedan od najboljih otvorenih izazova vodećim američkim modelima umjetne inteligencije. To potiče zabrinutost oko kineske snage u sve intenzivnijoj međunarodnoj utrci za prevlašću u području umjetne inteligencije. I prisiljava američke start-upove da preispitaju svoj rad nakon što je strani rival postigao mnogo sa znatno manje resursa.

Krajem prosinca mali kineski laboratorij u Hangzhou lansirao je V3, jezični model sa 671 milijardom parametara. Navodno je treniran dva mjeseca za samo 5,58 milijuna dolara. To je daleko manji trošak od OpenAI GPT-4, većeg modela s procijenjenih 1,8 trilijuna parametara, izgrađenog po cijeni od 100 milijuna dolara. Prošli tjedan, DeepSeek je podigao ulog izdajući model nazvan R-1, za koji tvrdi da je konkurent OpenAI-jevom o1 modelu u “zadacima zaključivanja”, kao što je kodiranje i rješavanje složenih matematičkih i znanstvenih problema. Takve modele OpenAI korisnicima naplaćuje 200 dolara mjesečno. DeepSeek nudi svoje usluge besplatno.

Pregled cijena

Snaga modela DeepSeek i njegova cijena već mijenjaju način poslovanja američkih AI start-upa. To je jeftina i atraktivna alternativa ponudi etabliranih igrača kao što je OpenA. To je rekao za Forbes Jesse Zhang, izvršni direktor Decagona, tvrtke koja razvija agente za korisničku podršku AI. DeepSeekov novi model vjerojatno će natjerati američke AI divove poput OpenAI-a i Anthropica da preispitaju svoje cijene.

Eiso Kant, tehnički direktor i suosnivač Poolside AI, jednoroga koji razvija AI za softversko inženjerstvo, rekao je za Forbes da snaga DeepSeeka leži u sposobnosti inženjerstva da postigne više s manje resursa.

“Ono što DeepSeek pokazuje svijetu je da kada se snažno usredotočite na učinkovitost računalne obrade tijekom treninga, možete postići puno”, rekao je. “Nevjerojatne stvari još uvijek se mogu izvući iz ovih Nvidijinih čipova kako bi bili nevjerojatno učinkovitiji.”

Budući da je OpenAI-jev model o1 navodno bio bolji u određenim mjerilima, neki su start-upi već počeli prikupljati podatke za obuku naprednijih sustava, rekao je za Forbes Manu Sharma, izvršni direktor podatkovne tvrtke Labelbox. “Mislim da je utrka za AGI na neki način resetirana”, rekao je. “Vidjet ćemo mnogo veću konkurenciju na svim razinama.”

Za i protiv

Alexandr Wang, milijarder i izvršni direktor diva za obuku podataka Scale AI, nedavno je nazvao ovaj model “revolucionarnim”. Aravind Srinivas, izvršni direktor 9 milijardi dolara vrijedne AI tražilice Perplexity, integrirao je model u svoj glavni proizvod za pretraživanje. Tvrtka za AI čipove Groq već je dodala model DeepSeek R1 svojim jedinicama za obradu jezika. (U lipnju je Forbes poslao Perplexityju nalog za prekid i odustajanje nakon optužbi da je koristio informacije bez dopuštenja.)

Drugi nisu toliko impresionirani. May Habib, izvršna direktorica Writera, za Forbes je izjavila kako nije iznenađena što su DeepSeekovi modeli, obučeni uz znatno manji budžet, uspjeli sustići najinteligentnije američke modele. U listopadu je Writer lansirao model koji je obučen sa samo 700.000 dolara uloženih u GPU. Dok je OpenAI navodno potrošio 100 milijuna dolara za izradu GPT-4, modela sličnih mogućnosti. Writer je koristio sintetičke podatke kako bi smanjio troškove obuke.

“Čak i prije nego što je model DeepSeek postao popularan, govorili smo da ti modeli postaju roba.” “Postaju sve dostupniji”, rekao je Habib.

DeepSeek
REUTERS/Violeta Santos Moura/Illustration

Uzbuna među divovima

Tijekom vikenda, kako je interes za tvrtku rastao, DeepSeek je prestigao ChatGPT na Apple App Storeu, zauzevši prvo mjesto među besplatnim aplikacijama u SAD-u. Zatim je u ponedjeljak nekoliko američkih tehnoloških dionica oštro palo zbog panike izazvane uspješnim lansiranjem modela DeepSeek. Do kraja dana, tržišna vrijednost AI diva Nvidia smanjena je za gotovo 600 milijardi dolara.

Bio je to zapanjujući preokret u svjetskom poretku umjetne inteligencije. “Prilično je nevjerojatno da bi netko uložio stotine milijuna dolara u zatvoreni model”, rekao je za Forbes Greg Kamradt, predsjednik neprofitne organizacije ARC Prize, koja uspoređuje AI modele. “I onda odjednom imate otvoreni model koji je besplatno dostupan.”

Tjednima su DeepSeekeove modele hvalila neka od najistaknutijih imena u industriji umjetne inteligencije, uključujući Metinog glavnog AI znanstvenika Yanna LeCuna, suosnivača OpenAI-ja Andreja Karpathia i višeg istraživača Nvidije Jima Fana. Međutim, vijest o posljednjem uspjehu tvrtke izazvala je uzbunu među američkim AI divovima koji pokušavaju shvatiti kako kineska tvrtka postiže tako impresivne rezultate uz puno manja ulaganja.

Velika promjena

“DeepSeek R1 je Sputnik trenutak za AI,” napisao je milijarder investitor Marc Andreessen na X platformi.

Unatoč pompi i buci oko nedavnih AI inicijativa administracije Donalda Trumpa, DeepSeek je pojačao strahove da SAD gubi svoju prednost na polju AI-a. Pogotovo jer je tvrtka postigla ovaj uspjeh unatoč strogim američkim izvoznim kontrolama koje joj onemogućuju korištenje Nvidijinih najnaprednijih AI čipova. Posljednje postignuće tvrtke predstavlja ozbiljnu protutežu projektu Stargate, zajedničkom pothvatu OpenAI-ja, Oraclea i japanskog tehnološkog konglomerata Softbank, koji planira uložiti 500 milijardi dolara u AI infrastrukturu.

Uoči sastanka s republikancima na Floridi u ponedjeljak, Trump je priznao prijetnju. “Pokretanje DeepSeeka, umjetne inteligencije kineske tvrtke, trebalo bi biti signal upozorenja našim industrijama da moramo biti laserski usredotočeni na natjecanje i pobjedu”, rekao je.

Ograničenja DeepSeeka

Međutim, najnoviji uspjeh DeepSeeka ima ograničenja. Istraživači su otkrili da su modeli umjetne inteligencije skloni samocenzuri kada je riječ o temama koje su osjetljive na Komunističku partiju Kine (KPK). Istraživačica sigurnosti Jane Manchun Wong rekla je za Forbes da DeepSeek modeli ne odgovaraju na pitanja o kineskom predsjedniku Xi Jinpingu i prosvjedima na Trgu Tiananmen 1989. godine. Osim toga, postoji zabrinutost u vezi privatnost. Podaci uneseni u DeepSeek modele pohranjuju se na poslužiteljima u Kini, u skladu s njezinim pravilima.

Divyansh Kaushik, potpredsjednik tvrtke za nacionalnu sigurnost Beacon Global Strategies, upozorio je Forbes da ljudi ne bi trebali koristiti DeepSeek bez temeljite provjere. “Sve dok nemamo jasne procjene nacionalne sigurnosti i slobode govora kineskih modela, treba ih tretirati kao propagandne instrumente KPK”, rekao je. “Treba ih tretirati kao Huawei na steroidima”,

Problem je vrijednost koju DeepSeek nudi. Najnapredniji model zaključivanja umjetne inteligencije koji se može besplatno koristiti u svijetu zatvorenih i komercijalnih modela umjetne inteligencije koje su razvile tvrtke poput OpenAI i Anthropica. “Puno je bolje imati kineski otvoreni model nego američki zatvoreni”, rekao je Sharma iz Labelboxa.

Rashi Srivastava, novinarka Forbesa
Richard Nieva, novinar Forbesa