Lažni krah memorijskih divova: Kako je TurboQuant srušio cijene dionica ali ne i potražnju

Prošle sedmice, Googleov istraživački odjel objavio je na svom blogu istraživanje o novom algoritmu za kompresiju memorije. U roku od 48 sati, globalno tržište memorijskih čipova izgubilo je preko 90 milijardi dolara vrijednosti. Američki proizviđač Micron je izgubio 14% vrijednosti, kao i SanDisk koji je izgubio 11%, dok su korejski Samsung i SK Hynix izgubili 5% i 6% na korejskoj berzi. Bio je to jedan od najbržih krahova hardverskog sektora u novijoj historiji. Ali stručnjaci smatraju da je ta reakcija potpuno neutemeljena.
TurboQuant, algoritam kojeg je Google predstavio u svom blogu, kompresuje “KV cache”, radnu memoriju koju veliki jezički modeli (LLM) koriste dok generišu odgovore. Svaki put kada LLM obrađuje vašu konverzaciju s njim, on pohranjuje međukalkulacije u RAM memoriju kako ih ne bi morao ponovo računati riječ po riječ. Kako su se AI kontekstualni prozori proširili sa hiljada na milione tokena, ovaj cache je postao ogroman, zauzimajući prostor u memoriji grafičkih procesora (GPU) koji bi se mogao koristiti za druge stvari.
TurboQuant smanjuje svaku pohranjenu vrijednost sa 16-bitne preciznosti na oko tri bita, što je najmanje šesterostruko smanjenje, bez mjerljivog gubitka u tačnosti. Na Nvidijinim H100 čipovima to omogućava do osam puta bržu obradu.
Samim time, Wall Street je zaključio da manje memorije po AI upitu znači manje potražnje za memorijom.
Zamka efikasnosti
Engleski ekonomski stručnjak William Jevons je još 1865. godine primijetio nešto kontraintuitivno kod parne mašine. Kako je postajala štedljivija, Engleska je trošila više uglja, a ne manje, jer je jeftiniji rad učinio parnu energiju isplativom za industrije koje je ranije nisu mogle priuštiti. Isti princip se može primijeniti i u IT sektoru, transportu, rasvjeti i gotovo svakoj drugoj oblasti u kojoj je efikasnost porasla.
U ovom slučaju TurboQuant smanjuje utrošak memorije po AI upitu, ali to neće natjerati Microsoft ili Amazon da kupuju manje memorije. Naprotiv, stručnjaci smatraju da će zbog toga velike firme samo proširiti primjenu umjetne inteligencije kako bi opslužili više korisnika i kreirali još veće LLM-ove. Kontekstualni prozor od 128.000 tokena bi teoretski mogao narasti na 800.000 na istom hardveru.

U samo nekoliko dana od pojave panike, Ivesticione banke poput Morgan Stanleyja, JPMorgana i Wells Farga su oštro reagovale. Konsenzus analitičara koji su zapravo pročitali Googleov rad je da će TurboQuant vjerovatno ubrzati širenje umjetne inteligencije na pametne telefone i druge kategorije sa manjom maržom za zaradu, što će stvoriti novu potražnju, a ne smanjiti postojeću.
Akademska nesuglasica o kojoj niko nije pričao
Rasprodaja dionica je postala još mutnija kada je u javnost izašao konkurentski istraživač. Gao Jianyang, postdoktorant na ETH Zurich univerzitetu i glavni autor ranijeg algoritma zvanog RaBitQ, objavio je otvoreno pismo sa tri konkretne optužbe protiv Googleovog tima.
Prvo, da je glavna metoda TurboQuanta, rotiranje podataka prije kompresije, direktno preuzeta od RaBitQ-a bez adekvatnog navođenja izvora, uprkos tome što su Googleovi autori kontaktirali Gaov tim godinu ranije da im pomognu oko koda. Drugo, da je Googleov rad lažno predstavio RaBitQ kao teoretski inferioran, iako su recenzirani radovi dokazali suprotno, i treće, da je test brzine bio namješten: RaBitQ je testiran na procesoru sa jednim jezgrom koristeći neoptimizovan kod, dok je TurboQuant radio na Nvidia A100 procesoru sa vrhunski optimizovanim kodom. Gao je rezultat nazvao “vještački stvorenom prednošću”.

Googleov tim je, navodno, bio obaviješten o ovim problemima i prije objave, ali su odbili da ih isprave. Zbog svega navedenog, Gao je podnio i zvanična žalbu etičkom komitetu Međunarodnoj konferenciji o reprezentativnom učenju
Na kojoj je prvi put predstavljeno Googleovo istraživanje. Ništa od ovoga ne znači da TurboQuant nije funkcionalan, ali je narušilo priču o “revolucionarnom otkriću” i vjerovatno djelimično objasnilo oporavak dionica kasnije tokom sedmice.
Šta je tržište zapravo propustilo
TurboQuant je optimizacija za korištenje AI modela, a ne za njihovo stvaranje. Ogromna potražnja za memorijom vrijedna milijarde dolara potiče iz višemjesečnog procesa obuke modela koji uvijek kreće od nule. Budući da ta faza i dalje zahtijeva velike količine hardvera, tržište memorijskih čipova ostaje nepromijenjeno. Navedeni algoritam nije “ubica potražnje”, već samo tehničko poboljšanje jedne faze rada.

SK Hynix drži oko 62% svjetske ponude ultra brze, HBM memorije. Njihova kompletna proizvodnja za 2026., je već rasprodata dugoročnim ugovorima koji sežu do 2028. godine. Micron, koji drži oko 21%, je u istoj poziciji. Samim time, analitičari smatraju da je prodaja dionica SK Hynixa zbog TurboQuanta jednaka prodaji dionica naftnih kompanija zbog otkrića u uštedama goriva u automobilima.
Šta to znači za pojedince i male potrošače?
Ako ste se nadali da bi TurboQuant mogao nekako olakšati nestašicu memorije za obične potrošače to se neće desiti. Barem ne uskoro. Micron je u februaru 2026., ugasio svoj brend za male potrošače “Crucial”, kako bi preusmjerio sve kapacitete na poslovne korisnike i AI. Samsung i SK Hynix na papiru i dalje uslužuju globalno tržište, ali su količine toliko ograničene da je efekat skoro isti. Cijena DDR4 memorije je višestruko veća nego prošle godine, dok je DDR5 skup i teško je doći do njega.

Najrealniji put do jeftinije memorije nije Googleov algoritam, već kineska proizvodnja. Kompanije poput ChangXin Memory Technologies i Yangtze Memory Technologies šire se upravo u segmentu potrošačke elektronike i automobila, od kojeg su velike zapadne kompanije odustale. Ako njihove količine preplave svjetsko tržište 2027., kao što se predviđa, cijene bi se mogle stabilizovati. Pravo pitanje je da li će američka trgovinska politika to dozvoliti, a na to niko nema jasan odgovor.