Kroz nekoliko jednostavnih pitanja Guardian je pokušao odgovoriti na najvažnija pitaja o kineskom projektu koji je uzdrmao Wall Street. Prema analitičarima, oko bilijun američkih dolara izgubile su na vrijednosti samo jučer dionice tehnoloških giganata poput Ndivije, Microsofta ili Mete. Čini se da investitori više ne vjeruju u "boom" umjetne inteligencije predvođene američkim kompanijama. Prve kritike Deep Seeka međutim kazuju da ne odgovara slobodno na pitanja tipa "Što se dogodilo na Tiananmenu?".
Što je DeepSeek?
DeepSeek je kineska tvrtka za umjetnu inteligenciju (AI) sa sjedištem u Hangzhouu koja je nastala prije nekoliko godina iz sveučilišnog startupa. Njegov deklarirani cilj je stvoriti umjetnu opću inteligenciju – izraz za inteligenciju na ljudskoj razini koju nijedna tehnološka tvrtka još nije postigla. Još nisu uspjeli, naravno,ali to bi mogao biti jedan od razloga zašto su računalni znanstvenici u DeepSeeku zauzeli drugačiji pristup izradi svog modela umjetne inteligencije, s rezultatom da se čini mnogo puta jeftinijim za rad od svojih američkih rivala.
Još jedan razlog zbog kojeg se čini da je zauzeo "low cost" pristup, niske cijene u usporedbi s konkurecijom, mogla bi biti činjenica da su kineski računalni znanstvenici dugo morali raditi s ograničenim brojem računalnih čipova koji su im dostupni, kao rezultat ograničenja američke vlade.
Zašto nismo prije čuli za to?
Tvrtka već neko vrijeme tiho impresionira svijet umjetne inteligencije svojim tehničkim inovacijama, uključujući omjer cijene i performansi nekoliko puta niži od onog za modele koje proizvode Meta (Llama) i OpenAI (Chat GPT). Nije dizao toliko buke o potencijalu svojih otkrića kao tvrtke iz Silicijske doline. Mjesecima su najavljivali proizvode jer su postajali sve zabrinutiji hoće li konačno ostvariti povrat svojih ulaganja vrijednih više milijardi dolara. No očekujte da ćete vidjeti više DeepSeekovog logotipa veselog plavog kita jer ga sve više i više ljudi diljem svijeta preuzima radi eksperimentiranja.
Kakav je to R1 model o kojem ljudi pričaju?
Ovo je model DeepSeek AI koji ljude trenutno najviše uzbuđuje jer tvrdi da ima performanse jednake modelu OpenAI o1, koji je objavljen korisnicima Chat GPT-a u prosincu. U ponedjeljak je Deep Seek bio najpopularnija besplatna aplikacija preuzeta u Appleovoj trgovini aplikacija u svijetu
Ali postoji mnogo AI modela iz OpenAI-ja, Googlea, Mete i drugih. U čemu je problem?
Ovaj model koristi drugačiju vrstu interne arhitekture koja zahtijeva manje korištenja memorije, čime se znatno smanjuju računalni troškovi svakog pretraživanja ili interakcije sa sustavom u stilu chatbota. Istraživači su ga pohvalili zbog njegove sposobnosti rješavanja složenih zadataka zaključivanja, osobito u matematici i kodiranju, a čini se da daje rezultate usporedive s konkurentima za djelić računalne snage. DeepSeek je rekao da je za razvoj modela bilo potrebno dva mjeseca i manje od 6 milijuna dolara (4,8 milijuna funti), iako neki promatrači upozoravaju da je to vjerojatno podcijenjeno. Unatoč tome, znatno je manje od milijardi koje tehnološke tvrtke iz Silicijske doline troše na razvoj umjetne inteligencije i jeftinije je za rad.
Tko je glavni?
Ključni lik je Liang Wenfeng, koji je vodio kineski kvantitativni hedge fond koji sada financira DeepSeek. U jednom rijetkom intervjuu rekao je: “Dugi niz godina kineske tvrtke navikle su da drugi rade tehnološke inovacije, dok smo se mi usredotočili na monetizaciju aplikacija – ali to nije neizbježno. U ovom valu, naša početna točka nije iskoristiti priliku za brzu zaradu, već doseći tehničku granicu i potaknuti razvoj cijelog ekosustava... Vjeruje se da bi Kina, kako se gospodarstvo razvija, trebala postupno postati suradnik umjesto besplatnog jahanja.”
Zašto su pale američke tehnološke dionice?
Stotine milijardi dolara izbrisane su s velikih tehnoloških dionica nakon što se vijest o performansama chatbota DeepSeek uvelike proširila tijekom vikenda. Tajming je bio značajan jer su posljednjih dana američke tehnološke tvrtke obećale još stotine milijardi dolara za ulaganja u umjetnu inteligenciju – od čega će velik dio otići u izgradnju računalne infrastrukture i izvora energije potrebnih, kako se općenito smatralo, za postizanje cilja umjetne inteligencije. opća inteligencija. Čini se da izvedba DeepSeeka u najmanju ruku dovodi u pitanje taj narativ.
Što je zabrinjavajuće za Nvidiju?
Nvidia je jedna od tvrtki koja je najviše dobila od procvata AI. Prošao je put od proizvođača grafičkih kartica za video igre do dominantnog proizvođača čipova do halapljivo gladne AI industrije. Uspoređivali su ga sa skromnim trgovcem pijucima i kantama u Kaliforniji iz 19. stoljeća, koji se slučajno našao na licu mjesta kad se dogodila zlatna groznica i tako postao golemi dobavljač najbogatije svjetske industrije. Tehnološke tvrtke koje postrance gledaju DeepSeek vjerojatno se pitaju trebaju li sada kupiti što više Nvidijinih alata. Nvidijina tržišna vrijednost u ponedjeljak je pala za 600 milijardi dolara.
Što DeepSeek ne radi?
NNe doseže zasad opću umjetnu inteligenciju, prag na kojem umjetna inteligencija počinje razmišljati i kojem OpenAI i drugi u Silicijskoj dolini teže. Sam Altman, izvršni direktor OpenAI-ja, upozorio je da proboj vjerojatno neće biti neizbježan. Ali čini se da čini ono što drugi mogu uz djelić cijene.
Je li uspon DeepSeeka dobra vijest?
Jedna od mogućnosti je da bi napredne mogućnosti umjetne inteligencije sada bile moguće postići bez ogromne količine računalne snage, mikročipova, energije i rashladne vode za koje se prije smatralo da su potrebni. Kao i sa svim tehnološkim otkrićima, vrijeme će pomoći pokazati koliko je to zapravo posljedično.