DeepSeek planira lansirati svoj novi veliki jezični model DeepSeek-R2 između 15. i 30. kolovoza 2025. Informacija je otkrivena tijekom interakcije s vlastitim AI modelom tvrtke, što upućuje na skoru objavu, svega nekoliko dana nakon izlaska ChatGPT-5.
DeepSeek smiješi se Američka blokada
Očekuje se da će DeepSeek-R2 donijeti veliki skok u arhitekturi uvođenjem naprednijeg Mixture of Experts (MoE) sustava. Model će koristiti poboljšanu mrežu za usmjeravanje (gating network) koja će učinkovitije obrađivati zadatke s intenzivnim zaključivanjem. Prema izvorima upoznatima s razvojem, mogao bi doseći do 1,2 bilijuna parametara, gotovo dvostruko više od DeepSeek-R1 s 671 milijardu. Ipak, to je i dalje manje od ChatGPT-4/5 koji prelazi 1,8 bilijuna parametara.
DeepSeek unutar Geely automobila
U strateškom potezu prema tehnološkoj neovisnosti, model je u potpunosti treniran na Huawei Ascend 910B čipovima. Huawei-jev klaster, s FP16 performansama od 512 PFLOPS pri 82% iskorištenosti, postiže oko 91% performansi Nvidia A100 klastera. Analitičari ovo vide kao ključan korak u smanjenju kineske ovisnosti o američkom AI hardveru.
Trošak treniranja DeepSeek-R2 bio je čak 97% manji u odnosu na GPT-4 zahvaljujući domaćem hardveru i optimizacijama. Očekuje se da će DeepSeek ponuditi API pristup po nižim cijenama, što bi moglo uzdrmati tržišne modele koje trenutačno predvode OpenAI i Anthropic. Vijest o nadolazećem modelu već je potaknula rast kineskih tehnoloških dionica. Proizvođač AI čipova Cambricon zabilježio je skok od 20%, a tržišna kapitalizacija mu je premašila 355 milijardi juana (oko 49,7 milijardi dolara).
DeepSeek – trebali ChatGPT strahovati?
Paralelno, Huawei je predstavio novi AI okvir za zaključivanje pod nazivom Unified Cache Manager (UCM). Namijenjen ubrzanju izvođenja modela, UCM optimizira upravljanje KV Cache podacima kroz memorijske razine poput HBM-a, DRAM-a i SSD-ova. U testiranjima s China UnionPay, Huawei je zabilježio do 90% manju latenciju i čak 22 puta veći protok podataka. Planirano je da UCM postane otvorenog koda u rujnu.
Huawei Mate 80 RS donosi premium dizajn, napredan zaslon i inovacije u kameri
Zajedno, lansiranje DeepSeek-R2 i uvođenje Huawei-jevog UCM-a predstavljaju značajnu prekretnicu u kineskim AI ambicijama. Ovi potezi najavljuju budućnost u kojoj Kina može razvijati i pokretati vrhunske AI sustave bez oslanjanja na zapadne čipove i softverske alate.
Nino Krstačić
Autor mnogih IT članaka, svojevremeno suvlasnik IT portala. Gaji velike osjećaje prema IT sektoru te uživa u njemu (naravno koliko mu to primarni posao dopusti). Svaki članak piše na sebi svojstven način te ima poseban pristup informacijama i donošenju istih.