Týždeň 2025-04
AI revolúcia v AI revolúcii. Kto by to bol povedal? @vlkodotnet
Udalosť týždňa: DeepSeek hýbe trhom
DeepSeek okrem modelu V3 (písal som o ňom minulý týždeň) uviedli aj tzv. "reasoning model" DeepSeek R1.
Dnes, v pondelok padli akcie Nvidie o 12 %, a vy si určite poviete, že: Čooo? Aký má súvis nejaký open source AI model s akciami Nvidie?
Začneme pekne poporiadku. DeepSeek je prelomový v spôsobe, ako ho vytrénovali. Keďže bol trénovaný v Číne, kde nemajú k dispozícii tisíce najnovších Nvidia čipov, tak museli improvizovať. Namiesto toho, aby váhy modelu mali presnosť 32 desatinných miest, tak použili iba 8. Namiesto toho, aby výstupom modelu bolo jedno nasledujúce slovo, tak odhadujú dve. Namiesto jedného veľkého modelu trénovali viac menších expertných modelov. Pri samotnom behu sa potom z modelu o veľkosti 671 miliárd využíva iba jeho expertná 37-miliardová časť. Navyše pre tréning vybrali špeciálny set tokenov, ktorý následne prešiel kontrolovaným fine-tuningom zakončený Reinforcement Learningom. To sú také technické pojmy, ale výsledok je, že takýto tréning funguje aj opakovane, preto ako ukážku pripravili modely Llama 3.x a Qwen 2.5, ktoré boli pretrénované rovnakým spôsobom ako DeepSeek R1. Výsledkom je rýchlejší a lacnejší model na prevádzku, ktorý dokáže konkurovať oveľa väčším a drahším (ako na prevádzku, tak aj tréning) modelom od OpenAI alebo Google.
Možno pre porovnanie, ako prebieha učenie veľkých jazykových modelov od OpenAI, Meta, Google. Prvým krokom je mať obrovský cluster najdrahších AI kariet. To preto, lebo pri učení sa všetky tie parametre, čo máte k dispozícii, nezmestia do fyzickej pamäte jedného stroja. Vy potom lejete vedomosti do takéhoto modelu, trénujete, nalievate, trénujete. To nalievanie vedomostí je celkom veda, najlepšie sa trénuje podobne ako nás ľudí. Najskôr jednoduchšie témy, potom zložitejšie, záleží na poradí, pretože, niektoré vedomosti môžu rozbiť tie predtým. Dlho to trvá a je to drahé, lebo to potrebuje veľa času a špeciálneho hardvéru. Samozrejme od Nvidie.
Vo výsledku to znamená, že ak niekto ako DeepSeek našiel lacnejší a efektívnejší spôsob, tak všetky tie drahé datacentrá, ktoré plánujú postaviť veľkí hráči na trhu a zaplniť drahým hardvérom od Nvidie, nemusia už vzniknúť. A práve aktuálna trhová hodnota Nvidie bola postavená na tom, že takéto datacentrá v budúcnosti vzniknú. Viac zaujímavých informácií v nasledujúcom Xitter threade.
Čo bude nasledovať? Keďže všetky postupy a modely sú open source, tak o pár mesiacov budú k dispozícii nové a lepšie modely. Také naše západné, lebo DeepSeek je čínsky a má svojský názor na Taiwan a problematické úseky čínskej histórie. Aj veľkí hráči ako OpenAI a Google vylepšia podobným spôsobom svoje existujúce modely, lebo sa to oplatí. Akurát tá Nvidia môže na konci ťahať za kratší koniec, pretože na to nebude potrebných tisíce nových výpočtových AI kariet.
Troška mimo záujem sa ale takto dostala iniciatíva prezidenta USA Bidena, ktorý rozdelil svet na 3 časti. Tí ktorí môžu mať najnovšie AI čipy, koľko chcú. Tí, ktorí ich môžu mať len obmedzené množstvo (tu mimochodom patrí aj Slovensko, Česko, alebo také Poľsko). A tí, čo nemajú žiaden nárok, kde patrí Čína a Rusko. Zaujímavé je, prečo vznikla tá druhá skupina. Zistilo sa, že sme len takí malí prištipkári a len sme prepredávali hi-end technológiu do Číny. To vyvoláva otázky, či naozaj DeepSeek má k dispozícii naozaj len to, čo tvrdí. A či úspechom jeho vzniku nie sú tajné farmy najnovšieho AI hardware.
Čo k tomu dodať nakoniec? Len, že Trump hneď po inaugurácii oznámil v najbližších rokoch 500-miliardovú investíciu do AI na území USA. Samozrejme nie od štátu, ale od súkromných subjektov ako Softbank, Oracle, OpenAI, Microsoft a iní. Čo obratom Elon Musk zhodnotil, že na to aj tak nemajú dosť peňazí.
HW okienko
Vyšli prvé recenzie Nvidie RTX 5090. Vo výsledku hovoria, že za svojich o 25 % viac peňazí, dostanete cca o 25 % viac výkonu pri o 25 % vyššej spotrebe. Pocitovo najviac výkonu dostanete v hrách s vysokým rozlíšením pri zapnutí DLSS 4. A tiež AI výkon vyzerá obstojne. Zatiaľ ešte nefungujú všetky AI testy, ale vyzerá to, že tu bude nárast výkonu a teda potenciál návratu investície najvyšší.
Samsung mal svoju tradičnú konferenciu Galaxy Unpacked 2025. Ako vždy predstavil tenšie, lepšie a rýchlejšie telefóny. Procesor majú nový Snapdragon 8 Elite a za zmienku stojí, že sa konečne vykašľali na Bixby a plne integrujú Google Gemini. Novinári si mohli aj obzrieť (ale nedotknúť sa) projektu Moohan, teda prvého Android XR headsetu.
Biznis okienko
Po nudných AI novinkách niečo naozaj zaujímavého. Report o stave video hier v roku 2024, a čo nás čaká v roku 2025. Peňazí sa na hry minulo viac ako v roku 2023, ale stále trošičku menej ako v roku 2021. Prepúšťalo sa veľa herných vývojárov. Hrá sa menej na mobiloch, lebo sa viac konzumuje short video TikTok/Reels obsah. Viac zaujímavostí o tomto segmente nájdete vo viac ako 220-stranovej prezentácii.
Už kratší report je o stave mobilných aplikácií v roku 2024. Stiahli sme menej aplikácií, ale zaplatili viac za nové a predplatné. Úspech mali najviac AI aplikácie.
TikTok ešte stále nemá vyhraté. Aj bol na chvíľu vypnutý, aj znova funguje v USA. A kde je hrozba, tam je aj príležitosť. Preto Bluesky a Xitter predstavili podporu video feedov.
Aby ste si prečítali nasledujúci článok, tak musíte použiť trošku toho Google-Fu. Otvorte si anonymné okno, dajte do Googlu nasledujúcu linku, kliknite a môžete si zadarmo prečítať článok o 10 najväčších startupoch v odvetví zbrojárstva. Práve zbrojárstvo bude mať v najbližších rokoch na ružiach ustlané. Budú vojenské drony a roboty, bude vojenská AI a tiež vojenské satelity.
Keď už sme pri robotoch a automatizácii, tak podľa posledného reportu o používaní robotov vo výrobe máme na Slovensku nadpriemerných 201 robotov na 10k pracujúcich.
Security okienko
PowerSchool je v USA niečo ako naše Edupage, akurát ich portfólio projektov je oveľa širšie a zahŕňa aj obslužný software pre školy, e-learning, atď. Pred cca 2 týždňami ale mali prienik a boli ukradnuté osobné údaje o cca 62 miliónoch žiakov a 9,5 milióna učiteľov. Au.
Aby sme sa škodoradostne netešili, že u nás v EÚ je to lepšie, tak veterné elektrárne v strednej Európe sú ovládané pomocou nešifrovaného rádiového spojenia.
AI okienko
Najdôležitejšia časť AI noviniek je v téme týždňa. Ale o novinky nebola núdza. Začneme tradične novými AI modelmi. Infigen vie generovať fotorealistické scény prírody a bytových záberov.
Tencent zasa uviedol AI model Hunyuan3D 2.0. Kto pozná Tencent, tak vie, že je to výrobca hier, takže model generuje 3D modely a ich textúry.
OpenAI uviedla zatiaľ najdôležitejšiu novinku tohoto roku. Operator je AI agent, ktorý za vás bude robiť veci v stanovenom čase. Dostupný je momentálne iba v najdrahšom 200-dolárovom paušále.
Pre fanúšikov Perplexity pribudol mobilný asistent pre Android zariadenia. Integrácie do systému na úrovni Gemini nedosahuje. Ale Perplexity vie vďaka svojmu skenovaniu webu poznať odpovede aj na otázky tém starých niekoľko dní.
.NET okienko
ConsoleApplicationBuilder je taká pomôcka pre tých, ktorí chcú využívať Microsoft DI aj v konzolových aplikáciách.
Performance porovnanie .NET 8 a 9 odhalilo, že .NET 9 používa špeciálny GarbageCollectionAdaptationMode
mód, ktorý vám zoberie troška zo surového výkonu v počte requestov, ale odmenou bude oveľa menšia spotreba RAM.
Nakoniec taká menšia polemika. Projekt FluentAssertions zmenil svoju licenciu z Apache 2 na komerčnú. Čo myslíte, je lepšie, ak projekt radšej firma forkne a vyvíja ďalej jeho komerčnú licenciu, alebo ak zmení licenčný model?
Linky na záver
Navrhnúť a vyrobiť si svoj vlastný notebook s ARM procesorom v dnešnej dobe už nemusí byť taká nemožná úloha.
Radi by ste sa zbavili závislosti na niektorých stránkach a blokovanie vám príde ako príliš radikálne riešenie? Tak skúste TabBoo. Nastavíte si stránky, ktoré chcete obmedziť a TabBoo vás pri ich návšteve náhodne vyľaká.
Ako šéf máte občas v tíme aktívnych ľudí (občas je to šéf, občas kolegovia), ktorí prichádzajú s nápadmi. Občas je ťažké povedať nie. Preto vznikla stránka, ktorá vám s tým pomôže.
Vizuálna bodka na záver
História sa opakuje v cykloch.