Týždeň 2025-04

AI revolúcia v AI revolúcii. Kto by to bol povedal? @vlkodotnet

Udalosť týždňa: DeepSeek hýbe trhom

DeepSeek okrem modelu V3 (písal som o ňom minulý týždeň) uviedli aj tzv. "reasoning model" DeepSeek R1.

GitHub - deepseek-ai/DeepSeek-R1
Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub.

Dnes, v pondelok padli akcie Nvidie o 12 %, a vy si určite poviete, že: Čooo? Aký má súvis nejaký open source AI model s akciami Nvidie?

Začneme pekne poporiadku. DeepSeek je prelomový v spôsobe, ako ho vytrénovali. Keďže bol trénovaný v Číne, kde nemajú k dispozícii tisíce najnovších Nvidia čipov, tak museli improvizovať. Namiesto toho, aby váhy modelu mali presnosť 32 desatinných miest, tak použili iba 8. Namiesto toho, aby výstupom modelu bolo jedno nasledujúce slovo, tak odhadujú dve. Namiesto jedného veľkého modelu trénovali viac menších expertných modelov. Pri samotnom behu sa potom z modelu o veľkosti 671 miliárd využíva iba jeho expertná 37-miliardová časť. Navyše pre tréning vybrali špeciálny set tokenov, ktorý následne prešiel kontrolovaným fine-tuningom zakončený Reinforcement Learningom. To sú také technické pojmy, ale výsledok je, že takýto tréning funguje aj opakovane, preto ako ukážku pripravili modely Llama 3.x a Qwen 2.5, ktoré boli pretrénované rovnakým spôsobom ako DeepSeek R1. Výsledkom je rýchlejší a lacnejší model na prevádzku, ktorý dokáže konkurovať oveľa väčším a drahším (ako na prevádzku, tak aj tréning) modelom od OpenAI alebo Google.

Možno pre porovnanie, ako prebieha učenie veľkých jazykových modelov od OpenAI, Meta, Google. Prvým krokom je mať obrovský cluster najdrahších AI kariet. To preto, lebo pri učení sa všetky tie parametre, čo máte k dispozícii, nezmestia do fyzickej pamäte jedného stroja. Vy potom lejete vedomosti do takéhoto modelu, trénujete, nalievate, trénujete. To nalievanie vedomostí je celkom veda, najlepšie sa trénuje podobne ako nás ľudí. Najskôr jednoduchšie témy, potom zložitejšie, záleží na poradí, pretože, niektoré vedomosti môžu rozbiť tie predtým. Dlho to trvá a je to drahé, lebo to potrebuje veľa času a špeciálneho hardvéru. Samozrejme od Nvidie.

Vo výsledku to znamená, že ak niekto ako DeepSeek našiel lacnejší a efektívnejší spôsob, tak všetky tie drahé datacentrá, ktoré plánujú postaviť veľkí hráči na trhu a zaplniť drahým hardvérom od Nvidie, nemusia už vzniknúť. A práve aktuálna trhová hodnota Nvidie bola postavená na tom, že takéto datacentrá v budúcnosti vzniknú. Viac zaujímavých informácií v nasledujúcom Xitter threade.

Thread by @morganb on Thread Reader App
@morganb: 🧵 Finally had a chance to dig into DeepSeek’s r1… Let me break down why DeepSeek’s AI innovations are blowing people’s minds (and possibly threatening Nvidia’s $2T market cap) in simple terms... 0/ first of...…

Čo bude nasledovať? Keďže všetky postupy a modely sú open source, tak o pár mesiacov budú k dispozícii nové a lepšie modely. Také naše západné, lebo DeepSeek je čínsky a má svojský názor na Taiwan a problematické úseky čínskej histórie. Aj veľkí hráči ako OpenAI a Google vylepšia podobným spôsobom svoje existujúce modely, lebo sa to oplatí. Akurát tá Nvidia môže na konci ťahať za kratší koniec, pretože na to nebude potrebných tisíce nových výpočtových AI kariet.

Troška mimo záujem sa ale takto dostala iniciatíva prezidenta USA Bidena, ktorý rozdelil svet na 3 časti. Tí ktorí môžu mať najnovšie AI čipy, koľko chcú. Tí, ktorí ich môžu mať len obmedzené množstvo (tu mimochodom patrí aj Slovensko, Česko, alebo také Poľsko). A tí, čo nemajú žiaden nárok, kde patrí Čína a Rusko. Zaujímavé je, prečo vznikla tá druhá skupina. Zistilo sa, že sme len takí malí prištipkári a len sme prepredávali hi-end technológiu do Číny. To vyvoláva otázky, či naozaj DeepSeek má k dispozícii naozaj len to, čo tvrdí. A či úspechom jeho vzniku nie sú tajné farmy najnovšieho AI hardware.

Biden administration announces new AI chip export controls - SiliconANGLE
Biden administration announces new AI chip export controls - SiliconANGLE

Čo k tomu dodať nakoniec? Len, že Trump hneď po inaugurácii oznámil v najbližších rokoch 500-miliardovú investíciu do AI na území USA. Samozrejme nie od štátu, ale od súkromných subjektov ako Softbank, Oracle, OpenAI, Microsoft a iní. Čo obratom Elon Musk zhodnotil, že na to aj tak nemajú dosť peňazí.

Trump highlights partnership investing $500 billion in AI
President Donald Trump talked up a joint venture investing up to $500 billion for infrastructure tied to AI by a new partnership formed by OpenAI, Oracle and SoftBank.

HW okienko

Vyšli prvé recenzie Nvidie RTX 5090. Vo výsledku hovoria, že za svojich o 25 % viac peňazí, dostanete cca o 25 % viac výkonu pri o 25 % vyššej spotrebe. Pocitovo najviac výkonu dostanete v hrách s vysokým rozlíšením pri zapnutí DLSS 4. A tiež AI výkon vyzerá obstojne. Zatiaľ ešte nefungujú všetky AI testy, ale vyzerá to, že tu bude nárast výkonu a teda potenciál návratu investície najvyšší.

Nvidia GeForce RTX 5090 Founders Edition review: Blackwell commences its reign with a few stumbles
More performance, power, and features — plus some driver teething pains.

Samsung mal svoju tradičnú konferenciu Galaxy Unpacked 2025. Ako vždy predstavil tenšie, lepšie a rýchlejšie telefóny. Procesor majú nový Snapdragon 8 Elite a za zmienku stojí, že sa konečne vykašľali na Bixby a plne integrujú Google Gemini. Novinári si mohli aj obzrieť (ale nedotknúť sa) projektu Moohan, teda prvého Android XR headsetu.

Galaxy Unpacked 2025: everything announced at the January event
Samsung unveiled the Galaxy S25, S25 Plus and S25 Ultra, and new AI features. It also teased the Galaxy S25 Edge, its rumored ‘slim’ phone.

Biznis okienko

Po nudných AI novinkách niečo naozaj zaujímavého. Report o stave video hier v roku 2024, a čo nás čaká v roku 2025. Peňazí sa na hry minulo viac ako v roku 2023, ale stále trošičku menej ako v roku 2021. Prepúšťalo sa veľa herných vývojárov. Hrá sa menej na mobiloch, lebo sa viac konzumuje short video TikTok/Reels obsah. Viac zaujímavostí o tomto segmente nájdete vo viac ako 220-stranovej prezentácii.

PRESENTATION: The State of Video Gaming in 2025 — MatthewBall.co
A 220-page presentation on the past, present and potential future of the video game industry.

Už kratší report je o stave mobilných aplikácií v roku 2024. Stiahli sme menej aplikácií, ale zaplatili viac za nové a predplatné. Úspech mali najviac AI aplikácie.

2025 State of Mobile
Sensor Tower’s annual report highlights the latest trends on mobile, from AI to retail to mobile gaming

TikTok ešte stále nemá vyhraté. Aj bol na chvíľu vypnutý, aj znova funguje v USA. A kde je hrozba, tam je aj príležitosť. Preto Bluesky a Xitter predstavili podporu video feedov.

Bluesky and X launch new video feeds amid TikTok uncertainties
Seizing the chance to fill a potential TikTok-sized hole.

Aby ste si prečítali nasledujúci článok, tak musíte použiť trošku toho Google-Fu. Otvorte si anonymné okno, dajte do Googlu nasledujúcu linku, kliknite a môžete si zadarmo prečítať článok o 10 najväčších startupoch v odvetví zbrojárstva. Práve zbrojárstvo bude mať v najbližších rokoch na ružiach ustlané. Budú vojenské drony a roboty, bude vojenská AI a tiež vojenské satelity.

The 10 Defense Tech Startups to Watch in 2025
The upstart drone makers, aerospace firms and weapons manufacturers poised to up-end the business of war.

Keď už sme pri robotoch a automatizácii, tak podľa posledného reportu o používaní robotov vo výrobe máme na Slovensku nadpriemerných 201 robotov na 10k pracujúcich.

Global Robot Density in Factories Doubled in Seven Years
Robot adoption in factories around the world continues at high speed: The new global average robot density reaches a record 162 units per 10,000 employees in 2023 - more than double the number measured only seven years ago (74 units). This is according to the World Robotics 2024 report, presented by the International Federation of Robotics (IFR).

Security okienko

PowerSchool je v USA niečo ako naše Edupage, akurát ich portfólio projektov je oveľa širšie a zahŕňa aj obslužný software pre školy, e-learning, atď. Pred cca 2 týždňami ale mali prienik a boli ukradnuté osobné údaje o cca 62 miliónoch žiakov a 9,5 milióna učiteľov. Au.

Data breach hitting PowerSchool looks very, very bad
Schools are now notifying families their data has been stolen.

Aby sme sa škodoradostne netešili, že u nás v EÚ je to lepšie, tak veterné elektrárne v strednej Európe sú ovládané pomocou nešifrovaného rádiového spojenia.

Researchers say new attack could take down the European power grid
Power grid in Central Europe uses unencrypted radio signals to add and shed loads.

AI okienko

Najdôležitejšia časť AI noviniek je v téme týždňa. Ale o novinky nebola núdza. Začneme tradične novými AI modelmi. Infigen vie generovať fotorealistické scény prírody a bytových záberov.

Home | Infinigen
Description will go into a meta tag in <head />

Tencent zasa uviedol AI model Hunyuan3D 2.0. Kto pozná Tencent, tak vie, že je to výrobca hier, takže model generuje 3D modely a ich textúry.

GitHub - Tencent/Hunyuan3D-2: High-Resolution 3D Assets Generation with Large Scale Hunyuan3D Diffusion Models.
High-Resolution 3D Assets Generation with Large Scale Hunyuan3D Diffusion Models. - Tencent/Hunyuan3D-2

OpenAI uviedla zatiaľ najdôležitejšiu novinku tohoto roku. Operator je AI agent, ktorý za vás bude robiť veci v stanovenom čase. Dostupný je momentálne iba v najdrahšom 200-dolárovom paušále.

OpenAI’s new Operator AI agent can do things on the web for you
It’s launching as a “research preview.”

Pre fanúšikov Perplexity pribudol mobilný asistent pre Android zariadenia. Integrácie do systému na úrovni Gemini nedosahuje. Ale Perplexity vie vďaka svojmu skenovaniu webu poznať odpovede aj na otázky tém starých niekoľko dní.

Perplexity now has a mobile assistant on Android
The battle of the AI assistants.

.NET okienko

ConsoleApplicationBuilder je taká pomôcka pre tých, ktorí chcú využívať Microsoft DI aj v konzolových aplikáciách.

Peter Ritchie’s Blog - Announcing ConsoleApplicationBuilder, DI in console applications, simply
Peter Ritchie

Performance porovnanie .NET 8 a 9 odhalilo, že .NET 9 používa špeciálny GarbageCollectionAdaptationMode mód, ktorý vám zoberie troška zo surového výkonu v počte requestov, ale odmenou bude oveľa menšia spotreba RAM.

Comparing Raw ASP.NET Request Throughput across Versions: 8.0 to 9.0 Edition
Once again I’m taking a look at the newish .NET release and how it compares to the previous release - this time .NET 9.0 from .NET 8.0. I’ll run my simple load tests to compare performance and also discuss a number of anecdotes from running .NET 9.0 in production apps for the last couple of months.

Nakoniec taká menšia polemika. Projekt FluentAssertions zmenil svoju licenciu z Apache 2 na komerčnú. Čo myslíte, je lepšie, ak projekt radšej firma forkne a vyvíja ďalej jeho komerčnú licenciu, alebo ak zmení licenčný model?

.NET OSS Projects: Better to Re-license or Die?
The decision maintainers face when ‘free’ just ain’t cutting it.

Linky na záver

Navrhnúť a vyrobiť si svoj vlastný notebook s ARM procesorom v dnešnej dobe už nemusí byť taká nemožná úloha.

Creation | anyon_e
Creating a highly-integrated open-source laptop from scratch. Power in your hands.

Radi by ste sa zbavili závislosti na niektorých stránkach a blokovanie vám príde ako príliš radikálne riešenie? Tak skúste TabBoo. Nastavíte si stránky, ktoré chcete obmedziť a TabBoo vás pri ich návšteve náhodne vyľaká.

TabBoo
Add a random jumpscare to sites you’re trying to avoid

Ako šéf máte občas v tíme aktívnych ľudí (občas je to šéf, občas kolegovia), ktorí prichádzajú s nápadmi. Občas je ťažké povedať nie. Preto vznikla stránka, ktorá vám s tým pomôže.

Master the Art of the Product Manager ‘No’
Keep your meetings smooth and your priorities on track!

Vizuálna bodka na záver

História sa opakuje v cykloch.