Týždenník

Týždeň 2025-43

vlko

28 Oct 2025 • 8 min read

Začal som vylepšovať svoje skilly a dozvedel som sa, že AI stráca dych. @vlkodotnet

Zamyslenie týždňa: Stráca AI dych?

Ak nemáte radi AI, tak dnes môžete väčšinu častí dnešného týždenníka preskočiť. Ale bol taký nudný týždeň z technologického pohľadu a mal som čas na premýšľanie. Čo je vždy zlá správa.

Dnes ma k zamysleniu inšpiroval rozhovor s Andrejom Karpathym. Má skoro dve hodiny a aby ste ho nemuseli celý počúvať, tak Andrej vytvoril súhrn hlavných myšlienok. Je to trocha long read s odkazmi na jeho iné myšlienky.

My pleasure to come on Dwarkesh last week, I thought the questions and conversation were really good.

I re-watched the pod just now too. First of all, yes I know, and I'm sorry that I speak so fast :). It's to my detriment because sometimes my speaking thread out-executes my… https://t.co/bnPSrY74px
— Andrej Karpathy (@karpathy) October 18, 2025

V rozhovore je optimistický a stále tvrdí, že všeobecná umelá inteligencia by mohla byť dostupná v horizonte 10 rokov, dovtedy nás čaká dekáda agentov. Musíme zmeniť spôsob, ako sa umelé inteligencie učia. Umelé inteligencie sme predplnili poznaním, namiesto toho, aby sme sa ich naučili sa samé vzdelávať. Schopnosť pamätať si čo najviac, by mala nahradiť schopnosť generalizovať riešenie problémov. Tak ako to je u nás ľudí. Čo sa týka agentov, tak by mali byť viac interaktívnejší. Nechať bežať agenta a potom z neho dostať tisícky riadkov kódu je pre človeka, čo ich má kontrolovať, frustrujúce. Agenti by mali pracovať s postupnými logickými blokmi, ktoré my ako ľudia vieme plynulejšie chápať a spracovať. Čo na to poviete vy? Ja stále beriem programovanie ako tvorivý proces a nechcem kontrolovať kód niekoho iného.

Skills vs Memory

Minulý týždeň som písal o tom, že Anthropic predstavil koncept skillov. Tie budú podľa mňa oveľa užitočnejší koncept ako pamäť, tak ako ju poznáme v ChatGPT. Pamäť funguje tak, že ak raz urobíte nejakú úlohu, tak ChatGPT si vie zapamätať postup a následne ho v budúcnosti zopakovať. Je to jednoduché, stačí si raz niečo s GPT vykecať a nabudúce už AI bude vedieť, čo má robiť.

To môže spôsobiť jeden problém. Občas si vyhľadáte nejakú nerelevantnú blbosť, lebo ste s kamarátmi na pive, alebo si váš účet na chvíľu požičajú deti. Čím viac potom pamäť používate, tým viac musí GPT v pamäti vyhľadávať, čo nie je operácia s nulovou časovou zložkou. Občas možno niečo chcete z pamäte vymazať, ale stále zachovať obsah chatu. Navyše to nemôžete zdieľať napríklad s manželkou. No proste otrava.

Skill je niečo ako vopred pripravený spôsob, ako riešiť konkrétnu úlohu. Potrebujete raz za čas overiť nejaké tvrdenie s platnou legislatívou? Vygenerujete si potrebný skill. Potrebujete zanalyzovať mesačný rozpočet, ktorý sa skladá z viacerých krokov, ako otvoriť 3 excel súbory, prekopírovať dáta a vytvoriť z toho prezentáciu? Vygenerujete potrebný skill. Potrebujete troška ozvláštniť nejaký dokument napríklad o ilustrácie? Vygenerujete potrebný skill. Potrebujete zanalyzovať logy u vás na disku, pomocou série špecifických príkazov? Vygenerujete potrebný skill, pretože skilly môžu v rámci Claude Code spúšťať príkazy na vašom počítači.

Skilly môžete medzi sebou zdieľať, môžete vytvoriť sadu najužitočnejších skillov pre vašich zamestnancov. A samozrejme existuje skill na generovanie skillov, lebo nie všetci majú potrebné znalosti a čas ich generovať.

Nakoniec už len, že v rámci skillu definujete podmienky, kedy sa spúšťa, a Claude sa už samo postará, aby ten správny skill pri otázke vybralo.

Ak by ste predsa len mali potrebu využívať pamäť aj v Claude, tak najnovšie pridali jej podporu, aj keď asi od nej neočakávajte to isté, ako od pamäte v ChatGPT.

Do tretice ešte jedna novinka od Anthropicu. Ak ste sa začítali do toho, čo skilly vedia, tak vám určite napadlo, že niektoré skilly nechcete púšťať priamo na svojom počítači. Preto sa Claude Code najnovšie bude dať púšťať aj v prehliadači.

Asi už nijako neskryjem, že práve Claude je môj aktuálne najobľúbenejší AI model. Musím povedať, že v Anthropicu majú dobrú víziu, ako ho rozvíjať.

Windows sa chce s vami rozprávať

Minulý týždeň som omylom preskočil túto zaujímavú novinku. Microsoft uviedol novú volaciu frázu "Hey, copilot!", ktorá prepne váš počítač do módu rozhovoru. Vy potom môžete využívať Copilot Voice, ktorý bude rozumieť vášmu hlasu a naopak bude čítať vygenerovanú odpoveď vám. Copilot Vision umožní zasa rozumieť obsahu na vašej obrazovke a pomocou Copilot Actions vykonať príkazy. To všetko znie dobre, ale viete si predstaviť sa rozprávať so svojím počítačom? Teda občas asi áno, ale aj tak budem vyzerať pred ostatnými ľuďmi divne, že neviem priamo chytiť do ruky klávesnicu a myš a robím takéto divadlo.

Aby ten pocit rozprávania sa so svojím počítačom nebol úplne nekomfortný, tak Microsoft predstavil Copilot Mico. Čo je taká hýbajúca sa škvrna, ktorú viete pri troche snahy transformovať na starého dobrého Clippyho.

BIZ okienko

Waymo robotaxíky by mali budúci rok obohatiť ulice Londýna. Mám na to veľa silných názorov. Na jednej strane mám rád pocit riadenia auta, na druhej strane je hromadná doprava efektívnejšia. Namiesto robotaxíkov potrebujeme viac roboMHD.

Vyzerá to, že India bude mať problém s príchodom AI automatizácie, ktorá začína nahrádzať call centrá za AI chatboty.

Mete a TikToku hrozia v EÚ sankcie až do výšky 6 % ročného obratu za nedodržiavanie DSA (Digital Services Act).

AI okienko

Dnes má už svoj vlastný prehliadač kadekto, tak prečo nie OpenAI? Volá sa Atlas a keď mu dáte prístup k heslám a kreditnej karte, tak zvládne za vás aj nakúpiť.

DeepSeek uviedol nový model DeepSeek-OCR, ktorý zvládne z obrázkov extrahovať text.

Nebol by to Andrej Karpathy, keby sa neinšpiroval týmto modelom a nezaviedol nový termín vLLM, teda vizuálne LLM. Textové tokeny sú neefektívne, zle komprimujú informáciu. Nezachytávajú vizuálne prvky. Ak by sme namiesto transformeru naučili model spracovávať len obrázky, tak možno by sme dosiahli lepšiu funkčnosť modelu.

I quite like the new DeepSeek-OCR paper. It's a good OCR model (maybe a bit worse than dots), and yes data collection etc., but anyway it doesn't matter.

The more interesting part for me (esp as a computer vision at heart who is temporarily masquerading as a natural language… https://t.co/AxRXBdoO0F
— Andrej Karpathy (@karpathy) October 20, 2025

Linky na záver

Samsung uviedol Galaxy XR. Ten má veľmi podobné parametre ako Apple Vision Pro, ale stojí polovicu jeho ceny. Oproti Vision Pro má Netflix aplikáciu, je ľahší a má porovnateľnú batériu.

Lego uviedlo set Game Boy a netrvalo dlho a objavili sa projekty, ktoré z neho vedia spraviť plnohodnotný Game Boy.

/dev/null je plnohodnotná ACID databáza. V robote sme sa pohádali, či je pojem databáza len o ukladaní dát, alebo aj o ich čítaní. Lebo to druhé /dev/null určite nespĺňa.

Why /dev/null Is an ACID Compliant Database

/dev/null is web scale