Týždeň 2026-15
Dnes veľa tém nebolo, tak som mal čas venovať sa téme tokenovej ekonomiky. @vlkodotnet
Zamyslenie týždňa: Ekonomika tokenov
Za úspech v stále nových investičných kolách Anthropic, OpenAI a iných môže skutočnosť, že očakávania trhu sú, že AI bude používať každý a zmení to celý priemysel. Čo ale začíname pozorovať, je viditeľný nedostatok potrebného železa na ktorom by AI inferencia mohla bežať. Určite sa pýtate, ako je to možné, veď Nvidia predáva neuveriteľné množstvo výpočtového hardvéru. Nuž, tak nejak viac ako polovica plánovaných AI datacentier bola potichu zrušená alebo odložená. Dôvodov je viac, firmy nakupujú GPU, aby sa dostali k najnovším modelom GPU, niet však dostatok datacentier, do ktorých by daný GPU výkon nainštalovali. A tie, čo už existujú, občas nemajú dostatok energie na ich beh, a tak čakajú nečinne až bude dostupná patričná energetická štruktúra.
Nemáme datacentrá, ale ľudia začínajú viac a viac využívať AI modely. Nielen tak ako kedysi na pokec, ale v spojení s AI agentmi. Kto to raz skúsi, zistí, aké to je užitočné, a už niet cesty späť. A kde niet cesty späť a je nedostatok výpočtového výkonu, tam prichádzajú obmedzenia. Užívatelia sa stále viac a viac sťažujú, že v Claude narážajú na čím ďalej striktnejšie limity tokenov. A aj Anthropic sprísňuje to, kde sa môžu používať. Na OpenClaw si musíte dokupovať tokeny osobitne, užívatelia reportujú, že boli zablokovaní, keď používali Claude Code v headless móde. A dokonca Enterprise zákazníci prišli o výhodu bundlovaných tokenov a budú platiť za reálnu spotrebu (samozrejme oni majú dohodnuté lepšie ceny).

Aby toho nebolo dosť, tak nový Opus 4.7 bol trénovaný na novom tokenizeri, ktorý prináša v niektorých prípadoch až 47 % nárast počtu vstupných tokenov pre rovnaký obsah.

Nádejou by mohli byť otvorené modely od čínskych firiem, ktoré si rozbeháte na lokálnom železe. Akurát v poslednej dobe vidíme trend, kedy Qwen, GLM, Seedance alebo Kling modely prechádzajú na uzavreté verzie. DeepSeek vo svojom čase šokoval svet. Ale odvtedy aj v Číne prišli na to, že bez investícií sa takéto free modely robiť neoplatí.

Čo môžeme očakávať v najbližšej dobe? V najhoršom prípade spľasne AI bublina a budeme si kupovať AI výkon, teda tokeny, za trhové ceny. V tom najlepšom prípade nastane vo vývoji AI prielom, ktorý spôsobí, že toľko výpočtového výkonu nebudeme potrebovať.
Nejak by som mal túto tému uzavrieť. Celá táto AI záležitosť je poriadna jazda, osobne by som nemenil, ukázalo mi to, že veci, ktoré sme mali za nemenné, sa môžu radikálne zmeniť behom pár mesiacov.
GitHub Stacked Pull Requesty
S príchodom AI agentického programovania sa zrýchlil vývoj a narástlo tým aj množstvo Pull Requestov. Okrem toho s AI agentmi zvládneme komplexnú novú feature rýchlejšie ako predtým, tak si občas vieme, ako sa hovorí, "odhryznúť väčšiu časť jablka". Ak ale je v procese človek, tak dostane ťažkú úlohu urobiť review komplikovaného Pull Requestu. A pretože sme ľudia, tak sa môže stať, že to jednoducho odflákneme. GitHub prináša Stacked Pull Requesty, čo by mohol byť dobrý spôsob, ako sa tomu vyhnúť.

Security okienko
Vercel je obľúbená cloud služba, kde je nasadené veľké množstvo projektov. Nanešťastie sa kompromitáciou účtu zamestnanca podarilo útočníkovi dostať do interných systémov Vercelu. Takto získal prístup k nešifrovaným environment variables, čo sú veľakrát API kľúče, NPM a GitHub tokeny, a tiež prístup k zdrojovým kódom, databázam. Ak máte na Verceli nejaké služby, tak sa odporúča pomeniť si všetky API kľúče, revokovať prístupové tokeny.

BIZ okienko
Nová šéfka Xbox divízie Microsoftu, Ashma Sharma, priznala, že cena Xbox Game Pass vystrelila príliš vysoko a je čas to upraviť.

Problém veľkých firiem je, že občas je problém dostať sa na pokec k šéfovi. Je to normálne, pretože je len jeden a zamestnancov množstvo. Zuckerberg v Meta ale vraj vymyslel AI avatara, takže už nebude nič jednoduchšie, ako zavolať šéfovi a pokecať si s ním, o čom len chcete. Ale aj tak by som si dával pozor na témy, pretože aj keď ide o avatara, nejaký ten sumár toho rozhovoru by sa mohol dostať do jeho rúk.

Claude prináša Claude Design, kde viete navrhovať užívateľské rozhranie a upravovať ho k svojmu obrazu a následne cez Claude Code napojiť na reálny kód. Má to osobitné počítadlo na tokeny a vraj ich viete rýchlo spáliť už za cca 90 minút "dizajnovania". Mimochodom, akcie Figma klesli cca o 7 %.
Je vaša stránka pripravená pre AI agentov? Cloudflare vám urobí test aj odporúčania, ako to zmeniť.

AI okienko
Najväčšou udalosťou minulého týždňa bol nový model Opus 4.7. Ten vo vybraných benchmarkoch posunul latku vyššie. Vieme, že má novú transformer vrstvu, ktorá generuje viac tokenov, má automatické rozhodovanie, ako veľa rozmýšľať, a cenu pôvodného Opus 4.6.

Mimochodom, na predchádzajúcej stránke sú aj benchmarky modelu Mythos, aby sme vedeli porovnať. Ten bol testovaný britským AI Security Institute a zistili, že samotný model nie je až o toľko lepší. V čom vyniká, je možnosť reťaziť jednotlivé kroky do konečného komplexného útoku. Ten najkomplexnejší scenár ale nezvládol. Zatiaľ.

Claude Code najnovšie dostalo rountines, čo sú akcie, ktoré môžete spustiť v určitom čase alebo triggernúť pomocou API alebo GitHub udalostí.
Ja stále hovorím o Claude a ich produktoch, ale OpenAI má konkurenčný Codex. Ten sa profiluje viac ako hybrid medzi Claude Code a Cowork. Najnovšie dostal veľkú aktualizáciu a vie ovládať počítač, používať vstavaný prehliadač a na rozdiel od Claude aj generovať obrázky.

Qwen 3.6 dostal open-weight verziu s 35 miliardami parametrov, vie dlhšie udržať dobrý kontext s natívnou veľkosťou do 262-tisíc tokenov a ide o MoE architektúru.

Google predstavil Android CLI, aby ste aj vy vedeli programovať Android aplikácie pomocou príkazového riadku. Dostupné sú tiež nové skills a integrácia s Android Studiom.

Inštalácia macOS Tahoe obsahuje v sebe malý 3-miliardový LLM model. Ak si ho chcete vyskúšať, tak to ide jednoducho cez aplikáciu Apfel.

.NET okienko
.NET 11 Preview 3 prináša podporu union typov, pre web Zstandard kompresiu a podpísané .NET kontajnery.

Chcete niečo viac ako jednoduchý /health endpoint, ktorý vracia ok stav? Health checkov si môžete nakonfigurovať viac a tak ho spraviť užitočnejším.

Linky na záver
Google vydalo nové Gemini aplikácie pre Windows a macOS. Tá pre Windows zvládne aj indexovať lokálne súbory a používa presne tú istú klávesovú skratku ako Copilot. Alebo v mojom prípade Command Palette z PowerToys.

Sniffnet je network traffic sniffer, ktorý zobrazuje dáta v takom vizuálne príjemnejšom kabáte.

DaVinci Resolve dostalo editor fotiek, ktorý je dostupný aj vo free verzii.

Huawei predstavilo Pura X Max, čo je otvárací telefón, ktorý sa otvorením stane tabletom v takom tom normálnom tablet formáte, ktorý nie je štvorcový. Nanešťastie ide o Huawei, takže sa na západných trhoch nevyskytne, ale vraj podobný produkt pripravuje Samsung aj Apple.

RG Rotate je produkt od Anbernic, ktorý má zaujímavý koncept otočného kĺbu.

Vedeli ste, že keď stlačíte pauzu v hre, že tým hru nezastavíte, ale ju len straaaašne spomalíte. Taká jednoduchá vec a vie to byť celá veda.

Vizuálna bodka na záver
Každý máme svoje sny.














