Týždeň 2026-15

Týždeň 2026-15
Dnes veľa tém nebolo, tak som mal čas venovať sa téme tokenovej ekonomiky. @vlkodotnet

Zamyslenie týždňa: Ekonomika tokenov

Za úspech v stále nových investičných kolách Anthropic, OpenAI a iných môže skutočnosť, že očakávania trhu sú, že AI bude používať každý a zmení to celý priemysel. Čo ale začíname pozorovať, je viditeľný nedostatok potrebného železa na ktorom by AI inferencia mohla bežať. Určite sa pýtate, ako je to možné, veď Nvidia predáva neuveriteľné množstvo výpočtového hardvéru. Nuž, tak nejak viac ako polovica plánovaných AI datacentier bola potichu zrušená alebo odložená. Dôvodov je viac, firmy nakupujú GPU, aby sa dostali k najnovším modelom GPU, niet však dostatok datacentier, do ktorých by daný GPU výkon nainštalovali. A tie, čo už existujú, občas nemajú dostatok energie na ich beh, a tak čakajú nečinne až bude dostupná patričná energetická štruktúra.

Nemáme datacentrá, ale ľudia začínajú viac a viac využívať AI modely. Nielen tak ako kedysi na pokec, ale v spojení s AI agentmi. Kto to raz skúsi, zistí, aké to je užitočné, a už niet cesty späť. A kde niet cesty späť a je nedostatok výpočtového výkonu, tam prichádzajú obmedzenia. Užívatelia sa stále viac a viac sťažujú, že v Claude narážajú na čím ďalej striktnejšie limity tokenov. A aj Anthropic sprísňuje to, kde sa môžu používať. Na OpenClaw si musíte dokupovať tokeny osobitne, užívatelia reportujú, že boli zablokovaní, keď používali Claude Code v headless móde. A dokonca Enterprise zákazníci prišli o výhodu bundlovaných tokenov a budú platiť za reálnu spotrebu (samozrejme oni majú dohodnuté lepšie ceny).

Anthropic ejects bundled tokens from enterprise seat deal
UPDATED: Large organizations pushed toward metered pricing

Aby toho nebolo dosť, tak nový Opus 4.7 bol trénovaný na novom tokenizeri, ktorý prináša v niektorých prípadoch až 47 % nárast počtu vstupných tokenov pre rovnaký obsah.

I Measured Claude 4.7’s New Tokenizer. Here’s What It Costs You.
The docs said 1.0–1.35x more tokens. On real content, I measured 1.47x.

Nádejou by mohli byť otvorené modely od čínskych firiem, ktoré si rozbeháte na lokálnom železe. Akurát v poslednej dobe vidíme trend, kedy Qwen, GLM, Seedance alebo Kling modely prechádzajú na uzavreté verzie. DeepSeek vo svojom čase šokoval svet. Ale odvtedy aj v Číne prišli na to, že bez investícií sa takéto free modely robiť neoplatí.

China’s AI Companies Are Going Closed Source
We explain why

Čo môžeme očakávať v najbližšej dobe? V najhoršom prípade spľasne AI bublina a budeme si kupovať AI výkon, teda tokeny, za trhové ceny. V tom najlepšom prípade nastane vo vývoji AI prielom, ktorý spôsobí, že toľko výpočtového výkonu nebudeme potrebovať.

Nejak by som mal túto tému uzavrieť. Celá táto AI záležitosť je poriadna jazda, osobne by som nemenil, ukázalo mi to, že veci, ktoré sme mali za nemenné, sa môžu radikálne zmeniť behom pár mesiacov.

GitHub Stacked Pull Requesty

S príchodom AI agentického programovania sa zrýchlil vývoj a narástlo tým aj množstvo Pull Requestov. Okrem toho s AI agentmi zvládneme komplexnú novú feature rýchlejšie ako predtým, tak si občas vieme, ako sa hovorí, "odhryznúť väčšiu časť jablka". Ak ale je v procese človek, tak dostane ťažkú úlohu urobiť review komplikovaného Pull Requestu. A pretože sme ľudia, tak sa môže stať, že to jednoducho odflákneme. GitHub prináša Stacked Pull Requesty, čo by mohol byť dobrý spôsob, ako sa tomu vyhnúť.

GitHub Stacked PRs
Break large changes into small, reviewable, stacked pull requests with first-class GitHub support.

Security okienko

Vercel je obľúbená cloud služba, kde je nasadené veľké množstvo projektov. Nanešťastie sa kompromitáciou účtu zamestnanca podarilo útočníkovi dostať do interných systémov Vercelu. Takto získal prístup k nešifrovaným environment variables, čo sú veľakrát API kľúče, NPM a GitHub tokeny, a tiež prístup k zdrojovým kódom, databázam. Ak máte na Verceli nejaké služby, tak sa odporúča pomeniť si všetky API kľúče, revokovať prístupové tokeny.

Vercel confirms breach as hackers claim to be selling stolen data
Cloud development platform Vercel has disclosed a security incident after threat actors claimed to have breached its systems and are attempting to sell stolen data.

BIZ okienko

Nová šéfka Xbox divízie Microsoftu, Ashma Sharma, priznala, že cena Xbox Game Pass vystrelila príliš vysoko a je čas to upraviť.

Xbox Game Pass ‘has become too expensive,’ says Microsoft’s new gaming chief in leaked memo
It sounds like Game Pass pricing will drop soon

Problém veľkých firiem je, že občas je problém dostať sa na pokec k šéfovi. Je to normálne, pretože je len jeden a zamestnancov množstvo. Zuckerberg v Meta ale vraj vymyslel AI avatara, takže už nebude nič jednoduchšie, ako zavolať šéfovi a pokecať si s ním, o čom len chcete. Ale aj tak by som si dával pozor na témy, pretože aj keď ide o avatara, nejaký ten sumár toho rozhovoru by sa mohol dostať do jeho rúk.

Meta spins up AI version of Mark Zuckerberg to engage with employees
The Meta chief is personally involved in training and testing his animated AI.

Claude prináša Claude Design, kde viete navrhovať užívateľské rozhranie a upravovať ho k svojmu obrazu a následne cez Claude Code napojiť na reálny kód. Má to osobitné počítadlo na tokeny a vraj ich viete rýchlo spáliť už za cca 90 minút "dizajnovania". Mimochodom, akcie Figma klesli cca o 7 %.

Anthropic just launched Claude Design, an AI tool that turns prompts into prototypes and challenges Figma | VentureBeat
Anthropic launched Claude Design, an AI tool that turns text prompts into interactive prototypes, alongside its most powerful public model, Claude Opus 4.7 — directly challenging Figma and signaling the company's shift from AI lab to full-stack product company.

Je vaša stránka pripravená pre AI agentov? Cloudflare vám urobí test aj odporúčania, ako to zmeniť.

Is Your Site Agent-Ready?
Scan your website to see if it’s ready for AI agents. Check for llms.txt, MCP, agent skills, and other agent-friendly standards.

AI okienko

Najväčšou udalosťou minulého týždňa bol nový model Opus 4.7. Ten vo vybraných benchmarkoch posunul latku vyššie. Vieme, že má novú transformer vrstvu, ktorá generuje viac tokenov, má automatické rozhodovanie, ako veľa rozmýšľať, a cenu pôvodného Opus 4.6.

Introducing Claude Opus 4.7
Our latest model, Claude Opus 4.7, is now generally available. Opus 4.7 is a notable improvement on Opus 4.6 in advanced software engineering, with particular gains on the most difficult tasks.

Mimochodom, na predchádzajúcej stránke sú aj benchmarky modelu Mythos, aby sme vedeli porovnať. Ten bol testovaný britským AI Security Institute a zistili, že samotný model nie je až o toľko lepší. V čom vyniká, je možnosť reťaziť jednotlivé kroky do konečného komplexného útoku. Ten najkomplexnejší scenár ale nezvládol. Zatiaľ.

UK gov’s Mythos AI tests help separate cybersecurity threat from hype
New model is the first AI system to complete a difficult multistep infiltration challenge.

Claude Code najnovšie dostalo rountines, čo sú akcie, ktoré môžete spustiť v určitom čase alebo triggernúť pomocou API alebo GitHub udalostí.

Automate work with routines - Claude Code Docs
Put Claude Code on autopilot. Define routines that run on a schedule, trigger on API calls, or react to GitHub events from Anthropic-managed cloud infrastructure.

Ja stále hovorím o Claude a ich produktoch, ale OpenAI má konkurenčný Codex. Ten sa profiluje viac ako hybrid medzi Claude Code a Cowork. Najnovšie dostal veľkú aktualizáciu a vie ovládať počítač, používať vstavaný prehliadač a na rozdiel od Claude aj generovať obrázky.

Codex for (almost) everything
The updated Codex app for macOS and Windows adds computer use, in-app browsing, image generation, memory, and plugins to accelerate developer workflows.

Qwen 3.6 dostal open-weight verziu s 35 miliardami parametrov, vie dlhšie udržať dobrý kontext s natívnou veľkosťou do 262-tisíc tokenov a ide o MoE architektúru.

Qwen/Qwen3.6-35B-A3B · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Google predstavil Android CLI, aby ste aj vy vedeli programovať Android aplikácie pomocou príkazového riadku. Dostupné sú tiež nové skills a integrácia s Android Studiom.

Android CLI and skills: Build Android apps 3x faster using any agent
News and insights on the Android platform, developer tools, and events.

Inštalácia macOS Tahoe obsahuje v sebe malý 3-miliardový LLM model. Ak si ho chcete vyskúšať, tak to ide jednoducho cez aplikáciu Apfel.

apfel - Your Mac Already Has AI
Your Mac already has AI. Apple ships a language model with macOS -apfel unlocks it with one brew install. No downloads, no API keys, no config. The fastest path to local AI.

.NET okienko

.NET 11 Preview 3 prináša podporu union typov, pre web Zstandard kompresiu a podpísané .NET kontajnery.

.NET 11 Preview 3 is now available! - .NET Blog
Find out about the new features in .NET 11 Preview 3 across the .NET runtime, SDK, libraries, ASP.NET Core, .NET MAUI, C#, Entity Framework Core, container images, and more!

Chcete niečo viac ako jednoduchý /health endpoint, ktorý vracia ok stav? Health checkov si môžete nakonfigurovať viac a tak ho spraviť užitočnejším.

Health Checks in ASP.NET Core: Beyond the Basic /health Endpoint
Most developers add a /health endpoint and call it done. Here’s how to build health checks that actually tell you what’s wrong — database, external APIs…

Linky na záver

Google vydalo nové Gemini aplikácie pre Windows a macOS. Tá pre Windows zvládne aj indexovať lokálne súbory a používa presne tú istú klávesovú skratku ako Copilot. Alebo v mojom prípade Command Palette z PowerToys.

Google releases new apps for Windows and MacOS
Google mostly creates products for the web, but it has some new desktop apps today.

Sniffnet je network traffic sniffer, ktorý zobrazuje dáta v takom vizuálne príjemnejšom kabáte.

Sniffnet: comfortably monitor your Internet traffic
Whether you want to gather statistics, or you need to inspect more in depth what’s going on in your network, Sniffnet will get you covered.

DaVinci Resolve dostalo editor fotiek, ktorý je dostupný aj vo free verzii.

The DaVinci Resolve 21 Photo Editing Tools Show Promise but Are Imperfect
Limited but very powerful.

Huawei predstavilo Pura X Max, čo je otvárací telefón, ktorý sa otvorením stane tabletom v takom tom normálnom tablet formáte, ktorý nie je štvorcový. Nanešťastie ide o Huawei, takže sa na západných trhoch nevyskytne, ale vraj podobný produkt pripravuje Samsung aj Apple.

Huawei beats Apple and Samsung with new wide foldable
The wide phone comeback has begun.

RG Rotate je produkt od Anbernic, ktorý má zaujímavý koncept otočného kĺbu.

Anbernic’s new handheld is a pocket-friendly Android device with a swiveling screen
The RG Rotate is a Game Boy clone with a rotating display that shrinks its size.

Vedeli ste, že keď stlačíte pauzu v hre, že tým hru nezastavíte, ale ju len straaaašne spomalíte. Taká jednoduchá vec a vie to byť celá veda.

Game Devs Explain The Tricks Involved With Letting You Pause
Developers provide some insight into how they all make games stop and start when you press a button

Vizuálna bodka na záver

Každý máme svoje sny.