Týždeň 2025-48
Zasa je tu jeden AI model, ktorý stojí za zmienku. Google vystriedal Anthropic s Opus 4.5. @vlkodotnet
Udalosť týždňa: Claude Opus 4.5
Prešiel týždeň a máme tu nový najlepší model pre vývojárov. Anthropic reagoval na uvedenie Google Gemini 3 Pro novým modelom Opus 4.5.
PR noviniek je veľa: lepšie kódovanie, lepšie agentické schopnosti, efektívnejšie spracovávanie dlhých rozhovorov a parameter "effort", ktorým viete určiť koľko času sa váš model má úlohe venovať.
Čo robí ale Opus 4.5 inak? Najmä je to schopnosť udržiavať si kontext čistý. Namiesto toho, aby si všetko pamätal, snaží sa kontext komprimovať, indexovať a ukladať si informácie na neskôr. Keďže model je určený pre vývojárov, tak oveľa konzistentnejšie vie vrátiť výstup v strojovo spracovateľnom formáte. Pre agentické použitie si vie rozložiť úlohu na sekvenciu krokov, vie zistiť, čo zlyhalo, a vrátiť sa späť a krok opraviť. To opakovať, dokým nie je úloha hotová.

Aj keď sa znížila možnosť model oklamať pomocou prompt injection, stále nie je voči tomu úplne imúnny.
Navyše Claude uviedol novinku s názvom "advanced tool use", ktorá pomáha tým, ktorí používajú veľké množstvo nástrojov. Namiesto toho, aby ich špecifikácia bola súčasťou každého kontextu, najskôr sa použije "Tool Search Tool", ktorý zanalyzuje request a do kontextu pridá iba tie nástroje, ktoré vyhodnotí, že sa pre danú úlohu hodia. To môže drasticky znížiť náklady za využívanie modelu.

Zabudol som spomenúť cenu. Opus 4.5 je o 66 % lacnejší ako Opus 4.1, ale stále s cenovkou 5 $ za milión input tokenov a 25 $ za milión output tokenov nepatrí medzi lacné modely.
História Google TPU
O Google TPU procesoroch je informácií ako šafranu. Na rozdiel od tradičných GPU je Google TPU špeciálne navrhnutý pre neurónové siete. Pôvod jeho vzniku je v hlasovom vyhľadávaní. Keď si Google v roku 2013 prerátal, koľko by ho stálo, keby hlasové vyhľadávanie využíval každý Android užívateľ aspoň 3 minúty denne, musel by zdvojnásobiť kapacitu svojich dátových centier. Preto sa rozhodli vyvinúť ASIC (Application-Specific Integrated Circuit) navrhnutý iba na jednu úlohu: prevádzku neurónových sietí TensorFlow. Ostatné je už história.

Google TPU si nikde inde ako v Google Cloude nezakúpite. To je jeho najväčšie riziko, pretože to automaticky znamená vendor lock-in. Reálne nevieme povedať, o koľko je najnovší model Ironwood (TPU v7) výkonnejší oproti Nvidia technológii, vieme ale, že je určite cenovo výhodnejší. Práve to bude Google potrebovať, pretože už teraz potrebuje zdvojnásobiť kapacitu AI datacentier z dôvodu rastúceho dopytu. Cieľová hranica je nárast na 1000-násobok v priebehu 4 až 5 rokov.

BIZ okienko
GymBeam získava investíciu 30 miliónov eur a je na dobrej ceste stať sa slovenským jednorožcom. Peniaze by mali byť použité na nové automatizované sklady a expanziu na západné trhy.

Meta má na krku nové obvinenie, primárne za nedostatočnú ochranu tínedžerov, toxické funkcie a agresívne cielenie priamo na mladých ľudí a deti.

Výnosy Nvidie narástli o 22 % štvrťročne a 62 % medziročne. Rástol ako biznis datacentier, tak aj grafických kariet pre hry, a dokonca aj sieťová divízia narástla na dvojnásobok divízie grafických kariet. A to všetko s čistým ziskom 56 %.

23. december nebude len deň pred Vianocami, ale bude to aj deň, kedy vstúpi do platnosti zákaz predaja DJI rádiových zariadení v USA pre podozrenia z potenciálnej špionáže. Situáciu môže ako vždy zachrániť americký prezident.

Únik informácií potvrdil, že OpenAI pripravuje reklamy pre ChatGPT. V novembri navštívilo ChatGPT približne 800 miliónov ľudí týždenne a reklama je spôsob, ako na nich zarobiť, keďže doteraz boli len spôsobom, ako zbierať dáta pre tréning modelov.

AI okienko
DeepSeek uvádza nový model 3.2, ktorý dokáže v matematických úlohách poraziť Gemini 3 Pro a GPT 5 High. Je to za cenu väčšej spotreby tokenov na premýšľanie, teda vyšších nákladov a pomalších odpovedí. Je úplne čerstvý, tak budúci týždeň možno bude viac analýz okolo toho, ako to dosiahol. Je to ale dôkaz, že Čína aj bez prístupu k najnovším technológiám nezaostáva.

Prípadová štúdia o tom, čo to znamená vybudovať si lokálny RAG.
Windows 11 dostáva v testovacom režime "Agent Workspace", v ktorom budú môcť na vašom počítači v pozadí bežať AI agenti, ktorí budú mať prístup k vybraným priečinkom. Agenti budú bežať v sandbox prostredí a s auditom toho, čo robia a čo robili. A samozrejme všetci už majú obavy o bezpečnosť a súkromie.

Tipy a triky pre všetkých používateľov Google CLI.
Linky na záver
Penpot je open-source alternatíva k Figme. Okrem self-hostingu je k dispozícii aj platená verzia, ak potrebujete viac ako 10 GB cloud priestoru na vaše projekty.

Alibaba prichádza s vlastnou verziou AI okuliarov. Quark S1 používa micro-OLED displeje a Quark G1 vám iba šepká od uška. Aktuálne dostupné len v Číne a náš trh by sa ich mohol dočkať v budúcom roku.

POP Phone je klasické slúchadlo, aké poznáte zo starých filmov, akurát toto je určené pre všetky zariadenia s USB-C konektorom. Ak často voláte, môžete si vyskúšať, aké to kedysi bolo bez handsfree.

SSD disky sú vhodné na archiváciu, len ak sú napájané. Potom, podľa toho, akú technológiu používajú na ukladanie dát, môže dôjsť k strate dát už za 1 rok pri QLC NAND, ale napríklad SLC NAND vydržia až 10 rokov.

Súťaž o najhoršie UI pre zadávanie dátumu Bad UX World Cup má svojho víťaza.
Vizuálna bodka na záver
Zavádzanie AI môže dopadnúť aj takto.










