Týždeň 2024-20

Nad Google minulý týždeň zvíťazilo OpenAI so svojím novým modelom GPT4o. @vlkodotnet

Udalosť týždňa: GPT4o

Deň pred Google IO si OpenAI ukradla pozornosť vydaním nového modelu GPT4o, kde o znamená Omni, čo je po latinsky všetko. Pre OpenAI to znamená, že tento model zvládne aj hlas a obraz. Pripravili si demá, kde prevažne mužská časť tímu sa rozprávala so zvukovým výstupom tohto modelu. Ten mal zapnutý špeciálny mód, ktorý znel tak, ako keby AI s nimi flirtovala.

Hello GPT-4o
We’re announcing GPT-4 Omni, our new flagship model which can reason across audio, vision, and text in real time.

Inak GPT4o nie je najostrejšou ceruzkou v peračníku, ktorý je už takto plný tupých ceruziek. Čo má ale iné, je rýchlosť. Na iPhonoch, kde vie spracovávať lokálne hlas, tak zvládne odpoveď na vašu hlasom položenú otázku už za 200 ms (maximálne do cca 500 ms). To samozrejme nie je čas do konca generovania odpovede, ale čas, keď získate prvú odpoveď z OpenAI servera a začne vám generovať zvukový výstup. Pre porovnanie GPT4 Turbo začal po cca 2 sekundách a GPT4 po 5 sekundách. Celkovo to je pocitovo na úrovni lokálnych malých AI modelov (ale so zvukom). Sám som si to vyskúšal, akurát na Androide sú tam také divné pauzy počas zvukovej reprezentácie odpovede.

Mať takého kamoša, s ktorým si môžete pokecať je niečo, čo sme tu ešte nemali (ak nerátame demá od Google, ktoré vieme, že boli nahraté). Apple vraj zabilo Siri a urobilo dohodu s OpenAI. A tak možno uvidíme náhradu Siri z dielne OpenAI. Všetko sa dozvieme už o dva týždne, ale Apple ešte môže prekvapiť aj niečím vlastným.

Aký je teda model GPT4o? Dnes už vieme, že tajomný bot gpt2, ktorý som spomínal minulý týždeň, bol GPT4o. Práve ten získal na Chatbot Arene, kde užívateľ komunikuje s dvoma modelmi, aby určil, ktorý je lepší, najvyššie skóre.

Before launching, GPT-4o broke records on chatbot leaderboard under a secret name
Anonymous chatbot that mystified and frustrated experts was OpenAI’s latest model.

V benchmarku, ktorý sleduje, či pri konverzácii nestráca niť rozhovoru, dosiahol skoro perfektné skóre.

GPT-4o’s Memory Breakthrough! (NIAN code)

Ak mi neveríte, tak si ho sami vyskúšajte, mal by byť dostupný zadarmo s obmedzeným počtom tokenov už teraz (aspoň ja ho už mám, ale minuli sa mi free tokeny).

Pri OpenAI mám ešte jednu dôležitú novinku. Uzavreli partnerstvo s Reddit, čo znamená, že bude mať ten najdôveryhodnejší zdroj na recenzie. Je dobré, že si Reddit našiel dobrý biznis model. Len čo na to jeho užívatelia?

OpenAI and Reddit Partnership
OpenAI and Reddit Partnership We’re bringing Reddit’s unique content to ChatGPT and our products.

Google IO 2024

Niekde som čítal, že už je toho AI toľko, že je za vrcholom toho humbuku, čo sa okolo neho robí. Že to tak nie je, ukázala konferencia od Google a najbližšie týždne budú nasledovať konferencie od Microsoftu a Apple. Google vidí najbližšiu budúcnosť v AI modeli Gemini, ktorý bude mať časom kontextové okno s veľkosťou 2 milióny tokenov. To by malo stačiť na to, aby ste do neho natlačili nejaký film a pýtali sa na dej. Len neviem, kde si dnes už stiahnete legálne film, keď sú všade tie streamovacie služby. Ale možno máte niekoľko sto stránkové PDF. Aj to tento model zvládne. Okrem toho dostaneme k dispozícii aj Gemini Flash. Ten by podobne ako GPT4o mal dávať odpovede rýchlosťou blesku.

Gemini Flash
Our lightweight model, optimized for when speed and efficiency matter most, with a context window of up to one million tokens.

Integrácia prichádza cez Gemini hlavne do Androidu. Vízia je, aby rozumel všetkému, čo vidí na obrazovke, stačí ak to zakrúžkujete špeciálnym gestom. Potrebné údaje o kontexte si potiahne Gemini z Google Tasks, Calendar alebo Keep.

Gemini will integrate with Calendar, Tasks, and Keep
Gemini could take over more tedious administrative tasks soon.

Keď mu necháte prístup k telefónnemu hovoru, tak zistí, že váš obťažuje škaredý ujo so scamom, ktorý chce od vás vytiahnuť pokútnym spôsobom peniaze.

Android is getting an AI-powered scam call detection feature
Google says it’ll warn users of fraud-associated language in calls.

Mali tam aj vtipné momenty, to vtedy, keď uviedli Gems. To sú také vaše vlastné personalizované chatboty. Akurát, bolo to vtipné asi iba tete, čo to uvádzala. Aj sa zasmiala a nikto iný sa nesmial, až po chvíli. Buď tam boli v obecenstve OpenAI GPT4 chatboti, alebo zo slušnosti (vtipná mala byť Gem ako skratka Gemini, ale možno som to zle pochopil). Aby ste sa vy tak necítili, tak si môžete takého Gem Buddyho vytvoriť a naučiť sa smiať vašim vtipom.

Google will let you create personalized AI chatbots
You can make AI your motivational-sounding gym buddy.

Na video má Google pripravený Sora-killer model s názvom Veo. Ten bude vedieť nielen generovať video, ale rôzne spracovávať aj to vaše. Mali tam na jeho propagovanie chlapíka, ktorý dlho rozprával o tom, ako je umenie kreatívne. Potom sa bavil s chlapíkmi, čo ukazovali prstom na počítač. Celé to vyzeralo, že už-už ukážu nejaký super filmík, ale vraj "zatiaľ nič iné ako milé zábery z tvorby nemáme".

Veo
Veo is our most capable video generation model to date. It generates high-quality, 1080p resolution videos that can go beyond a minute, in a wide range of cinematic and visual styles.

Nechýbala ani budúcnosť. Tá sa volá Astra a budete chodiť s kamerou, hovoriť do mikrofónu a ona vám bude odpovedať. Presne ako demá v GPT4o, akurát so psíkom.

Project Astra is the future of AI at Google
A virtual assistant that knows where you left your keys? That’s the dream.

Je toho viac, mňa ale zaujalo len toto. Komu by to nestačilo, tak viac je tu:

Google I/O 2024: everything announced
Here’s all the news from Google.

Google ale prináša aj novinky do vyhľadávania. Teraz keď máte prvú stránku vyhľadávania plnú AI, YouTube videí a reklamy, tak si môžete prepnúť "Web" záložku. Tam uvidíte iba textové výsledky vyhľadávania. Ale úprimne, kto by také niečo dnes potreboval?

Google Search adds a new “Web” filter option to show old fashioned links for search results
Google has quietly revealed it is rolling out a new “Web” filter for search results that will show links to other sites in the old-fashioned way, rather than the new AI Overviews results.

Tiež sa Google podarilo vymazať omylom z Google Cloud všetky dáta pre austrálsky dôchodkový fond UniSuper. A keď myslím vymazať, tak myslím aj komplet zálohy. Našťastie mali nejaké lokálne.

“Unprecedented” Google Cloud event wipes out customer account and its backups
UniSuper, a $135 billion pension account, details its cloud compute nightmare.

Twitter je už X

Twitter už nie je Twitter ani, čo sa týka domény. Teraz ste presmerovaní priamo na X.com. Čo je ale zaujímavé, že mňa ako prihláseného stále držia na starej Twitter doméne. Ale to bude len otázka času. A pritom ten Twitter bol taký pekný projekt, aj mám z neho na týždenníku najväčšiu návštevnosť, aj mi teraz každý post olajkuje aspoň jeden bot s fotkou sporo odetej slečny.

Twitter URLs redirect to x.com as Musk gets closer to killing the Twitter name
X.com stops redirecting to Twitter.com over a year after company name change.

AI okienko

AI už bolo dosť v iných rubrikách. Ale troška AI zostalo aj pre tohto zaujímavého robota za 16-tisíc dolárov, ktorý robí geniálne mostíky. Náš telocvikár by bol z neho nadšený.

Unitree G1 - Humanoid agent AI avatar - Unitree
人形智能体 AI化身

.NET okienko

Dnes (v čase písania) neskoro v noci začína Microsoft BUILD, to znamená, že na budúci týždeň bude o čom písať. Tak tu mám aspoň drobnosť, porovnanie string.IsNullOrEmpty(s) s pattern matching verziou s is null or { Length: 0 } alebo s is null or []. Je medzi nimi rozdiel?

Writing “string.IsNullOrEmpty” using pattern matching and comparing the resulting code | tabs ↹ over ␣ ␣ ␣ spaces by Jiří {x2} Činčura

Linky na záver

Opera je už tiež natívne dostupná na Windows ARM. O ARM na Windows budeme počuť najbližšie dni veľa, preveľa.

Opera is now available natively on Windows on ARM
Opera has announced that its browser is now fully native on Windows on ARM. Opera Developer for ARM64 is now available for download, promising users significant performance improvements.

Keď už sme pri Windows a ARM, tak sa niekomu podarilo nainštalovať Windows 11 ARM edíciu na Nintendo Switch.

Guy installs Windows 11 on a Nintendo Switch, because why not?
In another case of “just because you can doesn’t mean you should,” a post on X (formerly Twitter) has shown that Windows 11 has been successfully installed on a Nintendo Switch console.

Pekná vizuálna pomôcka, ak potrebujete pochopiť, ako funguje rate limiter.

rate limiter – smudge.ai blog
Smudge.ai is a Chrome extension that gives you ChatGPT-powered shortcuts in your right-click menu.

Quary je váš vlastný lokálny open-source BI systém.

Quary
Open-source BI for engineers

Ani dnes nezabúdam na prokrastinačnú oddychovku. Dnes je to pekná vizuálna oddychovka, kde preskúmavate poschodie a hľadáte rôzne popkultúrne odkazy (pamätníci vedia, že tento odkaz tu bol pred rokom a pol).

Floor796
A huge animation scene with many references to memes, games, films, series, anime, music groups

Vizuálna bodka na záver

Nechávam bez komentára.