Týždeň 2023-06

Prichádza revolúcia. Taká, ako každý rok, len tentoraz vo vyhľadávaní. @vlkodotnet

Udalosť týždňa: Bing zásnuby s ChatGPT

Minulý týždeň sme sa dočkali buď revolúcie, alebo predstavenia ďalšieho zbytočného trendu na tento rok. Poďme ale pekne postupne vysvetliť, čo sa stalo.

Microsoft uviedol do beta fázy nový projekt. Na ten budete potrebovať Edge prehliadač (to je ten, čo vám Windows vnucuje ako default) a prihlásenie sa do čakačky. Keď sa dostanete na rad, tak sa vám jednoriadkové vyhľadávacie okienko zmení na viacriadkové a vy už sa nebudete pýtať heslovite: "finstat", "london", "snowpark namestovo", "big boots". Ale pekne napíšete to, čo chcete a Bing (to je konkurent Google, čo má cca 3 % trhu) vám okrem výsledkov vyhľadávania do bočného boxu napíše odpoveď, ktorú vyskladala umelá inteligencia podobná tej, čo poháňa ChatGPT. Na rozdiel od ChatGPT táto bude vedieť spracovávať aj aktuálne novinky zverejnené práve teraz na internete.

Microsoft announces new Bing and Edge browser powered by upgraded ChatGPT AI
Microsoft pushes AI to unseat Google’s dominance.

Už teda vôbec nebudete musieť ísť na stránku s informáciou, ale ju dostanete poskladanú priamo k vám. Teda počkať, čo bude so všetkými tými stránkami, čo tie informácie poskytujú? To sa ešte nevie, ale vraj tá odpoveď bude obsahovať prelinky a to by malo stačiť.

Ak vám toto nepríde, ako revolúcia vo vyhľadávaní, tak určite to bude niečo, čo môže úplne zmeniť to, ako web vyzerá a funguje. Možno si poviete, že nejaký Bing predsa nemôže namútiť veľa vody. A možno máte aj pravdu, ale sám CEO Googlu promptne napísal post o tom, že pripravujú Bard.

An important next step on our AI journey
Introducing Bard, Google’s experimental conversational AI service powered by LaMDA — plus, new AI features in Search coming soon.

Bard bude to isté ako to od Microsoftu (to zatiaľ nemá meno, preto môžeme zatiaľ používať označenie BinGPT), ale bude mať za sebou lepší jazykový model, Google dáta a ... a viac nikto nevie. Dokonca ani demo, ktoré Google pripravilo nedáva presné výsledky (teleskop JWST nebol prvý, ktorý odfotil planétu mimo slnečnej sústavy), takže nasledoval pokles akcií Alphabet o 9 %. A Microsoft akcie zasa o 4 % narástli.

Aby ste mali sami predstavu, čo BinGPT vie, tak prikladám linku na review. Mne to zatiaľ ešte neaktivovali, takže ešte vlastne žijem v "minulom tisícročí".

Hands-on with the new Bing: Microsoft’s step beyond ChatGPT
Microsoft is taking on Google search in a big way.

Na koniec ešte prikladám odkaz na článok od NewYorker (na čítanie odporúčam inkognito mód), ktorý poukazuje na negatívnu stránku takýchto AI modelov. Obsahujú informáciu, ktorá bola spracovaná algoritmom so stratovou kompresiou. Teda vie zhrnúť/aproximovať pôvodnú informáciu, ale nevie už jej pôvodnú podobu. Čo je v podstate to isté, ako funguje náš mozog, samozrejme pokiaľ nemáte fotografickú pamäť. Možno nám preto bude bližšie ako si myslíme.

ChatGPT Is a Blurry JPEG of the Web
OpenAI’s chatbot offers paraphrases, whereas Google offers quotes. Which do we prefer?

Zhrniem to: Do vyhľadávania sa nekompromisne dostáva AI a to zmení podobu webu, už len preto, že sa zníži počet preklikov, následne zobrazení reklám a môžeme to nazvať takto epicky:
Veľké vymieranie webov.

Ak vás, ako mňa, zaujímajú technológie, ktoré poháňajú vyhľadávanie, tak viete, že štandardný Lucene sa na kód nehodí. Spolieha sa na tokenizer a stopwordy v kóde majú vždy špeciálne postavenie. Preto keď GitHub začal budovať svoje vyhľadávanie v kóde, tak musel ísť inou cestou, ako tradičnou integráciou Lucene. Ich vyhľadávací engine nazvali Blackbird, je napísaný v Ruste, používajú ngram indexy (tie vie aj Lucene, akurát taký index zaberie viac miesta a má viac práce so zmenou), pred zobrazením ešte dokumenty načítajú, prekontrolujú.

The technology behind GitHub’s new code search | The GitHub Blog
A look at what went into building the world’s largest public code search index.

Big Data je mŕtvy

Big Data bol kedysi buzzword podobne ako to je dnes s AI. Hovorili, že treba ukladať všetko, lebo všetko sú dáta a na tých záleží. Keď sa to spojilo s tým, že storage začal byť naozaj lacný, tak všetci začali ukladať všetko a vo výsledku má každý hŕbu dát, ktoré nepotrebuje, ale ktoré musí zálohovať, udržiavať a nedajbože aj spracovávať. A pritom stačí z dát odstrániť zbytočnú informáciu, zdeduplikovať, zagregovať. Poväčšine roka aj tak pracujete s dátami, ktoré sú len z malého časového fragmentu. Presne o tom je nasledujúci článok, ktorý sa hodí najmä v tejto dobe, keď sa konečne začína vo firmách šetriť.

MotherDuck: Big Data is Dead
Big data is dead. Long live easy data.

Ak neviete, ako začať, tak napríklad SQL je dobrá voľba. Nemusíte ísť hneď do Oracle alebo drahého Microsoft SQL Serveru. Stačí aj PostgreSQL, SQLite alebo DuckDB z nasledujúceho článku (uznávam, ide o poriadny oslí mostík, ale inde sa mi ten článok nehodil).

SQL should be your default choice for data engineering pipelines
SQL should be the first option considered for new data engineering work. It’s robust, fast, future-proof and testable. With a bit of care, it’s clear and readable.

.NET okienko

Blazor United je prototyp, kde jeden Blazor kód pobeží na serveri aj v prehliadači cez WebAssembly. To neznie vôbec zle, najmä ak sa pravdepodobne dostane už do .NET 8.

ASP.NET Core Dev Team Launches ‘Blazor United’ Push for .NET 8 -- Visual Studio Magazine
Shortly after Blazor creator Steve Sanderson wowed web-devs with a new prototype project called Blazor United and solicited feedback on its viability, Microsoft flipped the switch and put it on the roadmap for .NET 8.

Vo firme LEGO očividne robia v .NET. Inak si neviem vysvetliť, prečo by inak zverejnili open-source knižnicu AsyncAPI.NET, ktorá vám vygeneruje AsyncAPI špecifikáciu.

GitHub - LEGO/AsyncAPI.NET: The AsyncAPI.NET SDK contains a useful object model for AsyncAPI documents in .NET
The AsyncAPI.NET SDK contains a useful object model for AsyncAPI documents in .NET - GitHub - LEGO/AsyncAPI.NET: The AsyncAPI.NET SDK contains a useful object model for AsyncAPI documents in .NET

Linky na záver

Dnes začnem JavaScriptom. Vedeli ste, že existuje HTML tag <dialog>, ktorý funguje ako dialóg? Teda už nebudete potrebovať nejakú JS knižnicu pre vyskakovacie okienka. Zaujímavá je aj široká podpora prehliadačov.

<dialog>: The Dialog element - HTML: HyperText Markup Language | MDN
The <dialog> HTML element represents a dialog box or other interactive component, such as a dismissible alert, inspector, or subwindow.

10 tipov a trikov pre základné operácie s JavaScript objektami a poľami. Priznám sa, že osobne som spread operátor (...) ešte nezačal používať, ale keďže ho podporujú aktuálne všetky prehliadače, tak by som mal začať.

10 Tips and Tricks to Handle JavaScript Objects
This article discusses the ten most useful tips and tricks when dealing with objects in JavaScript code...

A pre zmenu 8 príkladov, kedy počítanie s číslom s pohyblivou desatinnou čiarkou je problém. Tradične sú tam príklady, kedy nie je dobré používať equality operáciu, tweet ID ako číslo, atď.

Examples of floating point problems
Examples of floating point problems

Ak chcete vo svojich fotkách vyhľadávať podľa objektov na nich zobrazených, podľa GPS koordinátov a pritom ich mať u seba vo vlastnom cloude, tak sa vám hodí PhotoPrism. Odporúča 4 z 5 paranoidných programátorov (ten piaty si kódi vlastné riešenie).

PhotoPrism: Browse Your Life in Pictures
AI-Powered Photos App for the Decentralized Web

Meilisearch je nový open-source search engine, ktorý by mal konkurovať Elasticsearch. Je napísaný v Rust, a teda logicky bude mať pod sebou niečo iné ako Lucene.

Meilisearch 1.0: the next stage in search
The first completely stable and enterprise-ready version.

Ak máte deti, alebo ste viacerí na byte a radi by ste dali diaľkovo ovládaným autíčkam nový rozmer, tak Hot Wheels uvádza Rift Rally autíčka, ktoré majú kameru a z vašej izby spravia cez AR nový pretekársky svet.

Hot Wheels: Rift Rally is a mixed reality R/C car for PS4, PS5, and iPhone
It’s a blast.

Prídú vám autíčka stále málo? Ak máte naozaj radi AR a vo vrecku zbytočných 350 dolárov, tak si môžete objednať open-source monokel, ktorý si pripnete na okuliare a uvidíte, čo len chcete, teda, čo mu naprogramujete.

Monocle

Ako programátor neviem robiť pekné UI, ale občas sa snažím. Aby to nevyzeralo úplne zle, tak je tu zopár pravidiel, ktoré stačí dodržiavať.

Visual design rules you can safely follow every time

Vizuálna bodka na záver

V USA bol Super Bowl, a to znamená, že všetci marketéri si pripravili tie najlepšie 1-minútové reklamy.

Best and worst 2023 Super Bowl commercials: Ranking the ads
Jake Ciely is the master when it comes to ranking everything, including the 2023 Super Bowl commercials.

Bol by som zabudol, jedna vizuálna bodka by mala zohľadňovať aktuálne dianie na LinkedIn.