Týždeň 2023-06
Prichádza revolúcia. Taká, ako každý rok, len tentoraz vo vyhľadávaní. @vlkodotnet
Udalosť týždňa: Bing zásnuby s ChatGPT
Minulý týždeň sme sa dočkali buď revolúcie, alebo predstavenia ďalšieho zbytočného trendu na tento rok. Poďme ale pekne postupne vysvetliť, čo sa stalo.
Microsoft uviedol do beta fázy nový projekt. Na ten budete potrebovať Edge prehliadač (to je ten, čo vám Windows vnucuje ako default) a prihlásenie sa do čakačky. Keď sa dostanete na rad, tak sa vám jednoriadkové vyhľadávacie okienko zmení na viacriadkové a vy už sa nebudete pýtať heslovite: "finstat", "london", "snowpark namestovo", "big boots". Ale pekne napíšete to, čo chcete a Bing (to je konkurent Google, čo má cca 3 % trhu) vám okrem výsledkov vyhľadávania do bočného boxu napíše odpoveď, ktorú vyskladala umelá inteligencia podobná tej, čo poháňa ChatGPT. Na rozdiel od ChatGPT táto bude vedieť spracovávať aj aktuálne novinky zverejnené práve teraz na internete.
Už teda vôbec nebudete musieť ísť na stránku s informáciou, ale ju dostanete poskladanú priamo k vám. Teda počkať, čo bude so všetkými tými stránkami, čo tie informácie poskytujú? To sa ešte nevie, ale vraj tá odpoveď bude obsahovať prelinky a to by malo stačiť.
Ak vám toto nepríde, ako revolúcia vo vyhľadávaní, tak určite to bude niečo, čo môže úplne zmeniť to, ako web vyzerá a funguje. Možno si poviete, že nejaký Bing predsa nemôže namútiť veľa vody. A možno máte aj pravdu, ale sám CEO Googlu promptne napísal post o tom, že pripravujú Bard.
Bard bude to isté ako to od Microsoftu (to zatiaľ nemá meno, preto môžeme zatiaľ používať označenie BinGPT), ale bude mať za sebou lepší jazykový model, Google dáta a ... a viac nikto nevie. Dokonca ani demo, ktoré Google pripravilo nedáva presné výsledky (teleskop JWST nebol prvý, ktorý odfotil planétu mimo slnečnej sústavy), takže nasledoval pokles akcií Alphabet o 9 %. A Microsoft akcie zasa o 4 % narástli.
Aby ste mali sami predstavu, čo BinGPT vie, tak prikladám linku na review. Mne to zatiaľ ešte neaktivovali, takže ešte vlastne žijem v "minulom tisícročí".
Na koniec ešte prikladám odkaz na článok od NewYorker (na čítanie odporúčam inkognito mód), ktorý poukazuje na negatívnu stránku takýchto AI modelov. Obsahujú informáciu, ktorá bola spracovaná algoritmom so stratovou kompresiou. Teda vie zhrnúť/aproximovať pôvodnú informáciu, ale nevie už jej pôvodnú podobu. Čo je v podstate to isté, ako funguje náš mozog, samozrejme pokiaľ nemáte fotografickú pamäť. Možno nám preto bude bližšie ako si myslíme.
Zhrniem to: Do vyhľadávania sa nekompromisne dostáva AI a to zmení podobu webu, už len preto, že sa zníži počet preklikov, následne zobrazení reklám a môžeme to nazvať takto epicky:
Veľké vymieranie webov.
Ako funguje GitHub code search?
Ak vás, ako mňa, zaujímajú technológie, ktoré poháňajú vyhľadávanie, tak viete, že štandardný Lucene sa na kód nehodí. Spolieha sa na tokenizer a stopwordy v kóde majú vždy špeciálne postavenie. Preto keď GitHub začal budovať svoje vyhľadávanie v kóde, tak musel ísť inou cestou, ako tradičnou integráciou Lucene. Ich vyhľadávací engine nazvali Blackbird, je napísaný v Ruste, používajú ngram indexy (tie vie aj Lucene, akurát taký index zaberie viac miesta a má viac práce so zmenou), pred zobrazením ešte dokumenty načítajú, prekontrolujú.
Big Data je mŕtvy
Big Data bol kedysi buzzword podobne ako to je dnes s AI. Hovorili, že treba ukladať všetko, lebo všetko sú dáta a na tých záleží. Keď sa to spojilo s tým, že storage začal byť naozaj lacný, tak všetci začali ukladať všetko a vo výsledku má každý hŕbu dát, ktoré nepotrebuje, ale ktoré musí zálohovať, udržiavať a nedajbože aj spracovávať. A pritom stačí z dát odstrániť zbytočnú informáciu, zdeduplikovať, zagregovať. Poväčšine roka aj tak pracujete s dátami, ktoré sú len z malého časového fragmentu. Presne o tom je nasledujúci článok, ktorý sa hodí najmä v tejto dobe, keď sa konečne začína vo firmách šetriť.
Ak neviete, ako začať, tak napríklad SQL je dobrá voľba. Nemusíte ísť hneď do Oracle alebo drahého Microsoft SQL Serveru. Stačí aj PostgreSQL, SQLite alebo DuckDB z nasledujúceho článku (uznávam, ide o poriadny oslí mostík, ale inde sa mi ten článok nehodil).
.NET okienko
Blazor United je prototyp, kde jeden Blazor kód pobeží na serveri aj v prehliadači cez WebAssembly. To neznie vôbec zle, najmä ak sa pravdepodobne dostane už do .NET 8.
Vo firme LEGO očividne robia v .NET. Inak si neviem vysvetliť, prečo by inak zverejnili open-source knižnicu AsyncAPI.NET, ktorá vám vygeneruje AsyncAPI špecifikáciu.
Linky na záver
Dnes začnem JavaScriptom. Vedeli ste, že existuje HTML tag <dialog>, ktorý funguje ako dialóg? Teda už nebudete potrebovať nejakú JS knižnicu pre vyskakovacie okienka. Zaujímavá je aj široká podpora prehliadačov.
10 tipov a trikov pre základné operácie s JavaScript objektami a poľami. Priznám sa, že osobne som spread operátor (...) ešte nezačal používať, ale keďže ho podporujú aktuálne všetky prehliadače, tak by som mal začať.
A pre zmenu 8 príkladov, kedy počítanie s číslom s pohyblivou desatinnou čiarkou je problém. Tradične sú tam príklady, kedy nie je dobré používať equality operáciu, tweet ID ako číslo, atď.
Ak chcete vo svojich fotkách vyhľadávať podľa objektov na nich zobrazených, podľa GPS koordinátov a pritom ich mať u seba vo vlastnom cloude, tak sa vám hodí PhotoPrism. Odporúča 4 z 5 paranoidných programátorov (ten piaty si kódi vlastné riešenie).
Meilisearch je nový open-source search engine, ktorý by mal konkurovať Elasticsearch. Je napísaný v Rust, a teda logicky bude mať pod sebou niečo iné ako Lucene.
Ak máte deti, alebo ste viacerí na byte a radi by ste dali diaľkovo ovládaným autíčkam nový rozmer, tak Hot Wheels uvádza Rift Rally autíčka, ktoré majú kameru a z vašej izby spravia cez AR nový pretekársky svet.
Prídú vám autíčka stále málo? Ak máte naozaj radi AR a vo vrecku zbytočných 350 dolárov, tak si môžete objednať open-source monokel, ktorý si pripnete na okuliare a uvidíte, čo len chcete, teda, čo mu naprogramujete.
Ako programátor neviem robiť pekné UI, ale občas sa snažím. Aby to nevyzeralo úplne zle, tak je tu zopár pravidiel, ktoré stačí dodržiavať.
Vizuálna bodka na záver
V USA bol Super Bowl, a to znamená, že všetci marketéri si pripravili tie najlepšie 1-minútové reklamy.
Bol by som zabudol, jedna vizuálna bodka by mala zohľadňovať aktuálne dianie na LinkedIn.