Co to je, jak to funguje, a proč to lže
Ve spolupráci s odborníky z mnoha oborů přinášíme seriál o umělé inteligenci. Úvodní text pro nás napsal právník Petr Kohout.
Umělá inteligence neboli AI, z anglického artificial intelligence, je pojem, se kterým se dnes setkáte úplně všude. Ať posloucháte rádio, sledujete televizi, čtete se noviny nebo internetový magazín – všude se mluví a píše o umělé inteligenci. Jenže umělá inteligence není zas taková novinka, jak by se mohlo zdát. Je s námi již docela dlouho, a pomáhá nám, i když si to často vůbec neuvědomujeme.
Možná teď přemýšlíte, kde tedy ta umělá inteligence je. Umělá inteligence je například součástí řady on-line hudebních a streamovacích aplikací, kde pomáhá vybírat a navrhovat další obsah, který by se vám mohl líbit. Nepoužíváte hudební aplikace? Ale umělou inteligenci, díky níž nemáte každý den zahlcenou e-mailovou schránku nesmyslnými nebo nebezpečnými zprávami, tu určitě využíváte. Stejně tak umělou inteligenci využívají navigační aplikace, když vybírají nejlepší trasy na základě provozu, oprav, uzavírek a tak dále. Nebo nejnovější samořiditelná auta… To je jen pár příkladů, kde se s AI můžete dnes setkat.
I když se o umělé inteligenci hodně mluví, ne vždy se dostatečně vysvětluje, jak vlastně funguje. A byť je to téma velmi složité, a dokonce ani vědci a vývojáři nemohou s jistotou potvrdit, jaké přesně konkrétní procesy ve velkých jazykových modelech probíhají, považuji alespoň elementární znalost teorie AI, zejména tedy AI chatbotů, za podstatnou pro pochopení toho, co od nich můžeme očekávat.
Velké jazykové modely jsou tedy nejprve „učeny“ na ohromném množství dat. To může být první kámen úrazu, neboť naprostá většina učebních dat veřejně dostupných nástrojů je v angličtině. Proto, když se budete ptát například na nějaké české nepříliš známé jméno, dostanete špatnou odpověď, protože v učebních materiálech se takové jméno vůbec neobjevuje. Následně může probíhat takzvaný fine tuning – tedy ladění modelu. V tomto případě může lidská obsluha označovat relevantní data, a tím model učit, které informace jsou správné a které nesprávné, které informace jsou podstatné a které nepodstatné. Takové ladění probíhá většinou u AI nástrojů, které jsou určeny na nějaké konkrétní využití, např. v medicíně.
Nežije, nemyslí, v matice plave
Byť to podle některých zpráv z médií nemusí být úplně zřejmé, tak současné příklady umělé inteligence nejsou ani živé, ani myslící. Jsou to v podstatě pravděpodobnostní modely. AI nemluví, jen na základě pravděpodobnosti předpovídá pozici jednotlivých částí slov, a tedy i nejpravděpodobnější odpovědi. I to je důvod, proč můžeme mít někdy pocit, že AI lže. Jenže tím bychom přisuzovali „stroji“ vlastnosti lidí. Jak jsme uvedli výše, AI je pravděpodobnostní model, takže nástroj se pokaždé snaží dávat tu nejpravděpodobnější a nejrelevantnější odpověď, jakou zná. Pokud tedy odpovídá špatně, je to většinou proto, že správnou odpověď prostě nezná – což sám model neví, není schopen rozlišit, co správné je a co nikoli, a nabízí nám tedy takovou odpověď, kterou má ve svých datech jako nejpravděpodobnější.
Jazykové modely jsou také odkázány na to, co se naučily z tréninkových dat, případně, co se naučily z interakcí s uživateli. Pokud jsou data nesourodá, obsahují chyby, pak i reakce umělé inteligence mohou být vadné. Typickým příkladem mohou být počty. První veřejné jazykové modely byly velice špatné v matematice. Bylo to proto, že ve skutečnosti vůbec matematické operace nerealizovaly. To, že na dotaz, kolik je 2 + 2, odpověděly 4, nebylo výsledkem skutečného počítání, ale jejich znalosti dat. V tréninkových datech se prostě mnohokrát tento příklad i jeho výsledek opakovaly. Pokud bych nějakému malému lokálnímu modelu poskytoval v datových souborech informaci, že výsledkem výše uvedeného příkladu je 5, sám by mi pak takovou informaci vracel jako odpověď.
Možná teď máte pocit, že tento druh teorie je nepodstatný, protože pro vás je důležitý výsledek, a třeba za implementaci vybraného AI nástroje na váš úřad bude stejně odpovědný dodavatel. Jenže teprve když víte, jak nástroj funguje, můžete si dávat realistické cíle. Budete vědět, co od AI nástrojů můžete v základu očekávat, a stanete se respektovaným partnerem při jednání s dodavateli. Přeskočit tedy tento „seznamovací“ krok by mohla být nejenom škoda – protože je to zajímavé téma, ale v důsledku by to mohlo být také značně nehospodárné.
Mgr. Petr Kohout