Velké jazykové modely v právu I.
Tereza Novotná, tereza.novotna@law.muni.cz
2
Osnova
1. LLMs a jak fungují
1. Algoritmy
2. Data
2. Seznam modelů a seznam témat
3. LLMs v právu a jak je používat
4. Regulace a metodiky
3
Large Language Models
4
Large Language Models
̶ LLMs (velké jazykové modely) jsou modely strojového učení, které jsou navrženy tak, aby
se naučily statistické vlastnosti obsahu textu a generovaly nový text, který napodobuje styl
původního vstupního textu.
̶ Modely LLM jsou vytvářeny pomocí techniky strojového učení známé jako Deep Learning.
Hluboké učení je podmnožinou umělé inteligence, která je schopna učit se složité vzory v
datech. Hluboké učení je realizováno pomocí neuronových sítí, což jsou výpočetní systémy,
které jsou inspirovány schopností mozku učit se ze zkušeností. Algoritmy hlubokého učení
lze zpracovávat velké datasety a mohou se učit z dat, která nejsou strukturovaná nebo
označená. Díky tomu jsou vhodné pro zpracování přirozeného jazyka (NLP).
5
Large Language Models
̶ LLM používají neuronové sítě založené na transformátoru (model strojového učení), který si
poradí s velkým množstvím dat, protože může paralelizovat trénování, a vytvářet tak opravdu
velké modely.
̶ Přístup, který LLM používají, se nazývá autoregresní model, což je feed-forward model,
který předpovídá další slovo z množiny slov dané kontextem.
̶ Výkonnost LLM je založena na množství dat a počtu parametrů. Parametry jsou
synonymem pro váhy, což je termín používaný pro parametry neuronových sítí. Váhy jsou to,
co se učící algoritmus naučí během trénování.
̶ Data pro trénování modelů se používají z internetu, knih a dalších zdrojů, aby se natrénovalo
hluboké porozumění lidskému jazyku.
6
Large Language Models
̶ LLM jsou dnes známé především pro generování textů (chatboty), lze je však využít i pro
různé úlohy související s textem (vyhledávání informací, sumarizace apod.).
̶ Chatboty založené na LLM jsou aplikace postavené na LLM, které se dokážou přizpůsobit
různým vstupům od uživatelů, chápat nuance a poskytovat relevantní odpovědi.
̶ Generativní umělá inteligence jsou modely, které mohou zahrnovat celou řadu úloh nad
rámec generování jazyka, včetně generování obrázků a videí, skládání hudby a dalších.
̶ Fine-tuning LLM je proces přetrénování předem natrénovaného jazykového modelu na
konkrétní úlohu nebo soubor dat s cílem přizpůsobit jej pro konkrétní aplikaci.
7
Chatboty
1. ChatGPT: Konverzační platforma, která využívá modely GPT a kterou vyvinula společnost OpenAI, dokáže generovat text pro různé
úkoly, jako jsou odpovědi na otázky, hledání tvůrčí inspirace a učení se něčemu novému.
2. Bing Chat: Nová funkce služby Microsoft Bing založená na modelech GPT, která vám umožní komunikovat s chatbotem s umělou
inteligencí, který vám odpoví na vaše dotazy, pomůže vám s úkoly a vygeneruje pro vás kreativní obsah.
3. Google Bard: Využívá PaLM 2, odlehčenou a optimalizovanou verzi LaMDA. Na rozdíl od jiných chatbotů využívajících LLM, jako je
ChatGPT, může Google Bard přistupovat k internetu a získávat informace z různých zdrojů, jako je například vyhledávač Google.
4. Perplexity: Využívá možnosti modelů GPT společnosti OpenAI. Dokáže vygenerovat obecnou odpověď na váš dotaz, po které
následuje řada odkazů na webové stránky, které AI považuje za relevantní k vašemu dotazu. Můžete také položit doplňující otázky
nebo upřesnit svůj dotaz.
5. LLaMa via Perplexity: Model LLaMa je rodina modelů LLM, které vydala společnost Meta AI; dodává se ve čtyřech velikostech, v
těchto verzích jsou k dispozici čtyři varianty: 7B, 13B, 33B a 65B parametrů. Model LLaMa lze použít jako základ pro doladění nebo
přizpůsobení konkrétním aplikacím nebo případům použití, například chatbotům, vyhledávačům, sumarizátorům, překladačům a
dalším.
6. SciSpace: Jedná se o nástroj k rešerši odborných zdrojů a vědeckých článků i se zdroji.
8
LLMs v právu a jak je používat
̶ LLM generuje odpověď pouze v případě, že informace (data) byly poskytnuty během
tréninkové fáze.
̶ Velký problém u právních otázek týkajících se národních právních systémů (jako je CZ nebo
jakýkoli jiný "menší" a neanglický národní právní systém) - nedostatek údajů nebo velmi
omezené množství údajů a z irelevantních zdrojů.
̶ Problém související s daty - nedostupnost dat a datových souborů (korpusů) právních
textů (soudních rozhodnutí, právních předpisů).
9
LLMs v právu a jak je používat
Kdy může pronajímatel zvednout nájemné dle české právní
úpravy?
10
LLMs v právu a jak je používat
̶ Právní rešerše
̶ Sumarizace
̶ Anotace, shrnutí případů – FIRAC, extrakce argumentů
̶ Editace
̶ Psaní smluv
11
Limity LLMs v právu
̶ Nikdy nevkládejte osobní údaje ani neveřejné informace!
̶ Ptejte se na zdroje a argumentaci.
̶ Vždy kontrolujte výsledek, odpovědnost je vždy na uživateli.
12
Tipy pro používání
̶ Poskytni co nejvíc detailů.
̶ Iteruj otázku.
̶ Požaduj uvažování, které vedlo k odpovědi, krok za krokem.
13
Metodiky
̶ Stanovisko MUNI k užití AI ve výuce
̶ Stanovisko ČAKu
14
Regulace
̶ AI Act
̶ Záruky ochrany práv čl. 22 GDPR
̶ Autorskoprávní otázky – práva k datům a algoritmům
15
Díky za pozornost!