Autorská práva a Creative Commons Mgr. Tomáš Foltýnek, Ph.D. foltynek@fi.muni.cz Etika a IT Vygenerováno Midjourney /imagine intellectual property rights, internet, creative comons Osnova dnešní přednášky ̶ Opakování: Zkreslení v algoritmech ̶ Martin Tvarožek: Stable diffusion a soudní procesy ̶ Úvod do autorského práva ̶ Základy autorského práva ̶ Creative Commons ̶ Dilemma game: Prodávání cizího ̶ V prezentaci využity materiály Jiřího Marka (ÚVT MU) ̶ Obrázky vygenerovány nástrojem Midjourney Etika a IT 2 Opakování: Zkreslení v algoritmech Data à Informace à Rozhodnutí à Akce à Etické důsledky ̶ Optimalizace na daná kritéria ≠ eticky přijatelné rozhodování ̶ Strojové učení à Nepředvídatelnost ̶ Kvalita rozhodování závisí na ̶ Kvalitě dat (”garbage in, garbage out”) ̶ Kvalitě procesu, který je zpracovává ̶ Proces nemusí být možné zrekonstruovat / vysvětlit / obhájit ̶ Podstatná je akce a její etické důsledky Etika a IT 3 Opakování: Příčiny zkreslení ̶ Umělá inteligence se vždy učí na starých datech ̶ Ta mohou být zkreslená, diskriminační, atd. ̶ Odlišné hodnoty při návrhu systému ̶ Manuální “tagování” zohledňuje hodnoty tagujících ̶ Nastavení ”ground truth” pro učení klasifikátorů ̶ Technická omezení ̶ Zjednodušení algoritmu ̶ Využití externích knihoven (včetně zkreslení) ̶ Jiný kontext užití Etika a IT 4 Opakování: Identifikace obličejů ̶ Nižší úspěšnost není problém jen OpenCV ̶ Všechny systémy vykazují nižší úspěšnost u černochů a u žen ̶ Profesionální systémy pro porovnávání fotografií (pasová kontrola) ̶ Chybovost u bílých mužů cca 1 : 10 000 ̶ U černých žen je chybovost 5x – 10x vyšší ̶ Obojí je stále násobně lepší než vyhodnocování člověkem ̶ Důvody – “pale male data” ̶ Větší zastoupení bělochů a mužů v trénovacích datech (obrázky stažené z webu) ̶ Makeup u žen ̶ Větší kvalita obrázků bělochů ̶ Optimalizace fotoaparátů na bílé obličeje + kvalitnější vybavení Etika a IT 5 Opakování: Systémy pro posuzování CV ̶ Odhad: ¾ životopisů v USA přečte algoritmus, aby rozhodl, jestli je vůbec ukázat člověku ̶ Systémy se učí na životopisech dříve vybraných kandidátů ̶ Jsou-li to především bílí muži, najde identifikující znaky ̶ Zvýhodňující znaky ̶ Thomas, church ̶ Jarred, lacross ̶ Znevýhodňující znaky ̶ women’s college, women’s chess/socker/… club ̶ mezera mezi zaměstnáními delší než 6 měsíců ETIKA A IT 6 Zdroje: Video, článek Opakování: Kdo nese zodpovědnost? ̶ Tradiční pojetí ̶ Programátor rozumí veškerému kódu ̶ Je zodpovědný za jeho fungování ̶ Kód je výsledkem promyšleného návrhu ̶ Rozhodovací mechanismy jsou součástí kódu ̶ Dnešní realita “černých skříněk” ̶ Externí knihovny ̶ Strojové učení ̶ Mezera v zodpovědnosti ̶ Co má návrhář / vývojář pod kontrolou vs. jak se algoritmus chová Etika a IT 7 Opakování: EU AI Act (v přípravě) ̶ Reguluje jakékoliv využívání nástrojů založených na AI ̶ Měl by se stát de facto světovým standardem jako GDPR ̶ Tři úrovně rizika ̶ Nepřijatelné (např. čínské sociální skóre) à zakázáno ̶ Vysoké (kritická infrastruktura, vymáhání práva, vzdělávání,…) à předmět regulace ̶ Nízké (všechno ostatní) à nereguluje se ̶ Povinnosti provozovatelů vysoce rizikových aplikací ̶ Pravidelná analýza rizik ̶ Zveřejnění trénovacích dat (auditovatelnost) ̶ General Purpose AI Systems (GPAIS) ̶ Aplikace využitelné k různým účelům (např. Chat GPT) ̶ Zatím není jisté, zda budou v kategorii „vysoké riziko“ ̶ Předpokládaný časový horizont ̶ Schválení zákona během 2023 ̶ Účinnost za další 2 roky Etika a IT 8 Zdroj: https://www.reuters.com/technology/what-is-european-union-ai-act-2023-03-22/ Opakování: Zkreslení v algoritmech ̶ Je třeba rozlišovat ̶ Chyby v návrhu vs. chyby vzniklé za běhu ̶ Nezamýšlené vedlejší efekty vs. úmyslné zkreslení ̶ I zkreslené algoritmy jsou mnohdy lepší než lidé ̶ Odstranit zkreslení algoritmu je obvykle jednodušší než odstranit předsudky člověka ̶ Je třeba definovat ideální cíl a zajistit, že ̶ tento cíl je etický ̶ algoritmy tento cíl skutečně sledují Etika a IT 9 Úvod do autorského práva Soukromé (fyzické) vlastnictví ̶ Co mi dává právo říct, že je něco moje? ̶ Vlastní suroviny + (fyzické) úsilí ̶ Kde vezmu suroviny? Etika a IT 11 Commons: Pravěk Etika a IT 12 Obrázek převzat z knihy Made with Creative Commons (Paul Stacey and Sarah Hinchliff ) Commons: Středověk Etika a IT 13 Obrázek převzat z knihy Made with Creative Commons (Paul Stacey and Sarah Hinchliff ) Commons: Novověk Etika a IT 14 Obrázek převzat z knihy Made with Creative Commons (Paul Stacey and Sarah Hinchliff ) Commons: Bariéry Etika a IT 15 Obrázek převzat z knihy Made with Creative Commons (Paul Stacey and Sarah Hinchliff ) Duševní vlastnictví ̶ Čím se liší od fyzického? ̶ Výsledek duševního úsilí, nikoliv fyzického ̶ Vytvoření kopie je snazší než vytvoření původního díla ̶ Rozdíl viditelnější v digitálním světě ̶ Kopírování ≠ krádež ̶ Krádeží původní vlastník o předmět přijde Etika a IT 16 Proč vůbec chránit autorská práva? ̶ Rozdělte se na dvě skupiny ̶ Zastánci autorského práva ̶ Ochrana tvůrců má být co nejsilnější ̶ Odpůrci autorského práva ̶ Duševní vlastnictví neexistuje, kdokoliv může cokoliv jakkoliv použít ̶ Sepište své argumenty ̶ Diskutujte Etika a IT 17 Základy autorského práva Dílo ̶ Co je dílo, tj. předmět autorskoprávní ochrany? ̶ „…dílo literární a jiné dílo umělecké a dílo vědecké, které je jedinečným výsledkem tvůrčí činnosti autora a je vyjádřeno v jakékoli objektivně vnímatelné podobě včetně podoby elektronické, trvale nebo dočasně, bez ohledu na jeho rozsah, účel nebo význam… ̶ „idea-expression dichotomy“ ̶ „Dílem podle tohoto zákona není zejména námět díla sám o sobě, denní zpráva nebo jiný údaj sám o sobě, myšlenka, postup, princip, metoda, objev, vědecká teorie, matematický a obdobný vzorec, statistický graf a podobný předmět sám o sobě.“ ̶ Je obrázek vygenerovaný Midjourney dílem??? Etika a IT 19 Obrázek: Midjourney painting Midjourney Zaměstnanecké a školní dílo Zaměstnanecké dílo ̶ Díla vytvořená ke splnění pracovních povinností ̶ Majetková a autorská práva vykonává zaměstnavatel ̶ Má se za to, že autor svolil ke zveřejnění, úpravám, zpracování… Školní dílo ̶ Díla vytvořená v rámci plnění studijních povinností ̶ Osobnostní i majetková práva má autor (student) ̶ Škola má právo na uzavření licenční smlouvy o užití školního díla ̶ Autor může poskytnout licenci jiným subjektům ̶ Škola může požadovat úhradu nákladů Etika a IT 20 Oprávněné užití díla Do práva autorského nezasahuje ten, kdo a) užije v odůvodněné míře výňatky ze zveřejněných děl jiných autorů ve svém díle, b) užije výňatky z díla nebo drobná celá díla pro účely kritiky nebo recenze vztahující se k takovému dílu, vědecké či odborné tvorby, a užití bude v souladu s poctivými zvyklostmi a v rozsahu vyžadovaném konkrétním účelem, c) užije dílo při vyučování pro ilustrační účel nebo při vědeckém výzkumu (…) a nepřesáhne rozsah odpovídající sledovanému účelu Vždy se musí uvést (je-li to možné): jméno autora, název díla a pramen §31 zákona č. 121/2000 Sb. (Autorský zákon) Etika a IT 21 Americké právo: Fair Use ̶ Jaký je účel a charakter užití? ̶ Vzdělávací účel vs. komerční účel ̶ O jaký druh díla jde? ̶ Fakta vs. fikce ̶ Publikované vs. nepublikované ̶ Jak velká část díla je využita? ̶ Jen výňatky, nebo celé dílo? ̶ Jak užití ovlivní trh? ̶ Bude původní autor užitím díla nějak poškozen? Etika a IT 22 Creative Commons Počátky Creative Commons ̶ Lawrence Lessig – profesor práva na Harvardu ̶ Nezisková organizace, USA, 2001 ̶ Autorský zákon zajišťuje ochranu děl 70 let po smrti autora ̶ komerční kultura – díla, která jsou vytvořena za účelem prodeje, případně po svém vzniku prodána ̶ nekomerční kultura – ostatní díla, nebyla původně objektem práva ̶ Pirátství? ̶ Soubor veřejných licencí ̶ Snaha o šíření kultury a kreativity ̶ Kombinace opravňujících a přikazujících licenčních prvků Etika a IT 24 Licenční prvky CC: Share ̶ Právo dílo šířit ̶ Dílo je možné kopírovat, distribuovat a sdělovat veřejnosti ̶ Dílo lze zařadit do souborného díla (např. časopis, sborník) a jako jeho součást jej v nezměněné podobě šířit dál. ̶ Společné u všech CC licencí Etika a IT 25 Licenční prvky CC: Remix ̶ Právo dílo upravovat ̶ Dílo je možné pozměňovat či doplňovat ̶ Celé dílo nebo jeho část zpracovat s jiným dílem ̶ např. dramatizace, překlad, úprava digitálních fotek, zhudebnění nebo remixování hudebních skladeb Etika a IT 26 Licenční prvky CC: Attribution ̶ Povinnost uvést původ ̶ Kdokoliv dílo nebo jeho úpravu šíří, musí uvést údaje o autorovi ̶ Způsob uvedení stanoví autor ̶ Implicitně se uvádí ̶ jméno nebo pseudonym ̶ název díla ̶ odkaz na dílo ̶ odkaz na licenci Etika a IT 27 Licenční prvky CC: Share Alike ̶ Povinnost zachovat licenci ̶ Kdokoliv dílo upraví, musí jej vystavit pod stejnou nebo slučitelnou licencí Etika a IT 28 Licenční prvky CC: Noncommercial ̶ Neužívat komerčně ̶ S dílem lze nakládat pouze pro nekomerční účely ̶ Při šíření díla nesmí plynout zisk ̶ Výměna díla se považuje za nekomerční využití Etika a IT 29 Licenční prvky CC: No derivatives ̶ Neupravovat ̶ Je zakázáno dílo jakkoli pozměňovat či doplňovat ̶ Opak práva Remix ̶ Tyto prvky nelze užít společně Etika a IT 30 Vrstvy CC licencí ̶ Strojově čitelná verze ̶ Creative Commons Uveďte původ 4.0 Mezinárodní License ̶ Lidksy srozumitelný verze ̶ https://creativecommons.org/licenses/by/4.0/deed.cs ̶ Právní ujednání ̶ https://creativecommons.org/licenses/by/4.0/legalcode.cs Etika a IT 31 Druhy CC licencí Etika a IT 32 Použití licence CC ̶ Licence CC umožňují ̶ Sdílet dílo za podmínek, které si sami určí ̶ Zároveň stát na základech autorského práva ̶ Je materiál, který chcete licencovat, předmětem autorského práva? ̶ Jedná se o dílo? ̶ Vlastníte materiál, který chcete licencovat? ̶ Jste oprávnění jej licencovat? ̶ Jste si vědomi toho, že licence CC jsou neodvolatelné? ̶ Kopie na internetu již nemůžete ovlivnit ̶ Jste zastupováni kolektivním správcem? ̶ Poskytnutím licence se vzdáváte práva na odměnu Etika a IT 33 Jak správně uvést původ díla Způsob 1 Dílo “Vizionář", dostupné z https://www.flickr.com/photos/106178443@N 04/10411024235/in/set-72157636812831923, jehož autorem je Lucie Straková, podléhá licenci CC BY-NC 2.0 Generic, jejíž úplné znění licenčních podmínek je dostupné na https://creativecommons.org/licenses/by- nc/2.0/legalcode Způsob 2 Vizionář od Lucie Strakové, CC BY-NC 2.0 Etika a IT 34 Na co si dát pozor ̶ Použitím díla nesmí vzbuzovat domněnku, že vás autor sponzoruje, podporuje nebo je s vámi ve spojení ̶ Toto, společně s možností požádat o neuvádění původu, zajišťuje, aby autor nebyl spojován se způsoby užití díla, se kterými nesouhlasí. ̶ Uvést původ musíte vždy, když je dílo dále šířeno veřejnosti. ̶ V případě, že dílo užíváte pouze pro svoje osobní, nemusíte ho informacemi o původu opatřovat. Etika a IT 35 Dilemma Game Obrázky generovány nástrojem Midjourney /imagine people arguing ethical dilemmas Dilema Game: Prodávání cizího Jste součástí projektu, který má prodávat umělecká díla z internetu jako tištěné obrazy. Váš nadřízený naléhá, ať využíváte pro co největší rozmanitost zboží všechny zdroje, které můžete najít – i díla s licencí CC-BY-NC. Zároveň ale trvá na tom, aby si veškerý zisk nechala právě společnost, pro kterou pracujete, a nedělila se s umělci. Jak budete postupovat? A. Pokračuji s projektem, nikde neporušujeme licence, tudíž neděláme nic nelegálního. B. Informuji vedení společnosti o mých pochybnostech a nechám rozhodnutí, jak postupovat dále, na něm. C. Budu se snažit prosadit práva umělců, pokud se nic nezmění, požádám o přeložení k jinému projektu nebo opustím společnost. D. Okamžitě informuji umělce/média/veřejnost, že dochází k využívání děl s licencí CC pro komerční účely bez vědomí autorů. Etika a IT 37 Příští týden ̶ Téma: Etický hacking ̶ Jak funguje mozek hackera ̶ Jak hackovat legálně (bug bounty programy) ̶ Proč kvůli výzkumu na FI museli všichni Estonci měnit občanky ̶ Úkoly ̶ Poslechnout si podcast z Darknet Diaries o hacknutém twitterovém účtu Donalda Trumpa: https://darknetdiaries.com/episode/87/ Etika a IT 38