1 GitHub Copilot a Stable Diffusion – súdne procesy Martin Tvarožek, 536481 2 GitHub Copilot ̶ AI „párový programátor“ ̶ navrhuje alebo automaticky dopĺňa výrazy a funkcie ̶ trénovaný na verejných GitHub repozitároch a verejne dostupnom kóde ̶ komerčný produkt ($10/mesiac) 3 Stable Diffusion ̶ Stability AI, Midjourney, Dall-E, DreamUp (DeviantArt) ̶ skupina text-to-image modelov ̶ generujú obrázky podľa zadania ̶ trénované na datasete LAION (Large-scale Artificial Intelligence Open Network) ̶ mnohé implementácie majú aj spoplatnené verzie 4 Ďalší z problémov AI... ̶ Na trénovanie AI sú potrebné obrovské datasety ̶ GPT-4 - 570 GB textu ̶ Midjourney – 100+ miliónov obrázkov ̶ Copilot – 159 GB Python kódu ̶ LAION-5B – 5 miliárd obrázkov ̶ v praxi - web scraping, na základe zmluvných podmienok ̶ Daju sa získať takéto datasety legálne a eticky? ̶ Spadá trénovanie AI pod tzv. fair use? ̶ Ako ďalej narábať s výslednými dátami? 5 AI a fair use podľa zákona ̶ EÚ ̶ články 3 a 4 smernice CDSM (2019) ̶ voľné použitie pre vedecké účely ̶ komerčné účely, pokiaľ nie je explicitne vyhradené vlastníkom copyrightu ̶ USA ̶ nie je špecificky vymedzené zákonom ̶ môže porušovať fair use, pokiaľ ide o platený produkt, ktorý nie je transformatívny 6 7 Žaloba na GitHub Copilot ̶ hromadná žaloba (class-action lawsuit) ̶ Matthew Butterick a tím vs. GitHub, Microsoft a OpenAI ̶ konkurencia a poškodenie developerov zneužitím ich vlastného kódu ̶ ohrozenie open-source komunity ̶ vzniknutá škoda viac 9 miliárd dolárov iba za porušenie DMCA 8 Čo Copilot porušuje? ̶ 11 open-source licencií ̶ MIT, GPL, Apache,... ̶ podmienky používania a zásady ochrany súkromia GitHubu ̶ sekciu 1202 DMCA ̶ California Consumer Privacy Act ̶ konšpirácia 9 Žaloba na Stable Diffusion ̶ hromadná žaloba (class-action lawsuit) ̶ Matthew Butterick a tím + umelci vs. Stability AI, Midjourney a DeviantArt ̶ DeviantArt povolil trénovanie AI na obrázkoch z ich platformy ̶ vytlačenie umelcov z trhu zneužitím ich výtvorov ̶ vzniknutá škoda v hodnote viac ako 5 miliárd dolárov 10 Getty Images vs. Stable Diffusion ̶ Stable Diffusion generuje obrázky s Getty Images vodoznakom ̶ obvinenie - dataset obsahoval 12 miliónov obrázkov z Getty Images ̶ Getty Images žiada odškodnenie 1.8 bilióna dolárov 11 12 Otázky do diskusie ̶ S ktorou stranou súhlasíte? Sú prípady GitHub Copilot a Stable Diffusion férové použitie verejne dostupných dát alebo digitálne pirátstvo? ̶ Mali by byť umelci, programátori, atď. chránení pred hrozbou AI alebo by sa mali „prispôsobiť dobe“? ̶ Zmenil by sa váš názor keby tieto služby neboli spoplatnené a boli by transparentnejšie? 13 Použité zdroje ̶ https://github.com/features/copilot ̶ https://githubcopilotinvestigation.com ̶ https://githubcopilotlitigation.com/ ̶ https://lwn.net/Articles/914150/ ̶ https://stablediffusionlitigation.com/ ̶ https://www.theverge.com/2023/1/16/23557098/generative-ai- art-copyright-legal-lawsuit-stable-diffusion-midjourney-deviantart ̶ https://petapixel.com/2023/02/07/getty-images-are-suing-stable- diffusion-for-a-staggering-1-8-trillion/ ̶ https://www.theverge.com/2023/2/6/23587393/ai-art-copyright- lawsuit-getty-images-stable-diffusion ̶ https://sinews.siam.org/Details-Page/ethical-concerns-of-code- generation-through-artificial-intelligence ̶ https://copyrightblog.kluweriplaw.com/2023/02/20/protecting- creatives-or-impeding-progress-machine-learning-and-the-eu- copyright-framework/ ̶ https://eur-lex.europa.eu/legal- content/EN/TXT/?uri=CELEX%3A32019L0790#003 14 Ďakujem za pozornosť :^)