AUDY MASOPUSTOVÁ, Markéta, Vojtěch MRKÝVKA a Hana ŽIŽKOVÁ. Lingvista versus stroj : Rozdíly ve zpracování jazykových rovin – možnosti, úskalí a meze. In Beley, Oleh. Wyraz i zdanie w językach słowiańskich. Monografia II. Wrocłav: Oficyna Wydawnicza ATUT – Wrocłavskie Wydawnictwo Oświatowe, 2020, s. 121-136. ISBN 978-83-7977-554-5.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Lingvista versus stroj : Rozdíly ve zpracování jazykových rovin – možnosti, úskalí a meze
Název anglicky Linguist vs Machine : The Difference Between Language Level Processing – Pitfalls, Possibilities and Limits
Autoři AUDY MASOPUSTOVÁ, Markéta (203 Česká republika, garant, domácí), Vojtěch MRKÝVKA (203 Česká republika, domácí) a Hana ŽIŽKOVÁ (203 Česká republika, domácí).
Vydání Wrocłav, Wyraz i zdanie w językach słowiańskich. Monografia II, od s. 121-136, 16 s. 2020.
Nakladatel Oficyna Wydawnicza ATUT – Wrocłavskie Wydawnictwo Oświatowe
Další údaje
Originální jazyk čeština
Typ výsledku Stať ve sborníku
Obor 60203 Linguistics
Stát vydavatele Polsko
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW URL
Kód RIV RIV/00216224:14210/20:00119822
Organizační jednotka Filozofická fakulta
ISBN 978-83-7977-554-5
Klíčová slova česky lingvistika; zpracování přirozeného jazyka; tokenizace; jazykové roviny; člověk; počítač
Klíčová slova anglicky linguistics; natural language processing; tokenisation; language levels; human; computer
Štítky rivok
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnila: Mgr. et Mgr. Lucie Tomaňová, učo 445546. Změněno: 25. 3. 2022 09:30.
Anotace
Cílem článku je představit, jakým způsobem k práci s textem přistupuje člověk-lingvista a jak text analyzuje stroj. Prostřednictvím jednotlivých jazykových rovin ukazujeme přednosti a úskalí práce člověka-lingvisty a stroje. V rámci češtiny se postupně věnujeme fonetice a fonologii, tokenizaci, morfologii, syntaxi, stylistice a sémantice. Z popisu obou přístupů je zřejmé, jak jsou diametrálně odlišné, a přestože se věnují analýze přirozeného jazyka, člověk-lingvista i stroj řeší naprosto jiné obtíže, které jim analýzu komplikují. Na závěr článku shrnujeme výhody a nevýhody jednotlivých přístupů. Zatímco člověk-lingvista je pomalý a může chybovat, má však obsáhlou znalost světa a zkušenosti, které ve své práci využívá. Oproti tomu stroj je rychlý a ideálně bezchybný, ale je omezený tím, co ho člověk naučí. Výhodu a rozšířené možnosti spatřujeme ve spolupráci člověka a stroje.
Anotace anglicky
This paper aims to present how a human-linguist is working with text and how is the text analysed by a computer. Through individual language levels, we show the advantages and disadvantages of work of both. Within the Czech language, we gradually focus on phonetics and phonology, tokenisation, morphology, syntax, stylistics and semantics. From the description of both approaches, it is clear how diametrically different they are. While both analyse natural language, a human-linguist and a computer are dealing with entirely different difficulties that complicate their analysis. At the end of the paper, we summarise the advantages and disadvantages of individual approaches. While a human-linguist is slow and can make mistakes, he has extensive knowledge of the world and life experiences which he uses in work. In contrast, the machine is fast and ideally flawless but is limited by what human teach it. We see the advantage and extended possibilities in the cooperation of man and machine.
Návaznosti
TL02000146, projekt VaVNázev: Webový pravopisný, gramatický a typografický korektor pro český jazyk
Investor: Technologická agentura ČR, Webový pravopisný, gramatický a typografický korektor pro český jazyk
VytisknoutZobrazeno: 7. 7. 2024 11:25