D 2020

Lingvista versus stroj : Rozdíly ve zpracování jazykových rovin – možnosti, úskalí a meze

AUDY MASOPUSTOVÁ, Markéta, Vojtěch MRKÝVKA a Hana ŽIŽKOVÁ

Základní údaje

Originální název

Lingvista versus stroj : Rozdíly ve zpracování jazykových rovin – možnosti, úskalí a meze

Název anglicky

Linguist vs Machine : The Difference Between Language Level Processing – Pitfalls, Possibilities and Limits

Autoři

AUDY MASOPUSTOVÁ, Markéta (203 Česká republika, garant, domácí), Vojtěch MRKÝVKA (203 Česká republika, domácí) a Hana ŽIŽKOVÁ (203 Česká republika, domácí)

Vydání

Wrocłav, Wyraz i zdanie w językach słowiańskich. Monografia II, od s. 121-136, 16 s. 2020

Nakladatel

Oficyna Wydawnicza ATUT – Wrocłavskie Wydawnictwo Oświatowe

Další údaje

Jazyk

čeština

Typ výsledku

Stať ve sborníku

Obor

60203 Linguistics

Stát vydavatele

Polsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Kód RIV

RIV/00216224:14210/20:00119822

Organizační jednotka

Filozofická fakulta

ISBN

978-83-7977-554-5

Klíčová slova česky

lingvistika; zpracování přirozeného jazyka; tokenizace; jazykové roviny; člověk; počítač

Klíčová slova anglicky

linguistics; natural language processing; tokenisation; language levels; human; computer

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 25. 3. 2022 09:30, Mgr. et Mgr. Lucie Racyn

Anotace

V originále

Cílem článku je představit, jakým způsobem k práci s textem přistupuje člověk-lingvista a jak text analyzuje stroj. Prostřednictvím jednotlivých jazykových rovin ukazujeme přednosti a úskalí práce člověka-lingvisty a stroje. V rámci češtiny se postupně věnujeme fonetice a fonologii, tokenizaci, morfologii, syntaxi, stylistice a sémantice. Z popisu obou přístupů je zřejmé, jak jsou diametrálně odlišné, a přestože se věnují analýze přirozeného jazyka, člověk-lingvista i stroj řeší naprosto jiné obtíže, které jim analýzu komplikují. Na závěr článku shrnujeme výhody a nevýhody jednotlivých přístupů. Zatímco člověk-lingvista je pomalý a může chybovat, má však obsáhlou znalost světa a zkušenosti, které ve své práci využívá. Oproti tomu stroj je rychlý a ideálně bezchybný, ale je omezený tím, co ho člověk naučí. Výhodu a rozšířené možnosti spatřujeme ve spolupráci člověka a stroje.

Anglicky

This paper aims to present how a human-linguist is working with text and how is the text analysed by a computer. Through individual language levels, we show the advantages and disadvantages of work of both. Within the Czech language, we gradually focus on phonetics and phonology, tokenisation, morphology, syntax, stylistics and semantics. From the description of both approaches, it is clear how diametrically different they are. While both analyse natural language, a human-linguist and a computer are dealing with entirely different difficulties that complicate their analysis. At the end of the paper, we summarise the advantages and disadvantages of individual approaches. While a human-linguist is slow and can make mistakes, he has extensive knowledge of the world and life experiences which he uses in work. In contrast, the machine is fast and ideally flawless but is limited by what human teach it. We see the advantage and extended possibilities in the cooperation of man and machine.

Návaznosti

TL02000146, projekt VaV
Název: Webový pravopisný, gramatický a typografický korektor pro český jazyk
Investor: Technologická agentura ČR, Webový pravopisný, gramatický a typografický korektor pro český jazyk