D 2020

Lingvista versus stroj : Rozdíly ve zpracování jazykových rovin – možnosti, úskalí a meze

AUDY MASOPUSTOVÁ, Markéta, Vojtěch MRKÝVKA and Hana ŽIŽKOVÁ

Basic information

Original name

Lingvista versus stroj : Rozdíly ve zpracování jazykových rovin – možnosti, úskalí a meze

Name (in English)

Linguist vs Machine : The Difference Between Language Level Processing – Pitfalls, Possibilities and Limits

Authors

AUDY MASOPUSTOVÁ, Markéta (203 Czech Republic, guarantor, belonging to the institution), Vojtěch MRKÝVKA (203 Czech Republic, belonging to the institution) and Hana ŽIŽKOVÁ (203 Czech Republic, belonging to the institution)

Edition

Wrocłav, Wyraz i zdanie w językach słowiańskich. Monografia II, p. 121-136, 16 pp. 2020

Publisher

Oficyna Wydawnicza ATUT – Wrocłavskie Wydawnictwo Oświatowe

Other information

Language

Czech

Type of outcome

Stať ve sborníku

Field of Study

60203 Linguistics

Country of publisher

Poland

Confidentiality degree

není předmětem státního či obchodního tajemství

Publication form

printed version "print"

References:

RIV identification code

RIV/00216224:14210/20:00119822

Organization unit

Faculty of Arts

ISBN

978-83-7977-554-5

Keywords (in Czech)

lingvistika; zpracování přirozeného jazyka; tokenizace; jazykové roviny; člověk; počítač

Keywords in English

linguistics; natural language processing; tokenisation; language levels; human; computer

Tags

Tags

International impact, Reviewed
Změněno: 25/3/2022 09:30, Mgr. et Mgr. Lucie Racyn

Abstract

V originále

Cílem článku je představit, jakým způsobem k práci s textem přistupuje člověk-lingvista a jak text analyzuje stroj. Prostřednictvím jednotlivých jazykových rovin ukazujeme přednosti a úskalí práce člověka-lingvisty a stroje. V rámci češtiny se postupně věnujeme fonetice a fonologii, tokenizaci, morfologii, syntaxi, stylistice a sémantice. Z popisu obou přístupů je zřejmé, jak jsou diametrálně odlišné, a přestože se věnují analýze přirozeného jazyka, člověk-lingvista i stroj řeší naprosto jiné obtíže, které jim analýzu komplikují. Na závěr článku shrnujeme výhody a nevýhody jednotlivých přístupů. Zatímco člověk-lingvista je pomalý a může chybovat, má však obsáhlou znalost světa a zkušenosti, které ve své práci využívá. Oproti tomu stroj je rychlý a ideálně bezchybný, ale je omezený tím, co ho člověk naučí. Výhodu a rozšířené možnosti spatřujeme ve spolupráci člověka a stroje.

In English

This paper aims to present how a human-linguist is working with text and how is the text analysed by a computer. Through individual language levels, we show the advantages and disadvantages of work of both. Within the Czech language, we gradually focus on phonetics and phonology, tokenisation, morphology, syntax, stylistics and semantics. From the description of both approaches, it is clear how diametrically different they are. While both analyse natural language, a human-linguist and a computer are dealing with entirely different difficulties that complicate their analysis. At the end of the paper, we summarise the advantages and disadvantages of individual approaches. While a human-linguist is slow and can make mistakes, he has extensive knowledge of the world and life experiences which he uses in work. In contrast, the machine is fast and ideally flawless but is limited by what human teach it. We see the advantage and extended possibilities in the cooperation of man and machine.

Links

TL02000146, research and development project
Name: Webový pravopisný, gramatický a typografický korektor pro český jazyk
Investor: Technology Agency of the Czech Republic