AUDY MASOPUSTOVÁ, Markéta, Vojtěch MRKÝVKA and Hana ŽIŽKOVÁ. Lingvista versus stroj : Rozdíly ve zpracování jazykových rovin – možnosti, úskalí a meze (Linguist vs Machine : The Difference Between Language Level Processing – Pitfalls, Possibilities and Limits). In Beley, Oleh. Wyraz i zdanie w językach słowiańskich. Monografia II. Wrocłav: Oficyna Wydawnicza ATUT – Wrocłavskie Wydawnictwo Oświatowe, 2020, p. 121-136. ISBN 978-83-7977-554-5.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Lingvista versus stroj : Rozdíly ve zpracování jazykových rovin – možnosti, úskalí a meze
Name (in English) Linguist vs Machine : The Difference Between Language Level Processing – Pitfalls, Possibilities and Limits
Authors AUDY MASOPUSTOVÁ, Markéta (203 Czech Republic, guarantor, belonging to the institution), Vojtěch MRKÝVKA (203 Czech Republic, belonging to the institution) and Hana ŽIŽKOVÁ (203 Czech Republic, belonging to the institution).
Edition Wrocłav, Wyraz i zdanie w językach słowiańskich. Monografia II, p. 121-136, 16 pp. 2020.
Publisher Oficyna Wydawnicza ATUT – Wrocłavskie Wydawnictwo Oświatowe
Other information
Original language Czech
Type of outcome Proceedings paper
Field of Study 60203 Linguistics
Country of publisher Poland
Confidentiality degree is not subject to a state or trade secret
Publication form printed version "print"
WWW URL
RIV identification code RIV/00216224:14210/20:00119822
Organization unit Faculty of Arts
ISBN 978-83-7977-554-5
Keywords (in Czech) lingvistika; zpracování přirozeného jazyka; tokenizace; jazykové roviny; člověk; počítač
Keywords in English linguistics; natural language processing; tokenisation; language levels; human; computer
Tags rivok
Tags International impact, Reviewed
Changed by Changed by: Mgr. et Mgr. Lucie Racyn, učo 445546. Changed: 25/3/2022 09:30.
Abstract
Cílem článku je představit, jakým způsobem k práci s textem přistupuje člověk-lingvista a jak text analyzuje stroj. Prostřednictvím jednotlivých jazykových rovin ukazujeme přednosti a úskalí práce člověka-lingvisty a stroje. V rámci češtiny se postupně věnujeme fonetice a fonologii, tokenizaci, morfologii, syntaxi, stylistice a sémantice. Z popisu obou přístupů je zřejmé, jak jsou diametrálně odlišné, a přestože se věnují analýze přirozeného jazyka, člověk-lingvista i stroj řeší naprosto jiné obtíže, které jim analýzu komplikují. Na závěr článku shrnujeme výhody a nevýhody jednotlivých přístupů. Zatímco člověk-lingvista je pomalý a může chybovat, má však obsáhlou znalost světa a zkušenosti, které ve své práci využívá. Oproti tomu stroj je rychlý a ideálně bezchybný, ale je omezený tím, co ho člověk naučí. Výhodu a rozšířené možnosti spatřujeme ve spolupráci člověka a stroje.
Abstract (in English)
This paper aims to present how a human-linguist is working with text and how is the text analysed by a computer. Through individual language levels, we show the advantages and disadvantages of work of both. Within the Czech language, we gradually focus on phonetics and phonology, tokenisation, morphology, syntax, stylistics and semantics. From the description of both approaches, it is clear how diametrically different they are. While both analyse natural language, a human-linguist and a computer are dealing with entirely different difficulties that complicate their analysis. At the end of the paper, we summarise the advantages and disadvantages of individual approaches. While a human-linguist is slow and can make mistakes, he has extensive knowledge of the world and life experiences which he uses in work. In contrast, the machine is fast and ideally flawless but is limited by what human teach it. We see the advantage and extended possibilities in the cooperation of man and machine.
Links
TL02000146, research and development projectName: Webový pravopisný, gramatický a typografický korektor pro český jazyk
Investor: Technology Agency of the Czech Republic
PrintDisplayed: 20/7/2024 05:24