RYCHLÝ, Pavel and Vojtěch KOVÁŘ. Displaying Bidirectional Text Concordances in KWIC format. 2007.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Displaying Bidirectional Text Concordances in KWIC format
Name in Czech Zobrazování obousměrných textových konkordancí ve formátu KWIC
Authors RYCHLÝ, Pavel (203 Czech Republic, guarantor) and Vojtěch KOVÁŘ (203 Czech Republic).
Edition 2007.
Other information
Original language English
Type of outcome Presentations at conferences
Field of Study 10201 Computer sciences, information science, bioinformatics
Country of publisher India
Confidentiality degree is not subject to a state or trade secret
RIV identification code RIV/00216224:14330/07:00019533
Organization unit Faculty of Informatics
Keywords in English bidirectional; KWIC; corpus
Tags bidirectional, corpus, KWIC
Tags International impact, Reviewed
Changed by Changed by: RNDr. Vojtěch Kovář, Ph.D., učo 139915. Changed: 20/10/2010 14:33.
Abstract
In the paper, we describe the problem of displaying bidirectional texts in the word concordance view and introduce a system that can handle these texts. A few examples of English word sequences in a corpus of Persian are given. We describe display algorithms and corpus input file modifications needed to achieve the correct word order in the concordance view. We also discuss some related problems, e.g. working with neutral characters (like punctuation or numbers) and the recognition of the left-to-right (right-to-left) text boundaries.
Abstract (in Czech)
Článek popisuje problém zobrazování konkordancí obousměrných textů a představuje systém, který umí pracovat s těmito texty. Článek obsahuje popis problému, příklady anglických sekvencí v perském korpusu, příslušné zobrazovací algoritmy a potřebné změny ve vstupním souboru korpusu. Také jsou diskutovány některé příbuzné problémy, např. práce s neutrálními znaky.
Links
LC536, research and development projectName: Centrum komputační lingvistiky
Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky
1ET100300414, research and development projectName: Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
Investor: Academy of Sciences of the Czech Republic, Intelligentmethods for incresing of reliability of electrical networks
1ET100300419, research and development projectName: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Academy of Sciences of the Czech Republic, Intelligent Models, Algorithms, Methods and Tools for the Semantic Web (realization)
2C06009, research and development projectName: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Acronym: COT-SEWing)
Investor: Ministry of Education, Youth and Sports of the CR
PrintDisplayed: 25/7/2024 19:06