Displaying Bidirectional Text Concordances in KWIC format
RYCHLÝ, Pavel and Vojtěch KOVÁŘ. Displaying Bidirectional Text Concordances in KWIC format. 2007. |
Other formats:
BibTeX
LaTeX
RIS
|
Basic information | |
---|---|
Original name | Displaying Bidirectional Text Concordances in KWIC format |
Name in Czech | Zobrazování obousměrných textových konkordancí ve formátu KWIC |
Authors | RYCHLÝ, Pavel (203 Czech Republic, guarantor) and Vojtěch KOVÁŘ (203 Czech Republic). |
Edition | 2007. |
Other information | |
---|---|
Original language | English |
Type of outcome | Presentations at conferences |
Field of Study | 10201 Computer sciences, information science, bioinformatics |
Country of publisher | India |
Confidentiality degree | is not subject to a state or trade secret |
RIV identification code | RIV/00216224:14330/07:00019533 |
Organization unit | Faculty of Informatics |
Keywords in English | bidirectional; KWIC; corpus |
Tags | bidirectional, corpus, KWIC |
Tags | International impact, Reviewed |
Changed by | Changed by: RNDr. Vojtěch Kovář, Ph.D., učo 139915. Changed: 20/10/2010 14:33. |
Abstract |
---|
In the paper, we describe the problem of displaying bidirectional texts in the word concordance view and introduce a system that can handle these texts. A few examples of English word sequences in a corpus of Persian are given. We describe display algorithms and corpus input file modifications needed to achieve the correct word order in the concordance view. We also discuss some related problems, e.g. working with neutral characters (like punctuation or numbers) and the recognition of the left-to-right (right-to-left) text boundaries. |
Abstract (in Czech) |
---|
Článek popisuje problém zobrazování konkordancí obousměrných textů a představuje systém, který umí pracovat s těmito texty. Článek obsahuje popis problému, příklady anglických sekvencí v perském korpusu, příslušné zobrazovací algoritmy a potřebné změny ve vstupním souboru korpusu. Také jsou diskutovány některé příbuzné problémy, např. práce s neutrálními znaky. |
Links | |
---|---|
LC536, research and development project | Name: Centrum komputační lingvistiky |
Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky | |
1ET100300414, research and development project | Name: Inteligentní metody pro zvýšení spolehlivosti elektrických sítí |
Investor: Academy of Sciences of the Czech Republic, Intelligentmethods for incresing of reliability of electrical networks | |
1ET100300419, research and development project | Name: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu |
Investor: Academy of Sciences of the Czech Republic, Intelligent Models, Algorithms, Methods and Tools for the Semantic Web (realization) | |
2C06009, research and development project | Name: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Acronym: COT-SEWing) |
Investor: Ministry of Education, Youth and Sports of the CR |
PrintDisplayed: 14/9/2024 02:56