k 2007

Displaying Bidirectional Text Concordances in KWIC format

RYCHLÝ, Pavel and Vojtěch KOVÁŘ

Basic information

Original name

Displaying Bidirectional Text Concordances in KWIC format

Name in Czech

Zobrazování obousměrných textových konkordancí ve formátu KWIC

Authors

RYCHLÝ, Pavel (203 Czech Republic, guarantor) and Vojtěch KOVÁŘ (203 Czech Republic)

Edition

2007

Other information

Language

English

Type of outcome

Prezentace na konferencích

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

India

Confidentiality degree

není předmětem státního či obchodního tajemství

RIV identification code

RIV/00216224:14330/07:00019533

Organization unit

Faculty of Informatics

Keywords in English

bidirectional; KWIC; corpus

Tags

International impact, Reviewed
Změněno: 20/10/2010 14:33, RNDr. Vojtěch Kovář, Ph.D.

Abstract

V originále

In the paper, we describe the problem of displaying bidirectional texts in the word concordance view and introduce a system that can handle these texts. A few examples of English word sequences in a corpus of Persian are given. We describe display algorithms and corpus input file modifications needed to achieve the correct word order in the concordance view. We also discuss some related problems, e.g. working with neutral characters (like punctuation or numbers) and the recognition of the left-to-right (right-to-left) text boundaries.

In Czech

Článek popisuje problém zobrazování konkordancí obousměrných textů a představuje systém, který umí pracovat s těmito texty. Článek obsahuje popis problému, příklady anglických sekvencí v perském korpusu, příslušné zobrazovací algoritmy a potřebné změny ve vstupním souboru korpusu. Také jsou diskutovány některé příbuzné problémy, např. práce s neutrálními znaky.

Links

LC536, research and development project
Name: Centrum komputační lingvistiky
Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky
1ET100300414, research and development project
Name: Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
Investor: Academy of Sciences of the Czech Republic, Intelligentmethods for incresing of reliability of electrical networks
1ET100300419, research and development project
Name: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Academy of Sciences of the Czech Republic, Intelligent Models, Algorithms, Methods and Tools for the Semantic Web (realization)
2C06009, research and development project
Name: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Acronym: COT-SEWing)
Investor: Ministry of Education, Youth and Sports of the CR