2020
InterCorp: viele Sprachen - ein Korpus (Ein multilinguales Parallelkorpus (nicht nur) europäischer Sprachen)
KÁŇA, TomášZákladní údaje
Originální název
InterCorp: viele Sprachen - ein Korpus (Ein multilinguales Parallelkorpus (nicht nur) europäischer Sprachen)
Název česky
InterCorp: jeden korpus s mnoha jazyky (Mnohojazyčný paralelní korpus (nejen) evropských jazyků)
Název anglicky
InterCorp: Many Languages - One Corpus (A Multilingual Paralellcorpus of (not only) European Languages)
Autoři
Vydání
Deutsch in Europa: Sprachpolitisch, grammatisch, methodisch (56. Jahrestagung des Leibniz-Instituts für Deutsche Sprache), 2020
Další údaje
Jazyk
němčina
Typ výsledku
Konferenční abstrakt
Obor
60202 Specific languages
Stát vydavatele
Německo
Utajení
není předmětem státního či obchodního tajemství
Odkazy
Organizační jednotka
Pedagogická fakulta
Klíčová slova česky
InterCorp; nová verze; technický popis
Klíčová slova anglicky
InterCorp; new release; features
Změněno: 11. 4. 2020 15:39, doc. Mgr. Tomáš Káňa, Ph.D.
V originále
Das Projekt InterCorp startete 2005 in Prag mit dem Ziel ein mehrsprachiges Parallelkorpus für akademische Zwecke zu entwickeln. In den ersten Versionen beinhaltete das Korpus parallele und zum Tschechischen alignierte Texte in zwanzig (meist europäischen Sprachen), im letzten Release (Version 12, vom 12.12.2019) sind es bereits 40 Sprachen (u.a. auch Hebräisch, Chinesisch, Hindi oder Vietnamesisch). Prinzipiell ist InterCorp eine Reihe von einsprachigen Korpora (mit synchronen Texten verschiedener Genres) und stellt somit ein einmaliges Instrument für sowohl kontrastive als auch intrasprachliche Untersuchungen dar. Die meisten Parallelen sind auch lemmatisiert und morpho-syntaktisch annotiert, somit lassen sich auch rasch statistische Daten über die Texte abrufen. Auf der Methodenmesse werde ich die Eckdaten von InterCorp präsentieren, sowie die Möglichkeiten der Arbeit mit dem Korpusmanager „Kontext“ vorstellen. Dabei wird auch auf Problempunkte in den Funktionen und bei der Korpuserstellung hingewiesen.
Česky
Stručný popis historie vzniku, popis nejnovější verze paralelního mnohojazykového korpusu InterCorp