RYCHLÝ, Pavel, Pavel ŠMERK and Karel PALA. DESAM – morfologicky označkovaný korpus českých textů (DESAM - tagged corpus of Czech texts). 2010.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name DESAM – morfologicky označkovaný korpus českých textů
Name (in English) DESAM - tagged corpus of Czech texts
Authors RYCHLÝ, Pavel (203 Czech Republic, guarantor, belonging to the institution), Pavel ŠMERK (203 Czech Republic, belonging to the institution) and Karel PALA (203 Czech Republic, belonging to the institution).
Edition 2010.
Other information
Original language Czech
Type of outcome Pilot plant, certified technology, variety, breed
Field of Study 60200 6.2 Languages and Literature
Country of publisher Czech Republic
Confidentiality degree is not subject to a state or trade secret
WWW URL
RIV identification code RIV/00216224:14330/10:00047870
Organization unit Faculty of Informatics
Keywords (in Czech) morfologie; gramatické značky; lemmatizace; značkování
Keywords in English morphology; annotation; Czech; lemmatization; grammatical tags
Technical parameters morfologicky označkovaný korpus českých textů, smlouva se Seznam.cz (IČ 26168685) ze dne 25.11.2010
Changed by Changed by: doc. Mgr. Pavel Rychlý, Ph.D., učo 3692. Changed: 29/4/2011 10:08.
Abstract
DESAM je morfologicky označkovaný korpus českých textů v rozsahu 2 689 dokumentů (tj. 48 687 vět, 1 042 446 tokenů)
Abstract (in English)
DESAM is a morphologically tagged corpus of czech texts. It consists of 2689 documents, i.e. 48687 sentences and 1042446 tokens.
Links
LC536, research and development projectName: Centrum komputační lingvistiky
Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky
2C06009, research and development projectName: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Acronym: COT-SEWing)
Investor: Ministry of Education, Youth and Sports of the CR
PrintDisplayed: 29/3/2024 08:23