Detailed Information on Publication Record
2023
Systém portálu AHISTO
HORÁK, Aleš, Adam RAMBOUSEK, Pavel RYCHLÝ, Vít NOVOTNÝ, Tereza VRABCOVÁ et. al.Basic information
Original name
Systém portálu AHISTO
Authors
HORÁK, Aleš (203 Czech Republic, guarantor, belonging to the institution), Adam RAMBOUSEK (203 Czech Republic, belonging to the institution), Pavel RYCHLÝ (203 Czech Republic, belonging to the institution), Vít NOVOTNÝ (203 Czech Republic, belonging to the institution) and Tereza VRABCOVÁ (203 Czech Republic, belonging to the institution)
Edition
2023
Other information
Language
English
Type of outcome
Software
Field of Study
10201 Computer sciences, information science, bioinformatics
Country of publisher
Czech Republic
Confidentiality degree
není předmětem státního či obchodního tajemství
References:
RIV identification code
RIV/00216224:14330/23:00134482
Organization unit
Faculty of Informatics
Keywords (in Czech)
OCR; historické dokumenty; detekce jmenných entit; korpus
Keywords in English
OCR; corpora; medieval documents; named entity detection
Technical parameters
Software portálu systému AHISTO je provozován v prostředí Centra zpracování přirozeného jazyka na veřejně přístupném webovém portálu.
Tags
International impact, Reviewed
Změněno: 23/5/2023 19:36, RNDr. Adam Rambousek, Ph.D.
Abstract
V originále
Softwarové nástroje pro vytvoření portálu historických dokumentů. Systém se skládá z modulu pro OCR naskenovaných archivních dokumentů, dále hromadný import regestů z formátu DOCX. Všechny dokumenty jsou uloženy ve standardním formátu XML CEI a zpřístupněny pomocí webového portálu. Webový portál umožňuje vyhledávání naskenovaných edic a regestů podle různých kritérií, procházení edic včetně metadat a textového přepisu, prohlížení regestů v režimech pro laiky a odborníky, a pro autentizované uživatele také možnost editace regestů.
Links
TL03000365, research and development project |
|