2023
Systém portálu AHISTO
HORÁK, Aleš, Adam RAMBOUSEK, Pavel RYCHLÝ, Vít NOVOTNÝ, Tereza VRABCOVÁ et. al.Základní údaje
Originální název
Systém portálu AHISTO
Autoři
HORÁK, Aleš (203 Česká republika, garant, domácí), Adam RAMBOUSEK (203 Česká republika, domácí), Pavel RYCHLÝ (203 Česká republika, domácí), Vít NOVOTNÝ (203 Česká republika, domácí) a Tereza VRABCOVÁ (203 Česká republika, domácí)
Vydání
2023
Další údaje
Jazyk
angličtina
Typ výsledku
Software
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Odkazy
Kód RIV
RIV/00216224:14330/23:00134482
Organizační jednotka
Fakulta informatiky
Klíčová slova česky
OCR; historické dokumenty; detekce jmenných entit; korpus
Klíčová slova anglicky
OCR; corpora; medieval documents; named entity detection
Technické parametry
Software portálu systému AHISTO je provozován v prostředí Centra zpracování přirozeného jazyka na veřejně přístupném webovém portálu.
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 23. 5. 2023 19:36, RNDr. Adam Rambousek, Ph.D.
Anotace
V originále
Softwarové nástroje pro vytvoření portálu historických dokumentů. Systém se skládá z modulu pro OCR naskenovaných archivních dokumentů, dále hromadný import regestů z formátu DOCX. Všechny dokumenty jsou uloženy ve standardním formátu XML CEI a zpřístupněny pomocí webového portálu. Webový portál umožňuje vyhledávání naskenovaných edic a regestů podle různých kritérií, procházení edic včetně metadat a textového přepisu, prohlížení regestů v režimech pro laiky a odborníky, a pro autentizované uživatele také možnost editace regestů.
Návaznosti
TL03000365, projekt VaV |
|