R 2023

Systém portálu AHISTO

HORÁK, Aleš, Adam RAMBOUSEK, Pavel RYCHLÝ, Vít NOVOTNÝ, Tereza VRABCOVÁ et. al.

Základní údaje

Originální název

Systém portálu AHISTO

Autoři

HORÁK, Aleš (203 Česká republika, garant, domácí), Adam RAMBOUSEK (203 Česká republika, domácí), Pavel RYCHLÝ (203 Česká republika, domácí), Vít NOVOTNÝ (203 Česká republika, domácí) a Tereza VRABCOVÁ (203 Česká republika, domácí)

Vydání

2023

Další údaje

Jazyk

angličtina

Typ výsledku

Software

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/23:00134482

Organizační jednotka

Fakulta informatiky

Klíčová slova česky

OCR; historické dokumenty; detekce jmenných entit; korpus

Klíčová slova anglicky

OCR; corpora; medieval documents; named entity detection

Technické parametry

Software portálu systému AHISTO je provozován v prostředí Centra zpracování přirozeného jazyka na veřejně přístupném webovém portálu.

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 23. 5. 2023 19:36, RNDr. Adam Rambousek, Ph.D.

Anotace

V originále

Softwarové nástroje pro vytvoření portálu historických dokumentů. Systém se skládá z modulu pro OCR naskenovaných archivních dokumentů, dále hromadný import regestů z formátu DOCX. Všechny dokumenty jsou uloženy ve standardním formátu XML CEI a zpřístupněny pomocí webového portálu. Webový portál umožňuje vyhledávání naskenovaných edic a regestů podle různých kritérií, procházení edic včetně metadat a textového přepisu, prohlížení regestů v režimech pro laiky a odborníky, a pro autentizované uživatele také možnost editace regestů.

Návaznosti

TL03000365, projekt VaV
Název: Historické prameny na dosah. Zpřístupnění středověkých písemných dokumentů formou kontextuální databáze (Akronym: AHISTO)
Investor: Technologická agentura ČR, Historické prameny na dosah. Zpřístupnění středověkých písemných dokumentů formou kontextuální databáze.