R 2023

Nástroj na extrakci pojmenovaných entit a vztahů ze skenovaných textů

HORÁK, Aleš, Adam RAMBOUSEK, Pavel RYCHLÝ, Vít NOVOTNÝ, Tereza VRABCOVÁ et. al.

Základní údaje

Originální název

Nástroj na extrakci pojmenovaných entit a vztahů ze skenovaných textů

Vydání

2023

Další údaje

Jazyk

angličtina

Typ výsledku

Software

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Organizační jednotka

Fakulta informatiky

Klíčová slova česky

historické dokumenty; detekce pojmenovaných entit

Klíčová slova anglicky

medieval documents; named entity recognition

Technické parametry

Nástroj na extrakci pojmenovaných entit a vztahů ze skenovaných textů je provozován v rámci portálu systému AHISTO v prostředí Centra zpracování přirozeného jazyka na veřejně přístupném webovém portálu.

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 26. 5. 2023 19:03, RNDr. Vít Starý Novotný, Ph.D.

Anotace

V originále

Nástroj se skládá z programových modulů v jazyce Python, z nichž část je uzavřena do podpůrných Docker obrazů, a předtrénovaných jazykových modelů pro rozpoznávání pojmenovaných entit. Nástroj umožňuje poloautomatizovanou tvorbu místních a osobních rejstříků z archivních dokumentů. Tím je zajištěna úspora času a zdrojů při práci s archivními dokumenty.

Návaznosti

TL03000365, projekt VaV
Název: Historické prameny na dosah. Zpřístupnění středověkých písemných dokumentů formou kontextuální databáze (Akronym: AHISTO)
Investor: Technologická agentura ČR, Historické prameny na dosah. Zpřístupnění středověkých písemných dokumentů formou kontextuální databáze.