HORÁK, Aleš, Adam RAMBOUSEK, Pavel RYCHLÝ, Vít NOVOTNÝ a Tereza VRABCOVÁ. Nástroj na extrakci pojmenovaných entit a vztahů ze skenovaných textů. 2023.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Nástroj na extrakci pojmenovaných entit a vztahů ze skenovaných textů
Autoři HORÁK, Aleš, Adam RAMBOUSEK, Pavel RYCHLÝ, Vít NOVOTNÝ a Tereza VRABCOVÁ.
Vydání 2023.
Další údaje
Originální jazyk angličtina
Typ výsledku Software
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
WWW URL
Organizační jednotka Fakulta informatiky
Klíčová slova česky historické dokumenty; detekce pojmenovaných entit
Klíčová slova anglicky medieval documents; named entity recognition
Technické parametry Nástroj na extrakci pojmenovaných entit a vztahů ze skenovaných textů je provozován v rámci portálu systému AHISTO v prostředí Centra zpracování přirozeného jazyka na veřejně přístupném webovém portálu.
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Vít Starý Novotný, Ph.D., učo 409729. Změněno: 26. 5. 2023 19:03.
Anotace
Nástroj se skládá z programových modulů v jazyce Python, z nichž část je uzavřena do podpůrných Docker obrazů, a předtrénovaných jazykových modelů pro rozpoznávání pojmenovaných entit. Nástroj umožňuje poloautomatizovanou tvorbu místních a osobních rejstříků z archivních dokumentů. Tím je zajištěna úspora času a zdrojů při práci s archivními dokumenty.
Návaznosti
TL03000365, projekt VaVNázev: Historické prameny na dosah. Zpřístupnění středověkých písemných dokumentů formou kontextuální databáze (Akronym: AHISTO)
Investor: Technologická agentura ČR, Historické prameny na dosah. Zpřístupnění středověkých písemných dokumentů formou kontextuální databáze.
VytisknoutZobrazeno: 9. 5. 2024 12:24