D 2016

Pre-processing Large Resources for Family Names Research

RAMBOUSEK, Adam

Základní údaje

Originální název

Pre-processing Large Resources for Family Names Research

Název česky

Zpracování velkých zdrojů pro výzkum příjmení

Autoři

RAMBOUSEK, Adam (203 Česká republika, garant, domácí)

Vydání

Brno, RASLAN 2016 Recent Advances in Slavonic Natural Language Processing, od s. 105-109, 5 s. 2016

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Kód RIV

RIV/00216224:14330/16:00092104

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-1095-2

ISSN

UT WoS

000466886400012

Klíčová slova česky

platforma DEB; lexikografie; big data; příjmení; konverze dat

Klíčová slova anglicky

DEB platform; lexicography; big data; family names; data conversion

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 8. 7. 2022 13:38, RNDr. Adam Rambousek, Ph.D.

Anotace

V originále

This paper describes methodology and tools used to pre-process historical archive documents in various formats and their conversion to unified format. Resources were used to investigate the origins and geographical distribution of surnames in the United Kingdom, as part of the Family Names in Britain and Ireland research project. Data extracted from the documents and their connection proved to be valuable research resource which helped to speed up the lexicographic work.

Česky

Článek popisuje metodologii a nástroje použité pro zpracování archivních dokumentů v různých formátech a jejich konverzi do jednotného formátu. Zdroje byly použity pro výzkum původu a geografické distribuce příjmení ve Spojeném království, jako součást projektu Family Names in Britain and Ireland. Data extrahovaná z dokumentů a jejich vzájemné propojení se ukázalo jako cenný výzkumný zdroj, který urychlil lexikografický výzkum.

Návaznosti

LD15066, projekt VaV
Název: Rozhraní pro Linked Data v systému pro editaci slovníků DEB (Akronym: DEB LDI)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Rozhraní pro Linked Data v systému pro editaci slovníků DEB