RAMBOUSEK, Adam. Pre-processing Large Resources for Family Names Research. In Aleš Horák, Pavel Rychlý, Adam Rambousek. RASLAN 2016 Recent Advances in Slavonic Natural Language Processing. Brno: Tribun EU, 2016, s. 105-109. ISBN 978-80-263-1095-2.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Pre-processing Large Resources for Family Names Research
Název česky Zpracování velkých zdrojů pro výzkum příjmení
Autoři RAMBOUSEK, Adam (203 Česká republika, garant, domácí).
Vydání Brno, RASLAN 2016 Recent Advances in Slavonic Natural Language Processing, od s. 105-109, 5 s. 2016.
Nakladatel Tribun EU
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW PDF full paper
Kód RIV RIV/00216224:14330/16:00092104
Organizační jednotka Fakulta informatiky
ISBN 978-80-263-1095-2
ISSN 2336-4289
UT WoS 000466886400012
Klíčová slova česky platforma DEB; lexikografie; big data; příjmení; konverze dat
Klíčová slova anglicky DEB platform; lexicography; big data; family names; data conversion
Štítky DEB platform, XML
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Adam Rambousek, Ph.D., učo 60380. Změněno: 8. 7. 2022 13:38.
Anotace
This paper describes methodology and tools used to pre-process historical archive documents in various formats and their conversion to unified format. Resources were used to investigate the origins and geographical distribution of surnames in the United Kingdom, as part of the Family Names in Britain and Ireland research project. Data extracted from the documents and their connection proved to be valuable research resource which helped to speed up the lexicographic work.
Anotace česky
Článek popisuje metodologii a nástroje použité pro zpracování archivních dokumentů v různých formátech a jejich konverzi do jednotného formátu. Zdroje byly použity pro výzkum původu a geografické distribuce příjmení ve Spojeném království, jako součást projektu Family Names in Britain and Ireland. Data extrahovaná z dokumentů a jejich vzájemné propojení se ukázalo jako cenný výzkumný zdroj, který urychlil lexikografický výzkum.
Návaznosti
LD15066, projekt VaVNázev: Rozhraní pro Linked Data v systému pro editaci slovníků DEB (Akronym: DEB LDI)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Rozhraní pro Linked Data v systému pro editaci slovníků DEB
VytisknoutZobrazeno: 23. 7. 2024 20:30