BOHÁČ, Marek, Michal ROTT a Vojtěch KOVÁŘ. Text Punctuation: An Inter-annotator Agreement Study. In Ekštein, Kamil Matoušek, Václav. Text, Speech, and Dialogue: 20th International Conference, TSD 2017. Cham: Springer International Publishing, 2017, s. 120-128. ISBN 978-3-319-64205-5. Dostupné z: https://dx.doi.org/10.1007/978-3-319-64206-2_14.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Text Punctuation: An Inter-annotator Agreement Study
Autoři BOHÁČ, Marek (203 Česká republika), Michal ROTT (203 Česká republika) a Vojtěch KOVÁŘ (203 Česká republika, garant, domácí).
Vydání Cham, Text, Speech, and Dialogue: 20th International Conference, TSD 2017, od s. 120-128, 9 s. 2017.
Nakladatel Springer International Publishing
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW URL
Impakt faktor Impact factor: 0.402 v roce 2005
Kód RIV RIV/00216224:14330/17:00095096
Organizační jednotka Fakulta informatiky
ISBN 978-3-319-64205-5
ISSN 0302-9743
Doi http://dx.doi.org/10.1007/978-3-319-64206-2_14
UT WoS 000449869200014
Klíčová slova česky doplňování čárek;mluvený jazyk;mezianotátorská shoda
Klíčová slova anglicky Comma adding;Spoken language;Inter-annotator agreement
Štítky firank_B
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: Mgr. Michal Petr, učo 65024. Změněno: 27. 4. 2020 23:37.
Anotace
Spoken language is a phenomenon which is hard to be annotated accurately. One of the most ambiguous tasks is to fill in the punctuation marks into the spoken language transcription. Used punctuation marks are often dependent on how annotators understand the transcription content. This may differ as the spoken language often lacks clear structure (inherent to written language) due to the utterance spontaneity or due to skipping between ideas. Therefore we suspect that filling commas into the spoken language transcription is a very ambiguous task with low inter-annotator agreement (IAA). In this paper we analyze the IAA within group of annotators and we propose methods to increase it. We also propose and evaluate a reformulation of classical GT annotations for cases with multiple annotations available.
Anotace česky
Článek se zabývá problematikou doplňování čárek do mluveného textu, zejména mezianotátorskou shodou a přesností současných počítačových programů.
Návaznosti
GA15-13277S, projekt VaVNázev: Hyperintensionální logika pro analýzu přirozeného jazyka
Investor: Grantová agentura ČR, Hyperintensionální logika pro analýzu přirozeného jazyka
LM2015071, projekt VaVNázev: Jazyková výzkumná infrastruktura v České republice (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
MUNI/A/0897/2016, interní kód MUNázev: Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VI.
Investor: Masarykova univerzita, Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VI., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
VytisknoutZobrazeno: 16. 6. 2024 19:14