Masarykova univerzita

Výpis publikací

česky | in English

Filtrování publikací

    2024

    1. KOVAŘÍK, František, Miloš JAKUBÍČEK, Vít SUCHOMEL, Michal CUKR a Jan KRAUS. Overview of Latin American and Iberian corpora in Sketch Engine. Santiago de Compostela, 2024, 6 s. 5th OpenCor: Latin American and Iberian Languages Open Corpora Forum.
      Web workshopu OpenCor
      Název česky: Přehled latinskoamerických a iberských korpusů v nástroji Sketch Engine
      Název anglicky: Overview of Latin American and Iberian corpora in Sketch Engine
      angličtina. Španělsko.
      Klíčová slova anglicky: Catalan, Galician, Spanish, Portuguese, corpus, Sketch Engine, web corpora, parallel corpora, timestamped

      Změnil: Mgr. František Kovařík, učo 457625. Změněno: 4. 4. 2024 12:42.

    2023

    1. BLAHUŠ, Marek, Miloš JAKUBÍČEK, Michal CUKR, Vojtěch KOVÁŘ a Vít SUCHOMEL. Development of Evidence-Based Grammars for Terminology Extraction in OneClick Terms. Online. In Marek Medveď, Michal Měchura, Carole Tiberius, Iztok Kosem, Jelena Kallas, Miloš Jakubíček, Simon Krek. Electronic lexicography in the 21st century (eLex 2023): Invisible Lexicography. Proceedings of the eLex 2023 conference. Brno, Czech Republic: Lexical Computing CZ s.r.o., 2023, s. 650-662. ISSN 2533-5626.
      Konferenční sborník
      RIV/00216224:14330/23:00131557 Stať ve sborníku. angličtina. Česká republika.
      Blahuš, Marek (203 Česká republika) -- Jakubíček, Miloš (203 Česká republika, domácí) -- Cukr, Michal (203 Česká republika) -- Kovář, Vojtěch (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, domácí)
      Klíčová slova anglicky: Grammars; Terminology Extraction; OneClick Terms
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 9. 4. 2024 00:12.
    2. BLAHUŠ, Marek, Michal CUKR, Ondřej HERMAN, Miloš JAKUBÍČEK, Vojtěch KOVÁŘ, Jan KRAUS, Marek MEDVEĎ, Vlasta OHLÍDALOVÁ a Vít SUCHOMEL. Rapid Ukrainian-English Dictionary Creation Using Post-Edited Corpus Data. Online. In Marek Medveď, Michal Měchura, Carole Tiberius, Iztok Kosem, Jelena Kallas, Miloš Jakubíček, Simon Krek. Electronic lexicography in the 21st century (eLex 2023): Invisible Lexicography. Proceedings of the eLex 2023 conference. Brno, Czech Republic: Lexical Computing CZ s.r.o., 2023, s. 613-637. ISSN 2533-5626.
      Konferenční sborník
      RIV/00216224:14330/23:00131469 Stať ve sborníku. angličtina. Česká republika.
      Blahuš, Marek (203 Česká republika) -- Cukr, Michal (203 Česká republika) -- Herman, Ondřej (203 Česká republika, domácí) -- Jakubíček, Miloš (203 Česká republika, domácí) -- Kovář, Vojtěch (203 Česká republika, domácí) -- Kraus, Jan (203 Česká republika) -- Medveď, Marek (703 Slovensko, domácí) -- Ohlídalová, Vlasta (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, domácí)
      Klíčová slova anglicky: Ukrainian; post-editing; dictionary; lexicography
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 9. 4. 2024 00:09.
    3. SUCHOMEL, Vít, Miloš JAKUBÍČEK a Ondřej MATUŠKA. Web corpora for under-resourced languages. Online. In Corpus Linguistics (CL2023), 2023. Brno, Czech Republic: Lexical Computing CZ s.r.o., 2023. ISSN 2533-5626.
      angličtina. Česká republika.
      Klíčová slova anglicky: Web, corpora, languages
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnila: Jana Bušková, učo 545081. Změněno: 5. 9. 2023 10:12.

    2022

    1. SUCHOMEL, Vít a Jan KRAUS. Semi-Manual Annotation of Topics and Genres in Web Corpora : The Cheap and Fast Way. In Aleš Horák, Pavel Rychlý, Adam Rambousek. Proceedings of the Sixteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2022. Brno: Tribun EU, 2022, s. 141-148. ISBN 978-80-263-1752-4.
      Domovská stránka workshopu Plný text
      RIV/00216224:14330/22:00127492 Stať ve sborníku. angličtina. Česká republika.
      Suchomel, Vít (203 Česká republika, garant, domácí) -- Kraus, Jan (203 Česká republika)
      Klíčová slova anglicky: web corpus; text corpus; topic; genre; text annotation

      Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 15. 5. 2024 09:27.

    2021

    1. SUCHOMEL, Vít. Genre Annotation of Web Corpora: Scheme and Issues. In Kohei Arai, Supriya Kapoor, Rahul Bhatia. Proceedings of the Future Technologies Conference (FTC) 2020, Volume 1. Vancouver, Canada: Springer Nature Switzerland AG, 2021, s. 738-754. ISBN 978-3-030-63127-7. Dostupné z: https://dx.doi.org/10.1007/978-3-030-63128-4_55.
      Elektronická verze sborníku
      RIV/00216224:14330/21:00118741 Stať ve sborníku. angličtina. Velká Británie a Severní Irsko.
      Suchomel, Vít (203 Česká republika, garant, domácí)
      Klíčová slova anglicky: Corpus annotation; Inter-annotator agreement; Text genre; Web corpora
      Druh sborníku: předkonferenční sborník
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 10. 1. 2023 11:49.
    2. SUCHOMEL, Vít a Jan KRAUS. Website Properties in Relation to the Quality of Text Extracted for Web Corpora. In Horák, Rychlý, Rambousek. Recent Advances in Slavonic Natural Language Processing (RASLAN 2021). Brno: Tribun EU, 2021, s. 167-175. ISBN 978-80-263-1670-1.
      Full text PDF Domovská stránka workshopu
      RIV/00216224:14330/21:00123254 Stať ve sborníku. angličtina. Česká republika.
      Suchomel, Vít (203 Česká republika, garant, domácí) -- Kraus, Jan (203 Česká republika)
      Klíčová slova anglicky: Web crawling; Web spam; Text corpus; Text processing
      Druh sborníku: předkonferenční sborník

      Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 15. 5. 2024 02:16.

    2020

    1. JAKUBÍČEK, Miloš, Vojtěch KOVÁŘ, Pavel RYCHLÝ a Vít SUCHOMEL. Current Challenges in Web Corpus Building. Online. In Adrien Barbaresi, Felix Bildhauer, Roland Schafer and Egon Stemle. Proceedings of the 12th Web as Corpus Workshop. Marseille, France: European Language Resources Association, 2020, s. 1-4. ISBN 979-10-95546-68-9.
      článek ve sborníku
      RIV/00216224:14330/20:00114153 Stať ve sborníku. angličtina. Francie.
      Jakubíček, Miloš (203 Česká republika, garant, domácí) -- Kovář, Vojtěch (203 Česká republika, domácí) -- Rychlý, Pavel (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, domácí)
      Klíčová slova anglicky: Web corpora; corpus building
      Druh sborníku: předkonferenční sborník
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 28. 5. 2020 13:06.
    2. SUCHOMEL, Vít. Removing Spam from Web Corpora Through Supervised Learning and Semi-manual Classification of Web Sites. In Aleš Horák. Proceedings of the Fourteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2020. Brno: Tribun 2020, 2020, s. 113-123. ISBN 978-80-263-1600-8.
      PDF ve sborníku Domovská stránka workshopu
      RIV/00216224:14330/20:00117841 Stať ve sborníku. angličtina. Česká republika.
      Suchomel, Vít (203 Česká republika, garant, domácí)
      Klíčová slova anglicky: web corpora; web spam; supervised learning
      Mezinárodní význam: ano

      Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 13. 5. 2024 17:45.

    2019

    1. RAMBOUSEK, Adam, Aleš HORÁK, Vít BAISA a Vít SUCHOMEL. A New Approach for Semi-automatic Building and Extending a Multilingual Terminology Thesaurus. International Journal on Artificial Intelligence Tools. USA: World Scientific Publishing, 2019, roč. 28, č. 2, s. 1-21. ISSN 0218-2130. Dostupné z: https://dx.doi.org/10.1142/S0218213019500088.
      Journal page arXiv preprint
      Název česky: Nový přístup k poloautomatické tvorbě a rozšiřování vícejazyčného terminologického tezauru
      RIV/00216224:14330/19:00109355 Článek v odborném periodiku. angličtina. Spojené státy.
      Rambousek, Adam (203 Česká republika, garant, domácí) -- Horák, Aleš (203 Česká republika, domácí) -- Baisa, Vít (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, domácí)
      Klíčová slova anglicky: Thesaurus building; terminology dictionary; domain-corpus exploitation; knowledge extraction; term extraction; DEB platform; knowledge-rich contexts
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 13. 4. 2020 22:38.
    2. BAISA, Vít, Marek BLAHUŠ, Michal CUKR, Ondřej HERMAN, Miloš JAKUBÍČEK, Vojtěch KOVÁŘ, Marek MEDVEĎ, Michal MĚCHURA, Pavel RYCHLÝ a Vít SUCHOMEL. Automating dictionary production: a Tagalog-English-Korean dictionary from scratch. Online. In Proceedings of the 6th Biennial Conference on Electronic Lexicography. Brno, Czech Republic: Lexical Computing CZ s.r.o., 2019, s. 805-818. ISSN 2533-5626.
      Konferenční sborník
      RIV/00216224:14330/19:00107599 Stať ve sborníku. angličtina. Česká republika.
      Baisa, Vít (203 Česká republika, domácí) -- Blahuš, Marek (203 Česká republika) -- Cukr, Michal (203 Česká republika) -- Herman, Ondřej (203 Česká republika, domácí) -- Jakubíček, Miloš (203 Česká republika, domácí) -- Kovář, Vojtěch (203 Česká republika, domácí) -- Medveď, Marek (703 Slovensko, domácí) -- Měchura, Michal (203 Česká republika, domácí) -- Rychlý, Pavel (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, domácí)
      Klíčová slova anglicky: Sketch Engine; Lexonomy; post-editing lexicography; dictionary; corpus; Tagalog; Filipino; English; Korean
      Druh sborníku: předkonferenční sborník
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Miloš Jakubíček, Ph.D., učo 172962. Změněno: 22. 10. 2023 01:49.
    3. SUCHOMEL, Vít. Discriminating Between Similar Languages Using Large Web Corpora. In Horák, Aleš and Rychlý, Pavel and Rambousek, Adam. Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2019. Brno: Tribun EU, 2019, s. 129-135. ISBN 978-80-263-1530-8.
      URL
      RIV/00216224:14330/19:00111666 Stať ve sborníku. angličtina. Česká republika.
      Suchomel, Vít (203 Česká republika, garant, domácí)
      Klíčová slova anglicky: language identification; discriminating similar languages; building web corpora
      Druh sborníku: předkonferenční sborník

      Změnil: Mgr. Michal Petr, učo 65024. Změněno: 16. 5. 2022 15:28.
    4. KOPPEL, Kristina, Jelena KALLAS, Maria KHOKHLOVÁ, Vít SUCHOMEL, Vít BAISA a Jan MICHELFEIT. SkELL Corpora as a Part of the Language Portal Sonaveeb: Problems and Perspectives. Online. In Proceedings of the 6th Biennial Conference on Electronic Lexicography. Brno, Czech Republic: Lexical Computing CZ s.r.o., 2019, s. 763-782. ISSN 2533-5626.
      Konferenční sborník
      RIV/00216224:14330/19:00111209 Stať ve sborníku. angličtina. Česká republika.
      Koppel, Kristina (233 Estonsko) -- Kallas, Jelena (233 Estonsko) -- Khokhlová, Maria (643 Rusko) -- Suchomel, Vít (203 Česká republika, garant, domácí) -- Baisa, Vít (203 Česká republika, domácí) -- Michelfeit, Jan (203 Česká republika, domácí)
      Klíčová slova anglicky: GDEX; SkELL; learner corpus; Estonian; Russian
      Druh sborníku: předkonferenční sborník
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 8. 5. 2020 09:25.

    2018

    1. SUCHOMEL, Vít. csTenTen17, a Recent Czech Web Corpus. In Aleš Horák, Pavel Rychlý and Adam Rambousek. Proceedings of the Twelfth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2018. Brno: Tribun EU, 2018, s. 111-123. ISBN 978-80-263-1517-9.
      URL
      RIV/00216224:14330/18:00105270 Stať ve sborníku. angličtina. Česká republika.
      Suchomel, Vít (203 Česká republika, garant, domácí)
      Klíčová slova anglicky: Czech corpus; web corpus; text processing
      Druh sborníku: předkonferenční sborník
      Mezinárodní význam: ano

      Změnil: Mgr. Michal Petr, učo 65024. Změněno: 16. 5. 2022 15:44.

    2017

    1. KALLAS, Jelena, Vít SUCHOMEL a Maria KHOKHLOVA. Automated Identification of Domain Preferences of Collocations. Online. In Iztok Kosem et al. Electronic Lexicography in the 21st Century. Proceedings of Elex 2017 Conference. Brno, Czech Republic: Lexical Computing CZ s.r.o., 2017, s. 309-320. ISSN 2533-5626.
      Sborník Článek
      RIV/00216224:14330/17:00098119 Stať ve sborníku. Jazykověda. angličtina. Česká republika.
      Kallas, Jelena (233 Estonsko) -- Suchomel, Vít (203 Česká republika, garant, domácí) -- Khokhlova, Maria (643 Rusko)
      Klíčová slova anglicky: collocation; multiword terms; terminological collocation; Russian; Estonian
      Druh sborníku: předkonferenční sborník
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 27. 11. 2018 13:53.
    2. HaBiT system (software)
      PALA, Karel, Aleš HORÁK, Pavel RYCHLÝ, Vít SUCHOMEL, Vít BAISA, Miloš JAKUBÍČEK, Vojtěch KOVÁŘ, Zuzana NEVĚŘILOVÁ, Adam RAMBOUSEK, Björn GAMBÄCK, Utpal SIKDAR a Lars BUNGUM. HaBiT system. 2017.
      URL
      RIV/00216224:14330/17:00096850 Software. Informatika. angličtina. Česká republika.
      Pala, Karel (203 Česká republika, garant, domácí) -- Horák, Aleš (203 Česká republika, domácí) -- Rychlý, Pavel (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, domácí) -- Baisa, Vít (203 Česká republika, domácí) -- Jakubíček, Miloš (203 Česká republika, domácí) -- Kovář, Vojtěch (203 Česká republika, domácí) -- Nevěřilová, Zuzana (203 Česká republika, domácí) -- Rambousek, Adam (203 Česká republika, domácí) -- Gambäck, Björn (578 Norsko) -- Sikdar, Utpal (578 Norsko) -- Bungum, Lars (578 Norsko)
      Klíčová slova anglicky: corpus tool; corpus manager; word list; word sketch; sketch differece; concordance

      Změnil: doc. RNDr. Aleš Horák, Ph.D., učo 1648. Změněno: 23. 1. 2018 15:19.
    3. SUCHOMEL, Vít. Removing spam from web corpora through supervised learning using FastText. Birmingham, 2017.
      Sborník konference
      angličtina. Německo.
      Klíčová slova anglicky: Text corpora;Web spam;Supervised learning;FastText
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 27. 11. 2018 13:34.
    4. JAKUBÍČEK, Miloš, Vít BAISA, Jan BUŠTA, Vojtěch KOVÁŘ, Jan MICHELFEIT, Pavel RYCHLÝ a Vít SUCHOMEL. Walking the tightrope between linguistics and language engineering. 2017.
      Informatika. angličtina.
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Miloš Jakubíček, Ph.D., učo 172962. Změněno: 15. 5. 2017 11:39.

    2016

    1. RYCHLÝ, Pavel a Vít SUCHOMEL. Annotated Amharic Corpora. In Petr Sojka, Aleš Horák, Ivan Kopeček, Karel Pala. Text, Speech, and Dialogue 19th International Conference, TSD 2016 Brno, Czech Republic, September 12–16, 2016 Proceedings. Switzerland: Springer International Publishing, 2016, s. 295-302. ISBN 978-3-319-45509-9. Dostupné z: https://dx.doi.org/10.1007/978-3-319-45510-5_34.
      Plný text výsledku
      RIV/00216224:14330/16:00088120 Stať ve sborníku. Jazykověda. angličtina. Švýcarsko.
      Rychlý, Pavel (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, garant, domácí)
      Klíčová slova anglicky: Amharic; text corpus; web corpus; under-resourced language; corpus annotation; morphological tagger
      Druh sborníku: předkonferenční sborník
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 1. 11. 2017 11:02.
    2. HERMAN, Ondřej, Vít SUCHOMEL, Vít BAISA a Pavel RYCHLÝ. DSL Shared task 2016: Perfect Is The Enemy of Good Language Discrimination Through Expectation-Maximization and Chunk-based Language Model. Online. In Preslav Nakov, Marcos Zampieri, Liling Tan, Nikola Ljubešić, Jörg Tiedemann, Shervin Malmasi. Proceedings of the Third Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial3). Osaka: Association for Natural Language Processing (ANLP), Osaka, Japan, 2016, s. 114-118. ISBN 978-4-87974-716-7.
      URL
      RIV/00216224:14330/16:00092557 Stať ve sborníku. Informatika. angličtina. Česká republika.
      Herman, Ondřej (203 Česká republika, garant, domácí) -- Suchomel, Vít (203 Česká republika, domácí) -- Baisa, Vít (203 Česká republika, domácí) -- Rychlý, Pavel (203 Česká republika, domácí)
      Klíčová slova anglicky: language discrimination;expectation maximization;language model
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 1. 11. 2017 12:13.
    3. SUCHOMEL, Vít a Pavel RYCHLÝ. Set of Ethiopian Web Corpora. 2016.
      URL
      RIV/00216224:14330/16:00096851 Software. Jazykověda. angličtina. Česká republika.
      Suchomel, Vít (203 Česká republika, domácí) -- Rychlý, Pavel (203 Česká republika, domácí)
      Klíčová slova anglicky: text corpora; Ethiopian languages

      Změnil: doc. Mgr. Pavel Rychlý, Ph.D., učo 3692. Změněno: 1. 6. 2017 15:52.
    4. FIŠER, Darja, Vít SUCHOMEL a Miloš JAKUBÍČEK. Terminology Extraction for Academic Slovene Using Sketch Engine. In Aleš Horák, Pavel Rychlý, Adam Rambousek. Tenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2016. Brno: Tribun EU, 2016, s. 135-141. ISBN 978-80-263-1095-2.
      URL
      RIV/00216224:14330/16:00092357 Stať ve sborníku. Informatika. angličtina. Česká republika.
      Fišer, Darja (705 Slovinsko) -- Suchomel, Vít (203 Česká republika, domácí) -- Jakubíček, Miloš (203 Česká republika, domácí)
      Klíčová slova anglicky: terminology; term extraction; Sketch Engine; academic discourse; Slovene

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 25. 5. 2021 19:22.

    2015

    1. BAISA, Vít a Vít SUCHOMEL. Corpus Based Extraction of Hypernyms in Terminological Thesaurus for Land Surveying Domain. In Ninth Workshop on Recent Advances in Slavonic Natural Language Processing. Brno: Tribun EU, 2015, s. 69-74. ISBN 978-80-263-0974-1.
      URL
      RIV/00216224:14330/15:00084843 Stať ve sborníku. Jazykověda. angličtina. Česká republika.
      Baisa, Vít (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, garant, domácí)
      Klíčová slova anglicky: Sketch Engine; concordance; thesaurus; word sketch; language learning; English language; corpus
      Druh sborníku: předkonferenční sborník

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 25. 5. 2021 19:22.
    2. BAISA, Vít, Vít SUCHOMEL, adam KILGARRIFF a Miloš JAKUBÍČEK. Sketch Engine for English Language Learning. In Corpus Linguistics 2015. 2015.
      Informatika. angličtina.
      Druh účasti: aktivní účast
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Miloš Jakubíček, Ph.D., učo 172962. Změněno: 4. 9. 2016 22:16.
    3. RAMBOUSEK, Adam, Vít BAISA, Vít SUCHOMEL a Aleš HORÁK. Technologie pro využití obsahu tezauru pro publikační účely. 2015.
      Název anglicky: Technologies for exploitation of the content of thesaurus for publication purposes
      RIV/00216224:14330/15:00080408 Poloprovoz, ověřená technologie, odrůda, plemeno. Informatika. čeština. Česká republika.
      Rambousek, Adam (203 Česká republika, garant, domácí) -- Baisa, Vít (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, domácí) -- Horák, Aleš (203 Česká republika, domácí)
      Klíčová slova anglicky: thesaurus; application; web service; extraction of terms; corpus; term

      Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 14. 3. 2016 13:19.
    4. RAMBOUSEK, Adam, Vít BAISA, Vít SUCHOMEL, Aleš HORÁK a Lucia KOCINCOVÁ. Terminologický tezaurus pro obor zeměměřictví a katastru nemovitostí: Certifikovaná metodika. 2015.
      Název anglicky: Terminological thesaurus for the field of surveying, mapping and cadastre: Certified Methodology
      RIV/00216224:14330/15:00080409 Cert., akred., schvál. metodiky, specializované mapy, léčebné, památkové postupy. Informatika. čeština. Česká republika.
      Rambousek, Adam (203 Česká republika, garant, domácí) -- Baisa, Vít (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, domácí) -- Horák, Aleš (203 Česká republika, domácí) -- Kocincová, Lucia (703 Slovensko, domácí)
      Klíčová slova anglicky: certified methodology; thesaurus; automatic extractions of terms; corpus; concordance; application; web service; surveying; cadastre
      Recenzováno: ano

      Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 13. 4. 2016 13:45.
    5. BAISA, Vít a Vít SUCHOMEL. Turkic Language Support in Sketch Engine. In Proceedings of the international conference "Turkic Languages processing: TurkLang 2015". Kazan: Academy of Sciences of the Republic of Tatarstan Press, 2015, s. 214-223. ISBN 978-5-9690-0262-3.
      RIV/00216224:14330/15:00083946 Stať ve sborníku. Informatika. angličtina. Rusko.
      Baisa, Vít (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, domácí)
      Klíčová slova anglicky: corpus; Sketch Engine; Turkic language; Turkish; Kazakh; Kyrgyz; Turkmen; Azeri; Tatar
      Druh sborníku: předkonferenční sborník

      Změnil: Mgr. et Mgr. Vít Baisa, Ph.D., učo 139654. Změněno: 23. 9. 2015 11:12.

    2014

    1. ARTS, Tressy, Yonatan BELINKOV, Nizar HABASH, Adam KILGARRIFF a Vít SUCHOMEL. arTenTen: Arabic Corpus and Word Sketches. Journal of King Saud University-Computer and Information Sciences. Elsevier, 2014, roč. 2014, č. 26, s. 381-395. ISSN 1319-1578. Dostupné z: https://dx.doi.org/10.1016/j.jksuci.2014.06.009.
      plný text článku
      RIV/00216224:14330/14:00073241 Článek v odborném periodiku. Informatika. angličtina. Nizozemské království.
      Arts, Tressy (826 Velká Británie a Severní Irsko) -- Belinkov, Yonatan (376 Izrael) -- Habash, Nizar (784 Spojené arabské emiráty) -- Kilgarriff, Adam (826 Velká Británie a Severní Irsko) -- Suchomel, Vít (203 Česká republika, garant, domácí)
      Klíčová slova anglicky: Corpora; Lexicography; Morphology; Concordance; Arabic
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: Mgr. Michal Petr, učo 65024. Změněno: 27. 5. 2015 09:02.
    2. KILGARRIFF, Adam, Miloš JAKUBÍČEK, Vojtěch KOVÁŘ, Pavel RYCHLÝ a Vít SUCHOMEL. Finding Terms in Corpora for Many Languages with the Sketch Engine. Online. In Proceedings of the Demonstrations at the 14th Conferencethe European Chapter of the Association for Computational Linguistics. Gothenburg, Sweden: The Association for Computational Linguistics, 2014, s. 53-56. ISBN 978-1-937284-75-6.
      Plný text výsledku
      RIV/00216224:14330/14:00075387 Stať ve sborníku. Informatika. angličtina. Česká republika.
      Kilgarriff, Adam (826 Velká Británie a Severní Irsko) -- Jakubíček, Miloš (203 Česká republika, garant, domácí) -- Kovář, Vojtěch (203 Česká republika, domácí) -- Rychlý, Pavel (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, domácí)
      Klíčová slova anglicky: terminology; terms; corpora; sketch engine
      Druh sborníku: postkonferenční sborník
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 29. 10. 2014 09:19.
    3. BOJAR, Ondřej, Vojtěch DIATKA, Pavel RYCHLÝ, Pavel STRAŇÁK, Vít SUCHOMEL, Aleš TAMCHYNA a Daniel ZEMAN. HindEnCorp – Hindi-English and Hindi-only Corpus for Machine Translation. Online. In Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Hrafn Loftsson and Bente Maegaard and Joseph Mariani and Asuncion Moreno and Jan Odijk and Stelios Piperidis. Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14). Reykjavik, Iceland: European Language Resources Association (ELRA), 2014, s. 3550-3555. ISBN 978-2-9517408-8-4.
      URL
      RIV/00216224:14330/14:00076251 Stať ve sborníku. Informatika. angličtina. Lucembursko.
      Bojar, Ondřej (203 Česká republika) -- Diatka, Vojtěch (203 Česká republika) -- Rychlý, Pavel (203 Česká republika, domácí) -- Straňák, Pavel (203 Česká republika) -- Suchomel, Vít (203 Česká republika, garant, domácí) -- Tamchyna, Aleš (203 Česká republika) -- Zeman, Daniel (203 Česká republika)
      Klíčová slova anglicky: Machine Translation; SpeechToSpeech Translation; Metadata
      Druh sborníku: předkonferenční sborník
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 1. 11. 2017 11:02.
    4. NEVĚŘILOVÁ, Zuzana a Vít SUCHOMEL. Intelligent Search and Replace for Czech Phrases. In Eighth Workshop on Recent Advances in Slavonic Natural Language Processing. Brno: Tribun EU, 2014, s. 97-105. ISSN 2336-4289.
      URL
      RIV/00216224:14330/14:00077518 Stať ve sborníku. Jazykověda. angličtina. Česká republika.
      Nevěřilová, Zuzana (203 Česká republika, garant, domácí) -- Suchomel, Vít (203 Česká republika, domácí)
      Klíčová slova anglicky: search and replace; detecting phrases; generating phrases; subject-predicative complement
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 25. 5. 2021 19:20.
    5. HORÁK, Aleš, Adam RAMBOUSEK, Vít SUCHOMEL a Lucia KOCINCOVÁ. Semiautomatic Building and Extension of Terminological Thesaurus for Land Surveying Domain. In Aleš Horák, Pavel Rychlý. Eighth Workshop on Recent Advances in Slavonic Natural Language Processing. Brno: Tribun EU, 2014, s. 129-137. ISSN 2336-4289.
      PDF full paper
      RIV/00216224:14330/14:00077520 Stať ve sborníku. Informatika. angličtina. Česká republika.
      Horák, Aleš (203 Česká republika, garant, domácí) -- Rambousek, Adam (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, domácí) -- Kocincová, Lucia (703 Slovensko, domácí)
      Klíčová slova anglicky: corpus building; thesaurus; terminological dictionary; term extraction; DEB platform
      Druh sborníku: předkonferenční sborník
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Adam Rambousek, Ph.D., učo 60380. Změněno: 24. 5. 2021 11:52.
    6. BAISA, Vít a Vít SUCHOMEL. SkELL: Web Interface for English Language Learning. In Eighth Workshop on Recent Advances in Slavonic Natural Language Processing. Brno: Tribun EU, 2014, s. 63-70. ISSN 2336-4289.
      URL
      RIV/00216224:14330/14:00077513 Stať ve sborníku. Informatika. angličtina. Česká republika.
      Baisa, Vít (203 Česká republika, garant, domácí) -- Suchomel, Vít (203 Česká republika, domácí)
      Klíčová slova anglicky: Sketch Engine; concordance; thesaurus; word sketch; language learning; English language; corpus
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 25. 5. 2021 19:19.
    7. SUCHOMEL, Vít, Jan MICHELFEIT a Jan POMIKÁLEK. Text Tokenisation Using unitok. In Eighth Workshop on Recent Advances in Slavonic Natural Language Processing. Brno: Tribun EU, 2014, s. 71-75. ISSN 2336-4289.
      URL
      RIV/00216224:14330/14:00077514 Stať ve sborníku. Informatika. angličtina. Česká republika.
      Suchomel, Vít (203 Česká republika, garant, domácí) -- Michelfeit, Jan (203 Česká republika, domácí) -- Pomikálek, Jan (203 Česká republika, domácí)
      Klíčová slova anglicky: tokenisation; corpus tool
      Mezinárodní význam: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 25. 5. 2021 19:20.
    8. KILGARRIFF, Adam, Vít BAISA, Jan BUŠTA, Miloš JAKUBÍČEK, Vojtěch KOVÁŘ, Jan MICHELFEIT, Pavel RYCHLÝ a Vít SUCHOMEL. The Sketch Engine: ten years on. Lexicography. Springer Berlin Heidelberg, 2014, roč. 1, č. 1, s. 7-36. ISSN 2197-4292. Dostupné z: https://dx.doi.org/10.1007/s40607-014-0009-9.
      URL
      RIV/00216224:14330/14:00073232 Článek v odborném periodiku. Informatika. angličtina. Německo.
      Kilgarriff, Adam (826 Velká Británie a Severní Irsko) -- Baisa, Vít (203 Česká republika, domácí) -- Bušta, Jan (203 Česká republika, domácí) -- Jakubíček, Miloš (203 Česká republika, garant, domácí) -- Kovář, Vojtěch (203 Česká republika, domácí) -- Michelfeit, Jan (203 Česká republika, domácí) -- Rychlý, Pavel (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, domácí)
      Klíčová slova anglicky: Corpora; Corpus lexicography; Corpus tools; Word sketches; Sketch Engine
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 23. 5. 2015 09:49.

    2013

    1. SRDANOVIĆ, Irena, Vít SUCHOMEL, Adam KILGARRIFF a Toshinobu OGISO. 百億語のコーパスを用いた日本語の語彙・文法情報のプロファイリング. Online. 2013, s. 229-238.
      Sborník konference
      Název anglicky: Japanese Language Lexical and Grammatical Profiling Using the Web Corpus JpTenTen

      Druh sborníku: předkonferenční sborník
      Mezinárodní význam: ano

      Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 5. 3. 2024 11:48.
    2. BELINKOV, Yonatan, Nizar HABASH, Adam KILGARRIFF, Noam ORDAN, Ryan ROTH a Vít SUCHOMEL. arTenTen: a new, vast corpus for Arabic. Online. In Eric Atwell and Andrew Hardie. Proceedings of WACL’2 Second Workshop on Arabic Corpus Linguistics. 2013, s. 20.
      Sborník abstraktů Webové stránky workshopu

      Klíčová slova anglicky: Arabic corpus; Arabic Corpus Linguistics; MADA; Arabic Gigaword; Modern Standard Arabic
      Druh sborníku: předkonferenční sborník
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 5. 3. 2024 11:47.
    3. BAISA, Vít a Vít SUCHOMEL. Intrinsic Methods for Comparison of Corpora. In A. Horák, P. Rychlý. RASLAN 2013 Recent Advances in Slavonic Natural Language Processing. první. Brno: Tribun EU, 2013, s. 51-58. ISBN 978-80-263-0520-0.
      URL
      RIV/00216224:14330/13:00070316 Stať ve sborníku. Informatika. angličtina. Česká republika.
      Baisa, Vít (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, garant, domácí)
      Klíčová slova anglicky: text corpus; corpora comparison
      Druh sborníku: předkonferenční sborník

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 25. 5. 2021 19:22.
    4. JAKUBÍČEK, Miloš, Adam KILGARRIFF, Vojtěch KOVÁŘ, Pavel RYCHLÝ a Vít SUCHOMEL. The TenTen Corpus Family. Online. In 7th International Corpus Linguistics Conference CL 2013. Lancaster, 2013, s. 125-127.
      Webové stránky konference Konferenční sborník abstraktů

      Druh sborníku: předkonferenční sborník
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 5. 3. 2024 11:47.
    5. KILGARRIFF, Adam a Vít SUCHOMEL. Web Spam. Online. In Stefan Evert , Egon Stemle, Paul Rayson. Proceedings of the 8th Web as Corpus Workshop (WAC-8) @Corpus Linguistics 2013. 2013, s. 46-52.
      Konferenční sborník Webové stránky konference

      Druh sborníku: předkonferenční sborník
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 5. 3. 2024 11:47.

    2012

    1. BAISA, Vít a Vít SUCHOMEL. Detecting Spam in Web Corpora. In Aleš Horák, Pavel Rychlý. 6th Workshop on Recent Advances in Slavonic Natural Language Processing. Brno: Tribun EU, 2012, s. 69-76. ISBN 978-80-263-0313-8.
      URL
      RIV/00216224:14330/12:00062284 Stať ve sborníku. Informatika. angličtina. Česká republika.
      Baisa, Vít (203 Česká republika, garant, domácí) -- Suchomel, Vít (203 Česká republika, domácí)
      Klíčová slova anglicky: spam detection; web corpora; n-gram
      Druh sborníku: předkonferenční sborník

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 25. 5. 2021 19:21.
    2. SUCHOMEL, Vít a Jan POMIKÁLEK. Efficient Web Crawling for Large Text Corpora. Online. In Adam Kilgarriff, Serge Sharoff. Proceedings of the seventh Web as Corpus Workshop (WAC7). Lyon, 2012, s. 39-43.
      Proceedings of the seventh Web as Corpus Workshop (WAC7)
      Název česky: Efektivní automatické stahování z webu pro velké textové korpusy
      Informatika. angličtina. Česká republika.
      Klíčová slova anglicky: crawler; web crawling; corpus; web corpus; text corpus
      Mezinárodní význam: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 9. 4. 2013 11:49.
    3. BAISA, Vít a Vít SUCHOMEL. Large Corpora for Turkic Languages and Unsupervised Morphological Analysis. Online. In Seniz Demir, Ilknur Durgar El-Kahlout, Mehmet Ugur Dogan. Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12). Istanbul, Turkey: European Language Resources Association (ELRA), 2012, s. 28-32. ISBN 978-2-9517408-7-7.
      URL
      RIV/00216224:14330/12:00059944 Stať ve sborníku. Jazykověda. angličtina. Česká republika.
      Baisa, Vít (203 Česká republika, garant, domácí) -- Suchomel, Vít (203 Česká republika, domácí)
      Klíčová slova anglicky: corpus; turkic languages; unsupervised morphological analysis
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 9. 4. 2013 11:30.
    4. DOVUDOV, Gulshan, Vít SUCHOMEL a Pavel ŠMERK. POS Annotated 50M Corpus of Tajik Language. Online. In Proceedings of the Workshop on Language Technology for Normalisation of Less-Resourced Languages (SALTMIL 8/AfLaT 2012). Istanbul: European Language Resources Association (ELRA), 2012, s. 93-98. ISBN 978-2-9517408-7-7.
      URL
      RIV/00216224:14330/12:00061900 Stať ve sborníku. Informatika. angličtina. Francie.
      Dovudov, Gulshan (762 Tádžikistán, domácí) -- Suchomel, Vít (203 Česká republika, domácí) -- Šmerk, Pavel (203 Česká republika, garant, domácí)
      Klíčová slova anglicky: Tajik language; Tajik corpus; morphological analysis of Tajik
      Druh sborníku: předkonferenční sborník

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 24. 9. 2013 13:14.
    5. SUCHOMEL, Vít. Recent Czech Web Corpora. In Aleš Horák, Pavel Rychlý. 6th Workshop on Recent Advances in Slavonic Natural Language Processing. Brno: Tribun EU, 2012, s. 77-83. ISBN 978-80-263-0313-8.
      URL
      RIV/00216224:14330/12:00057973 Stať ve sborníku. Jazykověda. angličtina. Česká republika.
      Suchomel, Vít (203 Česká republika, garant, domácí)
      Klíčová slova anglicky: web corpora; czech corpus
      Druh sborníku: předkonferenční sborník

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 25. 5. 2021 19:20.
    6. SpiderLing (software)
      SUCHOMEL, Vít. SpiderLing. 2012.
      Domovská stránka software, zdrojový kód
      Název česky: SpiderLing
      RIV/00216224:14330/12:00064706 Software. Jazykověda. angličtina. Česká republika.
      Suchomel, Vít (203 Česká republika, garant, domácí)
      Klíčová slova anglicky: web crawler; web spider; text corpora
      Mezinárodní význam: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 10. 4. 2014 17:43.
    7. DOVUDOV, Gulshan, Vít SUCHOMEL a Pavel ŠMERK. Towards 100M Morphologically Annotated Corpus of Tajik. In Aleš Horák, Pavel Rychlý. Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2012. Brno: Tribun EU, 2012, s. 91-94. ISBN 978-80-263-0313-8.
      URL
      RIV/00216224:14330/12:00064722 Stať ve sborníku. Jazykověda. angličtina. Česká republika.
      Dovudov, Gulshan (762 Tádžikistán, domácí) -- Suchomel, Vít (203 Česká republika, domácí) -- Šmerk, Pavel (203 Česká republika, garant, domácí)
      Klíčová slova anglicky: web corpora; Tajik
      Druh sborníku: předkonferenční sborník
      Mezinárodní význam: ano
      Recenzováno: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 25. 5. 2021 19:21.

    2011

    1. DOVUDOV, Gulshan, Jan POMIKÁLEK, Vít SUCHOMEL a Pavel ŠMERK. Building a 50M Corpus of Tajik Language. In Aleš Horák, Pavel Rychlý. Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2011. Brno: Tribun EU, 2011, s. 89-95. ISBN 978-80-263-0077-9.
      URL
      RIV/00216224:14330/11:00054044 Stať ve sborníku. Jazykověda. angličtina. Česká republika.
      Dovudov, Gulshan (762 Tádžikistán, domácí) -- Pomikálek, Jan (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, domácí) -- Šmerk, Pavel (203 Česká republika, garant, domácí)
      Klíčová slova anglicky: language corpora; corpus; corpus building; tajik
      Druh sborníku: předkonferenční sborník

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 25. 5. 2021 19:21.
    2. Chared (software)
      POMIKÁLEK, Jan a Vít SUCHOMEL. Chared. 2011.
      Domovská stránka software, online demo Repozitář zdrojového kódu, instalační balíček ke stažení
      Název česky: Chared
      RIV/00216224:14330/11:00056802 Software. Jazykověda. angličtina. Česká republika.
      Pomikálek, Jan (203 Česká republika, domácí) -- Suchomel, Vít (203 Česká republika, garant, domácí)
      Klíčová slova anglicky: character encoding; character encoding detection; charset; Unicode
      Mezinárodní význam: ano

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 11. 4. 2013 14:54.
    3. POMIKÁLEK, Jan a Vít SUCHOMEL. chared: Character Encoding Detection with a Known Language. In Aleš Horák, Pavel Rychlý. RASLAN 2011. 5. vyd. Brno, Czech Republic: Tribun EU, 2011, s. 125-129. ISBN 978-80-263-0077-9.
      URL
      RIV/00216224:14330/11:00050165 Stať ve sborníku. Informatika. angličtina. Česká republika.
      Pomikálek, Jan (203 Česká republika, garant, domácí) -- Suchomel, Vít (203 Česká republika, domácí)
      Klíčová slova anglicky: character encoding; character encoding detection; charset; Unicode
      Druh sborníku: předkonferenční sborník

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 25. 5. 2021 19:17.
    4. SUCHOMEL, Vít a Jan POMIKÁLEK. Practical Web Crawling for Text Corpora. In A. Horák, P. Rychlý. Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2011. Brno: Tribun EU, 2011, s. 97-108. ISBN 978-80-263-0077-9.
      URL
      Název česky: Praktické automatické stahování z webu pro textové korpusy
      RIV/00216224:14330/11:00050166 Stať ve sborníku. Informatika. angličtina. Česká republika.
      Suchomel, Vít (203 Česká republika, garant, domácí) -- Pomikálek, Jan (203 Česká republika, domácí)
      Klíčová slova anglicky: crawler; web crawling; corpus; web corpus; text corpus
      Druh sborníku: předkonferenční sborník

      Změnil: RNDr. Vít Suchomel, Ph.D., učo 139723. Změněno: 25. 5. 2021 19:18.
Zobrazeno: 19. 9. 2024 09:18