SUCHOMEL, Šimon a Michal BRANDEJS. Heterogeneous Queries for Synoptic and Phrasal Search. Online. In CLEF2014 Working Notes. Sheffield, UK: CEUR, Aachen University, 2014, s. 1017-1020. ISSN 1613-0073.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Heterogeneous Queries for Synoptic and Phrasal Search
Autoři SUCHOMEL, Šimon (203 Česká republika, domácí) a Michal BRANDEJS (203 Česká republika, garant, domácí).
Vydání Sheffield, UK, CLEF2014 Working Notes, od s. 1017-1020, 4 s. 2014.
Nakladatel CEUR, Aachen University
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Německo
Utajení není předmětem státního či obchodního tajemství
Forma vydání elektronická verze "online"
WWW URL
Kód RIV RIV/00216224:14330/14:00077319
Organizační jednotka Fakulta informatiky
ISSN 1613-0073
Klíčová slova anglicky suspicious document; plagiarism detection; search engine; source retrieval; stop word; text alignment; snippet similarity;
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 28. 4. 2015 10:44.
Anotace
This paper describes our approaches for the Plagiarism Detection – Source Retrieval task of PAN 2014. We combined and improved methodology used at PAN 2012 and PAN 2013. Our system combines three types of queries: The keywords-based queries; the paragraph-based queries; and the headers-based queries. The queries are distinguished also by other properties such as the phrase query or the positional query. The queries are submitted to two search engines – Chatnoir and Indri – according to their properties. The query’s position serves for the search control, minimization of the total number of executed queries is the system’s priority. Downloaded documents are textually compared with the suspicious document and if a similarity is found, the downloaded document is reported.
Návaznosti
LG13010, projekt VaVNázev: Zastoupení ČR v European Research Consortium for Informatics and Mathematics (Akronym: ERCIM-CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Zastoupení ČR v European Research Consortium for Informatics and Mathematics
Typ Název Vložil/a Vloženo Práva
pan14.pdf Licence Creative Commons  Verze souboru Suchomel, Š. 14. 11. 2014

Vlastnosti

Adresa v ISu
https://is.muni.cz/auth/publication/1206027/pan14.pdf
Adresa ze světa
https://is.muni.cz/publication/1206027/pan14.pdf
Adresa do Správce
https://is.muni.cz/auth/publication/1206027/pan14.pdf?info
Ze světa do Správce
https://is.muni.cz/publication/1206027/pan14.pdf?info
Vloženo
Pá 14. 11. 2014 15:09, RNDr. Šimon Suchomel, Ph.D.

Práva

Právo číst
  • kdokoliv v Internetu
  • osoba doc. Ing. Michal Brandejs, CSc., učo 2116
  • osoba RNDr. Pavel Šmerk, Ph.D., učo 3880
  • osoba RNDr. Šimon Suchomel, Ph.D., učo 98949
Právo vkládat
 
Právo spravovat
  • osoba doc. Ing. Michal Brandejs, CSc., učo 2116
  • osoba RNDr. Pavel Šmerk, Ph.D., učo 3880
  • osoba RNDr. Šimon Suchomel, Ph.D., učo 98949
Atributy
 

pan14.pdf

Aplikace
Otevřít soubor.
Stáhnout soubor.
Adresa v ISu
https://is.muni.cz/auth/publication/1206027/pan14.pdf
Adresa ze světa
https://is.muni.cz/publication/1206027/pan14.pdf
Typ souboru
PDF (application/pdf)
Velikost
147,5 KB
Hash md5
ff4246448883e868578abdcbd5d90183
Vloženo
Pá 14. 11. 2014 15:09

pan14.txt

Aplikace
Otevřít soubor.
Stáhnout soubor.
Adresa v ISu
https://is.muni.cz/auth/publication/1206027/pan14.txt
Adresa ze světa
https://is.muni.cz/publication/1206027/pan14.txt
Typ souboru
holý text (text/plain)
Velikost
9,8 KB
Hash md5
93d4c1dc9b109841203361ed40f7345f
Vloženo
Pá 14. 11. 2014 15:12
Vytisknout
Nahlásit neoprávněně vložený soubor Zobrazeno: 23. 9. 2024 16:40