PV211 Introduction to Information Retrieval

Fakulta informatiky
jaro 2009

Předmět se v období jaro 2009 nevypisuje.

Rozsah
2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: k. Jiná možná ukončení: z.
Vyučující
doc. RNDr. Petr Sojka, Ph.D. (přednášející)
Garance
prof. Ing. Jiří Sochor, CSc.
Katedra vizuální informatiky – Fakulta informatiky
Kontaktní osoba: doc. RNDr. Petr Sojka, Ph.D.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 33 mateřských oborů, zobrazit
Cíle předmětu
Main objectives can be summarized as follows: to understand basics of principles of information retrieval based on (XML) text processing and natural language understanding; to understand principles and algorithms of machine learning, text classification, and web searching needed for textual information systems design.
Osnova
  • Boolean retrieval; The term vocabulary and postings lists
  • Dictionaries and tolerant retrieval
  • Index construction, Index compression
  • Scoring, term weighting and the vector space model
  • Computing scores in a complete search system
  • Evaluation in information retrieval
  • Relevance feedback and query expansion
  • XML retrieval
  • Probabilistic information retrieval
  • Language models for information retrieval
  • Text classification with vector space model
  • Machine learning and information retrieval
  • Hierarchical clustering
  • Matrix decompositions and latent semantic indexing
  • Web search basics
  • Web crawling and indexes
  • Link analysis, PageRank
Literatura
  • Christopher D. Manning, Prabhakar Raghavan \& Hinrich Sch Cambridge University Press, 2008, Website: http://informationretrieval.org/
Metody hodnocení
Written exam.
Vyučovací jazyk
Angličtina
Navazující předměty
Informace učitele
http://www.fi.muni.cz/~sojka/PV211/
Some materials and discussions may be in Czech if nobody objects. Kurs určen zejména studentům oboru Informační systémy jako informatický komplement předmětu tématické řady Informační systémy v X, X\in {ekologie, státní správa, medicína, biologie,...}
Další komentáře
Předmět je vyučován každoročně.
Výuka probíhá každý týden.
Předmět je zařazen také v obdobích jaro 2014, jaro 2015, jaro 2016, jaro 2017, jaro 2018, jaro 2019, jaro 2020, jaro 2021, jaro 2022, jaro 2023, jaro 2024, jaro 2025.