PV211 Introduction to Information Retrieval

Fakulta informatiky
jaro 2009

Předmět se v období jaro 2009 nevypisuje.

2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: k. Jiná možná ukončení: z.
doc. RNDr. Petr Sojka, Ph.D. (přednášející)
prof. Ing. Jiří Sochor, CSc.
Katedra vizuální informatiky – Fakulta informatiky
Kontaktní osoba: doc. RNDr. Petr Sojka, Ph.D.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Main objectives can be summarized as follows: to understand basics of principles of information retrieval based on (XML) text processing and natural language understanding; to understand principles and algorithms of machine learning, text classification, and web searching needed for textual information systems design.
  • Boolean retrieval; The term vocabulary and postings lists
  • Dictionaries and tolerant retrieval
  • Index construction, Index compression
  • Scoring, term weighting and the vector space model
  • Computing scores in a complete search system
  • Evaluation in information retrieval
  • Relevance feedback and query expansion
  • XML retrieval
  • Probabilistic information retrieval
  • Language models for information retrieval
  • Text classification with vector space model
  • Machine learning and information retrieval
  • Hierarchical clustering
  • Matrix decompositions and latent semantic indexing
  • Web search basics
  • Web crawling and indexes
  • Link analysis, PageRank
  • Christopher D. Manning, Prabhakar Raghavan \& Hinrich Sch Cambridge University Press, 2008, Website: http://informationretrieval.org/
Metody hodnocení
Written exam.
Vyučovací jazyk
Navazující předměty
Informace učitele
Some materials and discussions may be in Czech if nobody objects. Kurs určen zejména studentům oboru Informační systémy jako informatický komplement předmětu tématické řady Informační systémy v X, X\in {ekologie, státní správa, medicína, biologie,...}
Další komentáře
Předmět je vyučován každoročně.
Výuka probíhá každý týden.
Předmět je zařazen také v obdobích jaro 2014, jaro 2015, jaro 2016, jaro 2017, jaro 2018, jaro 2019, jaro 2020, jaro 2021, jaro 2022, jaro 2023, jaro 2024, jaro 2025.