Data mining I

Týden 3

Přednáška

Tématem třetí přednášky bude příprava dat. Povíme si, jak z různých datových zdrojů vytvořit datovou matici, proč je důležité data nejprve vyčistit, jak data vhodně transformovat, co to je prokletí dimenzionality a jak si s ním poradit.

Cvičení

Cvičení tento týden bude samostatná práce. Budeme procvičovat SQL dotazy. Pokud je pro vás jazyk SQL novinkou, doporučuji si předem projít slajdy z druhé přednášky, abyste na cvičení neztráceli čas.