Kurz sa zameriava na získavanie a analýzu dát s dôrazom na praktickú aplikáciu teoretických poznatkov v nástrojoch ako Python a STATISTICA Data Miner. V úvode sa oboznámiš s meracími procedúrami, výskumnými plánmi a zdrojmi dát, pričom získaš základný prehľad o objavovaní znalostí z databáz (KDD). Už od začiatku pracuješ na praktických úlohách vo virtuálnom vzdelávacom prostredí, pričom využívaš knižnice ako pandas
, numpy
, matplotlib
, seaborn
a scipy
.
Následne sa venuješ exploračnej analýze dát (EDA), kde si osvojíš výpočty početností, popisných charakteristík a tvorbu rôznych vizualizácií. Naučíš sa analyzovať reziduálne hodnoty, transformovať dáta a využívať viacrozmerné prieskumné techniky. Tieto zručnosti si overíš v samostatnom teste.
Druhá časť kurzu je venovaná inferenčnej analýze. Najprv pochopíš teoretický základ v oblasti pravdepodobnosti, odhadov parametrov a testovania hypotéz. Následne sa naučíš vyberať vhodné analytické metódy – od parametrických po neparametrické testy, v závislosti od typu dát a štruktúry vzorky. Zvládneš testy rozdelenia, testy o rozptyle, strednej hodnote a analýzu vzťahov medzi premennými. Výstupom tejto časti je druhý test zameraný na inferenčnú analýzu.
Záver kurzu je venovaný systematickej príprave na skúšku, pričom si prejdeš všetky zručnosti a koncepty, ktoré si počas semestra nadobudol.