Detail kurzu
CompTIA DataAI Exam DY0-001
EDU Trainings s.r.o.
Popis kurzu
CompTIA DataAI (dříve DataX) je prestižní certifikace určená pro vysoce zkušené odborníky, kteří chtějí potvrdit své kompetence v rychle se rozvíjející oblasti datové vědy. DataAI vás vybaví dovednostmi, díky nimž můžete přesně a s jistotou prokázat svou odbornost při práci se složitými datovými soubory, při implementaci řešení založených na datech a při podpoře růstu podnikání prostřednictvím hluboké interpretace dat. Co se naučíte:
Aplikovat matematické a statistické metody vhodným způsobem, včetně zpracování a čištění dat, statistického modelování a konceptů lineární algebry a kalkulu.
Využívat vhodné analytické a modelovací metody k podloženému doporučení modelů pro modelování, analýzu a dosažení požadovaných výsledků.
Implementovat modely strojového učení a rozumět konceptům hlubokého učení s cílem rozvíjet schopnosti v oblasti datové vědy.
Efektivně zavádět procesy a postupy datové vědy na podporu organizačních cílů.
Prokazovat porozumění trendům v odvětví a specializovaným aplikacím datové vědy v různých oblastech.
Aplikovat matematické a statistické metody vhodným způsobem, včetně zpracování a čištění dat, statistického modelování a konceptů lineární algebry a kalkulu.
Využívat vhodné analytické a modelovací metody k podloženému doporučení modelů pro modelování, analýzu a dosažení požadovaných výsledků.
Implementovat modely strojového učení a rozumět konceptům hlubokého učení s cílem rozvíjet schopnosti v oblasti datové vědy.
Efektivně zavádět procesy a postupy datové vědy na podporu organizačních cílů.
Prokazovat porozumění trendům v odvětví a specializovaným aplikacím datové vědy v různých oblastech.
Obsah kurzu
Matematika a statistika (17 %)Statistické metody:
aplikace t-testů, chí-kvadrát testů, analýzy rozptylu (ANOVA), testování hypotéz, regresních metrík, Giniho indexu, entropie, p-hodnoty, ROC křivky a plochy pod křivkou (ROC/AUC), Akaikeho informačního kritéria / Bayesovského informačního kritéria (AIC/BIC) a konfuzní matice.
Pravděpodobnost a modelování:
vysvětlení rozdělení, šikmosti, špičatosti (kurtózy), heteroskedasticity, hustoty pravděpodobnosti (PDF), pravděpodobnostní hmotnostní funkce (PMF), distribuční funkce (CDF), chybějících hodnot, převzorkování (oversampling) a stratifikace.
Lineární algebra a kalkulus:
porozumění hodnosti matice (rank), vlastním číslům (eigenvalues), maticovým operacím, metrikám vzdálenosti, parciálním derivacím, řetězovému pravidlu a logaritmům.
Časové modely:
porovnávání časových řad, analýzy přežití a kauzální inference.
Modelování, analýza a výsledky (24 %)
Metody EDA:
využívání technik exploratorní analýzy dat (EDA), jako je univariační a multivariační analýza, grafy, vizualizace a identifikace příznaků (feature identification).
Problémy s daty:
analýza řídkých dat, nelinearity, sezónnosti, granularity a odlehlých hodnot.
Obohacování dat:
aplikace feature engineeringu, škálování, geokódování a transformace dat.
Iterace modelu:
návrh, hodnocení, výběr a validace modelu.
Komunikace výsledků:
tvorba vizualizací, výběr relevantních dat, vyhýbání se zavádějícím grafům a zajištění přístupnosti.
Strojové učení (24 %)
Základní koncepty:
aplikace ztrátových funkcí, kompromisu bias-variance, regularizace, křížové validace, ansámblových modelů, ladění hyperparametrů a prevence úniku dat (data leakage).
Učení s učitelem:
aplikace lineární regrese, logistické regrese, k-nejbližších sousedů (KNN), naivního Bayese a asociačních pravidel.
Stromové modely:
aplikace rozhodovacích stromů, náhodného lesa (random forest), boostingu a bootstrap agregace (bagging).
Hluboké učení:
vysvětlení umělých neuronových sítí (ANN), dropout, batch normalizace, backpropagation a frameworků pro hluboké učení.
Učení bez učitele:
vysvětlení shlukování (clustering), redukce dimenzionality a singulárního rozkladu (SVD).
Provoz a procesy (22 %)
Podnikové funkce:
vysvětlení compliance (souladu s předpisy), klíčových ukazatelů výkonnosti (KPI) a sběru požadavků.
Typy dat:
vysvětlení generovaných, syntetických a veřejných dat.
Příjem dat (data ingestion):
porozumění datovým pipeline, streamování, dávkovému zpracování a datové linii (data lineage).
Příprava dat (data wrangling):
implementace čištění, slučování, imputace a označování referenčních dat (ground truth).
Životní cyklus datové vědy:
aplikace workflow modelů, verzování, principů čistého kódu a jednotkových testů.
DevOps a MLOps:
vysvětlení kontinuální integrace / kontinuálního nasazování (CI/CD), nasazení modelů, orchestraci kontejnerů a monitorování výkonu.
Prostředí nasazení:
porovnání kontejnerizace, cloudového, hybridního, edge a on-premises nasazení.
Specializované aplikace datové vědy (13 %)
Optimalizace:
porovnání optimalizace s omezeními a bez omezení.
Koncepty NLP:
vysvětlení technik zpracování přirozeného jazyka (NLP), jako je tokenizace, embeddingy, TF-IDF (term frequency–inverse document frequency), modelování témat a aplikace NLP.
Počítačové vidění:
vysvětlení optického rozpoznávání znaků (OCR), detekce objektů, sledování objektů a augmentace dat.
Další aplikace:
vysvětlení grafové analýzy, posilovaného učení (reinforcement learning), detekce podvodů, detekce anomálií, zpracování signálu a dalších oblastí.
Cieľová skupina
Certifikace CompTIA DataAI je ideální pro odborníky, kteří chtějí potvrdit své expertní dovednosti v oblasti datové vědy a analýzy bez ohledu na používané nástroje či platformy konkrétních výrobců. Je určena datovým analytikům, specialistům na business intelligence a všem, kteří se podílejí na rozhodování založeném na datech napříč různými odvětvími.
Certifikát
Na dotaz.