Detail kurzu

CompTIA DataAI Exam DY0-001

EDU Trainings s.r.o.

Popis kurzu

CompTIA DataAI (dříve DataX) je prestižní certifikace určená pro vysoce zkušené odborníky, kteří chtějí potvrdit své kompetence v rychle se rozvíjející oblasti datové vědy. DataAI vás vybaví dovednostmi, díky nimž můžete přesně a s jistotou prokázat svou odbornost při práci se složitými datovými soubory, při implementaci řešení založených na datech a při podpoře růstu podnikání prostřednictvím hluboké interpretace dat. Co se naučíte:






Aplikovat matematické a statistické metody vhodným způsobem, včetně zpracování a čištění dat, statistického modelování a konceptů lineární algebry a kalkulu.


Využívat vhodné analytické a modelovací metody k podloženému doporučení modelů pro modelování, analýzu a dosažení požadovaných výsledků.


Implementovat modely strojového učení a rozumět konceptům hlubokého učení s cílem rozvíjet schopnosti v oblasti datové vědy.


Efektivně zavádět procesy a postupy datové vědy na podporu organizačních cílů.


Prokazovat porozumění trendům v odvětví a specializovaným aplikacím datové vědy v různých oblastech.

Obsah kurzu

Matematika a statistika (17 %)
Statistické metody:


aplikace t-testů, chí-kvadrát testů, analýzy rozptylu (ANOVA), testování hypotéz, regresních metrík, Giniho indexu, entropie, p-hodnoty, ROC křivky a plochy pod křivkou (ROC/AUC), Akaikeho informačního kritéria / Bayesovského informačního kritéria (AIC/BIC) a konfuzní matice.


Pravděpodobnost a modelování:


vysvětlení rozdělení, šikmosti, špičatosti (kurtózy), heteroskedasticity, hustoty pravděpodobnosti (PDF), pravděpodobnostní hmotnostní funkce (PMF), distribuční funkce (CDF), chybějících hodnot, převzorkování (oversampling) a stratifikace.


Lineární algebra a kalkulus:


porozumění hodnosti matice (rank), vlastním číslům (eigenvalues), maticovým operacím, metrikám vzdálenosti, parciálním derivacím, řetězovému pravidlu a logaritmům.


Časové modely:


porovnávání časových řad, analýzy přežití a kauzální inference.



Modelování, analýza a výsledky (24 %)
Metody EDA:


využívání technik exploratorní analýzy dat (EDA), jako je univariační a multivariační analýza, grafy, vizualizace a identifikace příznaků (feature identification).


Problémy s daty:


analýza řídkých dat, nelinearity, sezónnosti, granularity a odlehlých hodnot.


Obohacování dat:


aplikace feature engineeringu, škálování, geokódování a transformace dat.


Iterace modelu:


návrh, hodnocení, výběr a validace modelu.


Komunikace výsledků:


tvorba vizualizací, výběr relevantních dat, vyhýbání se zavádějícím grafům a zajištění přístupnosti.



Strojové učení (24 %)
Základní koncepty:


aplikace ztrátových funkcí, kompromisu bias-variance, regularizace, křížové validace, ansámblových modelů, ladění hyperparametrů a prevence úniku dat (data leakage).


Učení s učitelem:


aplikace lineární regrese, logistické regrese, k-nejbližších sousedů (KNN), naivního Bayese a asociačních pravidel.


Stromové modely:


aplikace rozhodovacích stromů, náhodného lesa (random forest), boostingu a bootstrap agregace (bagging).


Hluboké učení:


vysvětlení umělých neuronových sítí (ANN), dropout, batch normalizace, backpropagation a frameworků pro hluboké učení.


Učení bez učitele:


vysvětlení shlukování (clustering), redukce dimenzionality a singulárního rozkladu (SVD).



Provoz a procesy (22 %)
Podnikové funkce:


vysvětlení compliance (souladu s předpisy), klíčových ukazatelů výkonnosti (KPI) a sběru požadavků.


Typy dat:


vysvětlení generovaných, syntetických a veřejných dat.


Příjem dat (data ingestion):


porozumění datovým pipeline, streamování, dávkovému zpracování a datové linii (data lineage).


Příprava dat (data wrangling):


implementace čištění, slučování, imputace a označování referenčních dat (ground truth).


Životní cyklus datové vědy:


aplikace workflow modelů, verzování, principů čistého kódu a jednotkových testů.


DevOps a MLOps:


vysvětlení kontinuální integrace / kontinuálního nasazování (CI/CD), nasazení modelů, orchestraci kontejnerů a monitorování výkonu.


Prostředí nasazení:


porovnání kontejnerizace, cloudového, hybridního, edge a on-premises nasazení.



Specializované aplikace datové vědy (13 %)
Optimalizace:


porovnání optimalizace s omezeními a bez omezení.


Koncepty NLP:


vysvětlení technik zpracování přirozeného jazyka (NLP), jako je tokenizace, embeddingy, TF-IDF (term frequency–inverse document frequency), modelování témat a aplikace NLP.


Počítačové vidění:


vysvětlení optického rozpoznávání znaků (OCR), detekce objektů, sledování objektů a augmentace dat.


Další aplikace:


vysvětlení grafové analýzy, posilovaného učení (reinforcement learning), detekce podvodů, detekce anomálií, zpracování signálu a dalších oblastí.

Cieľová skupina

Certifikace CompTIA DataAI je ideální pro odborníky, kteří chtějí potvrdit své expertní dovednosti v oblasti datové vědy a analýzy bez ohledu na používané nástroje či platformy konkrétních výrobců. Je určena datovým analytikům, specialistům na business intelligence a všem, kteří se podílejí na rozhodování založeném na datech napříč různými odvětvími.
Certifikát Na dotaz.
Hodnotenie




Organizátor



Ďalšie termíny kurzu
Termín Cena Miesto konania Zarezervovať