Detail kurzu

Microsoft Power BI II. - Import údajov pomocou editora Power Query

IT LEARNING SLOVAKIA, s.r.o.

Popis kurzu

Základný problém pri tvorbe reportov je import údajov zo zdroja a ich správny tvar. Bez správneho tvaru sa s údajmi bude zle pracovať, alebo sa nebudú dať použiť vôbec. Náročnosť spracovania je dosť závislá aj od typu používaného zdroja. V prípade databáz môže ísť o jednoduchý proces, v prípade exportov v súboroch ako sú .xlsx alebo .csv môže ísť o zložitejší proces. V prípade Excel súboru tvoreného manuálne používateľom, môže ísť o veľmi zložitý proces čistenia. Ďalšia dôležitá téma je ako budú údaje pribúdať a ako sa budú aktualizovať. Celý proces importu by mal byť plne automatický. Posledný element importu je problém niekoľkých tabuliek v modeli a ich systém vzťahov. Hlavný nástroj Power BI pre import údajov je nástroj Power Query. Ide o intuitívny nástroj, ktorý umožňuje upraviť údaje v grafickom prostredí bez potreby písania kódu. Poskytuje sadu nástrojov na čistenie nesprávne zapísaných údajov ako napr. dátum v textovom tvare. Okrem toho má k dispozícií nástroje na transformáciu tabuľky do správneho tvaru. Toto je dôležité napr. pri exotických tvaroch tabuľkiek z Excel súborov ktoré treba transformovať na databázový tvar. Okrem importovacieho nástroja má Power BI systém vzťahov, ktorý je podobný ako vzťahy v relačných databázach. Narozdiel od databáz je však v Power BI dôležité mať schému vzťahov v špecifickom tvar tzv. hviezdy (en: Star schema). V Power Query to v praxi znamená zlučovanie alebo delenie tabuliek do takého tvaru aby výpočty vo vizuálcoh a v jazyku DAX boli čo najjednoduchšie. Školenie Microsoft Power BI II. - Import údajov pomocou editora Power Query sa zameriava na 3 oblasti. V prvom rade je to prehľad dôležitých zdrojov ako sú databázy alebo súborové exporty, a použitie správnych konektorov pre daný zdroj. Napr. výber údajov z Excelu má niekoľko kontektorov v závislosti od miesta uloženia a spôsobu aktualizácie údajov. Druhá sa zaoberá prehľadom všetkých nástrojov ktoré Power Query disponuje. Tým sa rozumie nie len čistenie údajov v stĺpcoch ale aj správny tvar tabuľky, alebo eliminácia duplicít. Tretia oblasť sa zaoberá vytvorením modelu v tvare hviezdy (en Star chema). Je to oblasť ktorá nie je vôbec intuitívna ak nie je urobená dobre tak výsledný model komplikuje výpočty v reporte. Dané oblasti nie sú vyučované samostatne ale ako ucelený blok zameraný vždy na konkrétny zdroj údajov pre jeho potreby. Kurz Power BI 2 priamo nadväzuje na predchádzajúci kurz Power BI 1, v ktorom sa preberajú základy používania technológie Power BI. Záujemca o kurz Power BI 2 by mal poznať technológiu Power BI minimálne na úrovni kurzu Power BI 1. Praktická znalosť práce s Excel súbormi je výhoda. Znalosť SQL databáz nie je pre absolvovanie kurzu potrebná, ale podstatne pomôže pre rýchlejšie pochopenie súvislostí. Dátový model Power BI a Power Query totiž používajú veľa databázových konceptov ako sú databázové tabuľky, vzťahy alebo spájania dotazov operáciou JOIN a UNION.

Obsah kurzu

Úvod do spracovania údajov
  • Príprava údajov pre Power BI
    • Čo je to sémantický (dátový) model
    • Základná databázovej teórie
    • Aký tvar musia mať údaje, ktoré vstupujú do dátového modelu
    • Príklady nesprávnych tvarov tabuliek, ktoré potrebujú transformáciu a čistenie
  • Práca so vzťahmi v Power BI
    • Čo je to Kardinalita vzťahu a ako ovplyvňuje model
    • Ako funguje automatické zisťovanie kardinality
    • Čo je to smer filtrovania a ako súvisí s kardinalitou
    • Obmedzenia pri zmene kardinality a smeru filtrovania
  • Dátový model typu hviezda (EN: Star schema)
    • Potenciálne problémové scenáre pri vytváraní vzťahov
    • Čo je to model hviezda, a ako ho použiť na riešenie problémov vo vzťahoch
    • Ako vytvoriť model hviezda
  • Ako naplánovať výber údajov tak aby fungovala aktualizácia automaticky
    • Aké sú možnosti aktualizácie údajov a aktualizácie reportu
    • Ktoré aktualizácie fungujú aj cloude powerbi.com, čo je to brána údajov.
    • Potenciálne chyby pri výbere konektora z hľadiska aktualizovania údajov
  • Režimy výberu údajov
    • Rozdiel medzi Import a Direct Query
    • Vplyv režimov na aktualizáciu
Editor Power Query
  • Predstavenie editora dotazov Power Query
    • Popis základného prostredia
    • Práca s panelom použité kroky
  • Základné transformačné nástroje
    • Filtrovanie riadkov alebo stĺpcov
    • Dátové typy vs formátovanie údaja
    • Nástroje na čistenie a konverziu hodnôt
    • Eliminácia duplicitných údajov
    • Nástroje na transformovanie tabuľky
    • Nástroje na analýzu kvality údajov v stĺpcoch
  • Vypočítané stĺpce
    • Základný syntax výpočtov
    • Prehľad operátorov
    • Výpočty s podmienkou IF
  • Spájanie a delenie dotazov
    • Panel dotazov a efektívna organizácia dotazov do skupín
    • Kopírovanie dotazov v režime duplikát a odkaz
    • Spojenie niekoľkých dotazov v režime „Pripájacie dotazy“ (Append query)
    • Spojenie niekoľkých dotazov v režime „Zlučovacie dotazy“ (Merge query)
    • Čo sú to úrovne ochrany (privacy levels) a ich správne nastavenie
    • Rozdiel medzi vytvorením vzťahu v Power BI a spojení dotazov v PowerQuery
  • Pokročilá práca v dotazoch
    • Úvod do editora jazyka M
    • Parametrizácia dotazov
    • Vytvorenie vlastnej funkcie
  • Optimalizačné nástroje
    • Význam automatickej časovej analýzy a jej nahradenie vlastným kalendárom
    • Vytvorenie a nastavenie špeciálnych agregačných tabuliek
    • Nastavenie prírastkového obnovenia (incremental refresh)
    • Optimalizácia veľkosti dátového modelu z pohľadu kardinality
Práca so základnými zdrojmi údajov
  • SQL Databázy
    • Typy SQL databáz
    • Ako sa orientovať v SQL databáze
    • Výhody SQL databázy ako hlavného zdroja údajov
    • Problém výberu údajov z informačných systémov (napr. SAP)
  • Excel súbory
    • Čo je a čo nie je Excel súbor
    • Automatické exporty v súboroch Excelu
    • Najčastejšie problémy s Excel exportom
    • Typy tabuliek a potrebné transformácie
    • Problémy, ktoré môžu nastať pri čistení Excel údajov
    • Ako predísť dodatočným zmenám v zdroji údajov ktoré môžu spôsobiť nefunkčnosť dotazu
  • Exporty v plaintext súboroch
    • Definovanie pojmu plain text súbor a pojmu kódovanie
    • Problémy s regionálnymi konvenciami zápisu hodnôt
    • Plaintext súbory typu CSV
    • Typické konverzie a čistenie súboru CSV
    • Súborové exporty typu XML a JSON
  • Ďalšie zdroje
    • Výber jednoduchej tabuľky na webe
    • OLAP kocky a ich výhody

 

Cieľová skupina

mierne pokročilý
Hodnotenie




Organizátor



Ďalšie termíny kurzu
Termín Cena Miesto konania Zarezervovať