Detail kurzu

Python dátová analýza II. - pokročilá dátová analýza a spracovanie veľkých dát

IT LEARNING SLOVAKIA, s.r.o.

Popis kurzu

Kurz pokročilej dátovej analýzy v Pythone je navrhnutý tak, aby poskytol účastníkom hlboké pochopenie a odborné znalosti v oblasti analýzy dát. Na úvod sa oboznámite s prehľadom pokročilých nástrojov a techník, ako aj s významom dátovej analýzy v rôznych odvetviach. Naučíte sa využívať knižnicu Pandas na pokročilé spracovanie dát, vrátane čistenia a prípravy dát, transformácie a manipulácie, agregácie, zlučovania dát, vizualizácie a importu/exportu dát. V druhej časti kurzu sa zameriame na tvorbu interaktívnych aplikácií pomocou nástrojov Panel a Streamlit, ktoré umožňujú vytvárať dynamické dashboardy a rýchlo prototypovať aplikácie. Ďalej sa budeme venovať tvorbe reportov s využitím vizualizačných knižníc Matplotlib a Plotly, a naučíte sa generovať interaktívne aj statické reporty vo formátoch PDF a HTML. Záverečná časť kurzu sa sústredí na spracovanie veľkých dát pomocou nástrojov Vaex a Dask, ktoré umožňujú efektívne a paralelné spracovanie dát. Osvojíte si pokročilú prácu s Jupyter notebookmi, vrátane tvorby dynamických reportov pomocou JupyterLab a Voila, exportovania notebookov do rôznych formátov, pridávania interaktívnych prvkov pomocou Jupyter Widgets, a parameterizácie a spúšťania notebookov cez Papermill. Týmto spôsobom kurz poskytuje komplexné vzdelanie potrebné na zvládnutie pokročilých techník dátovej analýzy. Kurz je určený pre pokročilých programátorov, ktorí už ovládajú základy dátovej analýzy v Pythone v rozsahu kurzu Python dátová analýza I a majú znalosti programovania na úrovni kurzov Python I-III.

Obsah kurzu

1. Úvod do pokročilej dátovej analýzy
  • Prehľad pokročilých nástrojov a techník
  • Dôležitosť dátovej analýzy v rôznych odvetviach
2. Pokročilá práca s Pandas
  • Úvod do Pandas
  • Čistenie a príprava dát
  • Transformácie a manipulácia dát
  • Pokročilé funkcie pre agregáciu a zlučovanie dát
  • Vizualizácia dát
  • Import a export dát
3. Interaktívne aplikácie s Panel a Streamlit
  • Vytváranie interaktívnych dashboardov
  • Dynamické aktualizácie a prepojenie s ďalšími knižnicami
  • Rýchle prototypovanie interaktívnych aplikácií
4. Tvorba reportov
  • Úvod do reportovania a vizualizácie dát
  • Práca s knižnicami Matplotlib pre vizualizácie
  • Vytváranie interaktívnych reportov pomocou Plotly
  • Generovanie statických reportov vo formátoch PDF a HTML
5. Spracovanie veľkých dát
  • Úvod do práce s veľkými dátami
  • Použitie Vaex pre rýchle a efektívne spracovanie a analýzu dát
  • Použitie Dask pre paralelnú a distribuovanú analýzu

6. Pokročiná práca s Jupyter notebookmi

  • Vytváranie dynamických reportov pomocou JupyterLab a Voila
  • Exportovanie notebookov do rôznych formátov (HTML, PDF, Markdown)
  • Použitie Jupyter Widgets na pridanie interaktívnych prvkov
  • Použitie Papermill na parameterizáciu a spúšťanie notebookov
  • Zdieľanie notebookov cez GitHub a Binder
Hodnotenie




Organizátor