Schița de curs

Introducere în Google Colab și Apache Spark

  • Prezentare generală a Google Colab
  • Introducere în Apache Spark
  • Configurarea Spark în Google Colab

Prelucrarea datelor cu Apache Spark

  • Lucrul cu RDD-uri și DataFrames
  • Încărcarea și prelucrarea seturilor mari de date
  • Utilizarea Spark SQL pentru interogarea datelor structurate

Analiză avansată cu Spark

  • Învățarea automată cu Spark MLlib
  • Efectuarea de analize de date în timp real
  • Calcul distribuit cu Spark

Vizualizarea și Collaboration în Google Colab

  • Integrarea Colab cu biblioteci de vizualizare populare
  • Fluxuri de lucru colaborative cu notebook-uri Colab
  • Partajarea și exportul rezultatelor

Optimizarea Big Data fluxurilor de lucru

  • Reglarea Spark pentru performanță
  • Optimizarea utilizării memoriei și a stocării
  • Scalarea fluxurilor de lucru pentru seturi mari de date

Big Data în cloud

  • Integrarea Google Colab cu instrumentele bazate pe cloud
  • Utilizarea stocării în cloud pentru date mari
  • Lucrul cu Spark în medii cloud distribuite

Studii de caz și bune practici

  • Trecerea în revistă a aplicațiilor big data din lumea reală
  • Studii de caz care utilizează Apache Spark și Colab
  • Cele mai bune practici pentru analiza datelor mari

Rezumat și pași următori

Cerințe

  • Cunoștințe de bază despre conceptele științei datelor
  • Familiaritate cu Apache Spark
  • Python abilități de programare

Audiență

  • Oameni de știință în domeniul datelor
  • Ingineri de date
  • Cercetători care lucrează cu date mari
 14 ore

Numărul de participanți


Pret per participant

Mărturii (5)

Upcoming Courses

Categorii înrudite