Schița de curs

Introducere

  • Prezentare generală a Databricks și Apache Spark
  • Înțelegerea arhitecturii Databricks

Noțiuni introductive

  • Configurarea mediului
  • Instalarea și configurarea Databricks
  • Navigarea în interfața utilizator Databricks
  • Crearea unui spațiu de lucru Databricks

Lucrul cu datele în Databricks

  • Conectarea la o sursă de date Apache Spark
  • Înțelegerea bazelor coloanelor și a tipurilor de date
  • Gestionarea sistemului de fișiere în notebook-uri

Gestionarea lucrărilor și a grupurilor

  • Crearea și configurarea clusterelor
  • Crearea lucrărilor utilizând Notebook
  • Executarea lucrărilor
  • Vizualizarea lucrărilor și a detaliilor acestora

Utilizarea Delta Lake în Databricks

  • Încărcarea datelor în Delta Lake
  • Gestionarea datelor în Delta Lake

Securizarea Databricks

  • Gestionarea securității Databricks
  • Gestionarea backup-ului și a recuperării

Rezolvarea problemelor

Rezumat și pași următori

Cerințe

  • Înțelegerea de bază a analizei datelor
  • Cunoștințe de Apache Spark

Audiență

  • Ingineri de date
  • Cercetători de date
  • Dezvoltatori
 14 ore

Numărul de participanți


Pret per participant

Upcoming Courses

Categorii înrudite