Schița de curs
Introducere
Prezentare generală a abordărilor de acces la date (Hive, baze de date, etc.)
Prezentare generală a caracteristicilor și arhitecturii Spark
Instalarea și configurarea Spark
Înțelegerea Dataframe-urilor în Spark
Definirea tabelelor și importul seturilor de date
Interogarea Dataframe-urilor folosind SQL
Efectuarea agregărilor, JOIN-uri și interogării înnestești
Încărcarea și accesarea datelor
Interogarea diferitelor tipuri de date
- JSON, Parquet, etc.
Interogarea lacurilor de date cu SQL
Soluționarea problemelor
Synopsis și concluzie
Cerințe
- Experiență cu interogările SQL
- Experiență în programare în orice limbaj
Public Țintă
- Analistii de date
- Cercetătorii de date
- Inginerii de date
Mărturii (5)
Exemplele live
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina
Suficient de practic, instrucționarul este căpățan
Chris Tan
Curs - A Practical Introduction to Stream Processing
Tradus de catre o masina
Învățați spark streaming, Databricks și AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curs - Apache Spark in the Cloud
Tradus de catre o masina
sarcini de exercițiu
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina