Schița de curs

Introducere

  • Prezentare generală a funcțiilor și arhitecturii Spark și Hadoop
  • Înțelegerea big data
  • Python elementele de bază ale programării

Noțiuni introductive

  • Configurarea Python, Spark și Hadoop
  • Înțelegerea structurilor de date în Python
  • Înțelegerea API-ului PySpark
  • Înțelegerea HDFS și MapReduce

Integrarea Spark și Hadoop cu Python

  • Implementarea Spark RDD în Python
  • Prelucrarea datelor utilizând MapReduce
  • Crearea seturilor de date distribuite în HDFS

Machine Learning cu Spark MLlib

Prelucrarea Big Data cu Spark Streaming

Lucrul cu sistemele de recomandare

Lucrul cu Kafka, Sqoop, Kafka și Flume

Apache Mahout cu Spark și Hadoop

Rezolvarea problemelor

Rezumat și pași următori

Cerințe

  • Experiență cu Spark și Hadoop
  • Python experiență în programare

Audiență

  • Oameni de știință în domeniul datelor
  • Dezvoltatori
 21 ore

Numărul de participanți


Pret per participant

Mărturii (3)

Upcoming Courses

Categorii înrudite