Schița de curs

Introducere în Apache Kylin

  • Perspectivă generală asupra OLAP și importanța sa în analiza datelor mari
  • Evoluția lui Apache Kylin și arhitectura sa
  • Caracteristicile principale și capacitățile ale lui Kylin 50

Configurarea lui Apache Kylin

  • Precondiții de instalare și configurarea mediului
  • Configurarea lui Kylin cu Hadoop, Spark, și Kafka
  • Comprezând interfața web a lui Kylin și instrumentele liniei de comandă

Modelizarea Datelor în Kylin

  • Dizajnarea schemelor star și snowflake pentru cuburile OLAP
  • Definirea dimensiunilor și măsurilor
  • Creația și gestionarea modelelor de date în interfața web a lui Kylin

Construirea și Gestionarea Cuburilor

  • Procesul de construcție a cubului și gestionarea sarcinii
  • Construcția incrementală și strategiile de auto-combinare
  • Supravegherea sănătății și performanței cuburilor

Transmitere în timp real cu Kylin

  • Integrarea lui Kafka ca sursă de date de transmitere continuă
  • Configurarea cuburilor în timp real și modelelor de fusie
  • Atingerea analizei cu întârziere scăzută folosind datele de transmitere continuă

Interogare și Analiză

  • Executarea interogărilor SQL folosind interfața de interogare a lui Kylin
  • Conectarea instrumentelor BI (de exemplu, Tableau, Power BI) la Kylin
  • Realizarea analizei multidimensionale și a explorărilor detaliate

Optimizare Performanță

  • Bunele practici pentru dizajnul și agregarea cuburilor
  • Gestionarea resurselor și ajustările pentru scalabilitate
  • Detectarea și rezolvarea problemelor comune de performanță

Subiecte Avansate

  • Siguranța și controlul accesului în Kylin
  • Extinderea lui Kylin cu plugin-uri personalizate și integrații
  • Explorarea API-urilor REST ale lui Kylin pentru automatizare

Rezumat și Următoarele Pași

Cerințe

  • O înțelegere a ecosistemelor Hadoop și ale big data
  • Familiaritate cu conceptele SQL și de depozitare a datelor
  • Cunoștințe de bază despre platforme pentru date în flux, cum ar fi Kafka

Publicul vizat

  • Inginerii big data care caută să implementeze soluții de analiză în timp real
  • Analizații datelor care doresc să folosească capacitatea OLAP pe seturi mari de date
  • Arhitecții de depozitare a datelor interesatî de modernizarea infrastructurii lor
 14 ore

Numărul de participanți


Pret per participant

Mărturii (5)

Upcoming Courses

Categorii înrudite