Schița de curs
Săptămâna 1 Big Data concepte
- Definiție VVVV (Velocity, Volume, Variety, Veracity).
- Limitări ale capacității tradiționale de prelucrare a datelor
- Procesare distribuită
- Analize statistice
- Machine Learning Tipuri de analiză
- Data Visualization
- Procesare distribuită (de ex. map-reduce)
- Introducere în limbajele folosite
- Curs rapid de limbaj R
- Python curs accidental
Săptămânile 2 și 3 Performing Data Analysis
- Analize statistice
- Descriptiv Statistics în Big Data seturi (de ex. calcularea mediei)
- Inferenţială Statistics (estimare)
- Forecasting cu modele de corelație și regresie
- Analiza serii temporale
- Elementele de bază ale Machine Learning
- Învățare supravegheată vs nesupravegheată
- Clasificare și grupare
- Estimarea costului unor metode specifice
- Filtru
Săptămâna 4 Procesarea limbajului natural
- Procesarea textului
- Înțelegerea sensului textului
- Generare automată de text
- Analiza sentimentelor/temei
- Computer Viziune
Săptămâna 5 și 6 Conceptul de scule
- Soluție de stocare a datelor (SQL, NoSQL, ierarhică, orientată pe obiecte, orientată către documente)
- MySQL, Cassandra, MongoDB, Elasticsearch, HDFS, etc...)
- Alegerea soluției corecte la problemă
- Procesare distribuită
- Scânteie
- Machine Learning cu Spark (MLLib)
- Spark SQL
- Scalaabilitate
- Cloud public (AWS, Google etc...)
- Cloud privat (OpenStack, turnătorie de cloud)
- Autoscalabilitate
Săptămâna 7 Soft Skills
- Consiliere și Leadership Abilități
- A avea un impact: povestirea bazată pe date
- Înțelegerea audienței dvs
- Prezentarea eficientă a datelor - transmiterea mesajului dvs
- Influențați eficacitatea și schimbați conducerea
- Gestionarea situațiilor dificile
Examen
- Examenul de absolvire a programului
Cerințe
Participanții trebuie să aibă bune cunoștințe de matematică, cel puțin la nivel de liceu.
Deși nu sunt necesare cunoștințe de programare, orice cunoștințe de programare vor fi utile.
Participanții vor fi evaluați și intervievați înainte de a participa la acest program de formare.
Mărturii (4)
Understanding big data beter
Shaune Dennis - Vodacom
Curs - Big Data Business Intelligence for Telecom and Communication Service Providers
Subject presentation knowledge timing
Aly Saleh - FAB banak Egypt
Curs - Introduction to Data Science and AI (using Python)
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
Curs - Jupyter for Data Science Teams
The example and training material were sufficient and made it easy to understand what you are doing.