Schița de curs
Introducere la Data Analysis și Big Data
- Ce face ca Big Data să fie "mare"?
- Viteză, volum, varietate, veridicitate (VVVV)
- Limitele prelucrării tradiționale a datelor
- Prelucrarea distribuită
- Analiza statistică
- Tipuri de analiză Machine Learning
- Data Visualization
Big Data Roluri și responsabilități
- Administratori
- Dezvoltatori
- Analiști de date
Languages Utilizat pentru Data Analysis
- R Language
- De ce R pentru Data Analysis?
- Manipularea, calcularea și afișarea grafică a datelor
- Python
- De ce Python pentru Data Analysis?
- Manipularea, prelucrarea, curățarea și procesarea datelor
Abordări pentru Data Analysis
- Analiza statistică
- Analiza seriilor cronologice
- Forecasting cu modele de corelație și regresie
- Inferențială Statistics (estimare)
- Descriptivă Statistics în seturi Big Data (de exemplu, calcularea mediei)
- Machine Learning
- Învățare supravegheată vs. nesupravegheată
- Clasificare și grupare
- Estimarea costului metodelor specifice
- Filtrare
- Prelucrarea limbajului natural
- Prelucrarea textului
- Înțelegerea semnificației textului
- Generarea automată a textului
- Analiza sentimentelor / analiza subiectelor
- Computer Vision
- Achiziționarea, prelucrarea, analiza și înțelegerea imaginilor
- Reconstrucția, interpretarea și înțelegerea scenelor 3D
- Utilizarea datelor din imagini pentru luarea deciziilor
Big Data Infrastructură
- Stocarea datelor
- Baze de date relaționale (SQL)
- MySQL
- Postgres
- Oracle
- Baze de date non-relaționale (NoSQL)
- Cassandra
- MongoDB
- Neo4js
- Înțelegerea nuanțelor
- Baze de date ierarhice
- Baze de date orientate pe obiect
- Baze de date orientate pe documente
- Baze de date orientate grafice
- Altele
- Baze de date relaționale (SQL)
- Procesare distribuită
- Hadoop
- HDFS ca sistem de fișiere distribuit
- MapReduce pentru procesare distribuită
- Spark
- Cadru de calcul în cluster all-in-one in-memory pentru procesarea datelor la scară largă
- Streaming structurat
- Spark SQL
- Machine Learning biblioteci: MLlib
- Procesare grafică cu GraphX
- Hadoop
- Scalabilitate
- Nor public
- AWS, Google, Aliyun, etc.
- Nor privat
- OpenStack, Cloud Foundry, etc.
- Auto-scalabilitate
- Nor public
Alegerea soluției potrivite pentru problemă
Viitorul Big Data
Rezumat și etapele următoare
Cerințe
- O înțelegere generală a matematicii
- O înțelegere generală a programării
- O înțelegere generală a bazelor de date
Audiență
- Dezvoltatori / programatori
- Consultanți IT
Mărturii (7)
Cum funcționează big data, programe de date, o mai bună cunoaștere a modului în care funcționează lumea noastră actuală cu ajutorul datelor
Ozayr Hussain - Vodacom
Curs - A Practical Introduction to Data Analysis and Big Data
Tradus de catre o masina
Partea practică a formării.
Patrick - Vodacom PTy Ltd
Curs - A Practical Introduction to Data Analysis and Big Data
Tradus de catre o masina
Interactive topics and the style used by the lecture to simplified the topics for the students
Miran Saeed - Sulaymaniyah Asayish Agency
Curs - A Practical Introduction to Data Analysis and Big Data
the trainer and his ability to lecture
ibrahim hamakarim - Sulaymaniyah Asayish Agency
Curs - A Practical Introduction to Data Analysis and Big Data
Practical exercises
JOEL CHIGADA - University of the Western Cape
Curs - A Practical Introduction to Data Analysis and Big Data
R programming
Osden Jokonya - University of the Western Cape
Curs - A Practical Introduction to Data Analysis and Big Data
Overall the Content was good.