Schița de curs

  1. Machine Learning introducere
    • Tipuri de învățare automată - învățare supravegheată vs. învățare nesupravegheată
    • De la învățarea statistică la învățarea automată
    • Fluxul de lucru Data Mining:
      • Business înțelegerea
      • Înțelegerea datelor
      • Pregătirea datelor
      • Modelarea
      • Evaluarea
      • Implementare
    • Algoritmi de învățare automată
    • Alegerea algoritmului potrivit pentru problemă
    • Supraadaptarea și compromisul tendință-varianță în ML
  2. Biblioteci ML și limbaje de programare
    • De ce să utilizați un limbaj de programare
    • Alegerea între R și Python
    • Python curs intensiv
    • Python resurse
    • Python Biblioteci pentru învățarea automată
    • Jupyter notebooks și codare interactivă
  3. Testarea algoritmilor ML
    • Generalizare și supraajustare
    • Evitarea supraadaptării
      • Metoda Holdout
      • Validare încrucișată
      • Bootstrapping
    • Evaluarea predicțiilor numerice
      • Măsuri de acuratețe: ME, MSE, RMSE, MAPE
      • Stabilitatea parametrilor și a predicțiilor
    • Evaluarea algoritmilor de clasificare
      • Precizia și problemele sale
      • Matricea confuziei
      • Problema claselor neechilibrate
    • Vizualizarea performanței modelului
      • Curba de profit
      • Curba ROC
      • Curba de ridicare
    • Selectarea modelului
    • Reglarea modelului - strategii de căutare în grilă
    • Exemple în Python
  4. Pregătirea datelor
    • Importul și stocarea datelor
    • Înțelegerea datelor - explorări de bază
    • Manipularea datelor cu ajutorul bibliotecii pandas
    • Transformarea datelor - analiza datelor
    • Analiza exploratorie
    • Observații lipsă - detectare și soluții
    • Valori aberante - detectare și strategii
    • Standarizare, normalizare, binarizare
    • Recodificarea datelor calitative
    • Exemple în Python
  5. Clasificare
    • Clasificare binară vs. multiclasă
    • Clasificarea prin funcții matematice
      • Funcții discriminante liniare
      • Funcții discriminante pătratice
    • Regresia logistică și abordarea probabilităților
    • Vecinii cei mai apropiați (k-nearest neighbors)
    • Naïve Bayes
    • Arbori de decizie
      • CART
      • Bagging
      • Random Forests
      • Boosting
      • Xgboost
    • Mașini vectoriale cu suport și nuclee
      • Clasificator cu marjă maximă
      • Mașină vectorială cu suport
    • Învățarea ansamblului
    • Exemple în Python
  6. Regresie și predicție numerică
    • Estimarea celor mai mici pătrate
    • Tehnici de selecție a variabilelor
    • Regularizare și stabilitate - L1, L2
    • Neliniarități și medii pătrate generalizate
    • Regresia polinomială
    • Spline de regresie
    • Arbori de regresie
    • Exemple în Python
  7. Învățare nesupravegheată
    • Clustering
      • Clustering bazat pe centroizi - k-means, k-medoids, PAM, CLARA
      • Clustering ierarhic - Diana, Agnes
      • Clustering bazat pe model - EM
      • Hărți autoorganizatoare
      • Evaluarea și aprecierea clusterelor
    • Reducerea dimensionalității
      • Analiza componentelor principale și analiza factorilor
      • Descompunerea valorii singulare
    • Scalarea multidimensională
    • Exemple în Python
  8. Text mining
    • Preprocesarea datelor
    • Modelul bag-of-words
    • Stemming și lemmizare
    • Analiza frecvenței cuvintelor
    • Analiza sentimentelor
    • Crearea norilor de cuvinte
    • Exemple în Python
  9. Motoare de recomandări și filtrare colaborativă
    • Date de recomandare
    • Filtrarea colaborativă bazată pe utilizator
    • Filtrarea colaborativă bazată pe elemente
    • Exemple în Python
  10. Extragerea modelelor de asociere
    • Algoritmul seturilor de elemente frecvente
    • Analiza coșului de cumpărături
    • Exemple în Python
  11. Analiza valorilor aberante
    • Analiza valorii extreme
    • Detectarea valorilor aberante pe baza distanței
    • Metode bazate pe densitate
    • Detectarea valorilor aberante înalt-dimensionale
    • Exemple în Python
  12. Machine Learning studiu de caz
    • Business înțelegerea problemei
    • Preprocesarea datelor
    • Selectarea și reglarea algoritmului
    • Evaluarea rezultatelor
    • Implementare

Cerințe

Cunoașterea și conștientizarea Machine Learning fundamentelor

 21 ore

Numărul de participanți


Pret per participant

Mărturii (3)

Upcoming Courses

Categorii înrudite