Schița de curs

Introducere la Reinforcement Learning

  • Ce este învățarea prin consolidare?
  • Concepte-cheie: agent, mediu, stări, acțiuni și recompense
  • Provocări în învățarea prin consolidare

Explorare și exploatare

  • Echilibrarea explorării și exploatării în modelele RL
  • Strategii de explorare: epsilon-greedy, softmax și altele

Q-Learning și rețele Q adânci (DQN)

  • Introducere în Q-learning
  • Implementarea rețelelor DQN utilizând TensorFlow
  • Optimizarea învățării Q cu reluarea experienței și rețele țintă

Metode bazate pe politici

  • Algoritmi de gradient de politică
  • Algoritmul REINFORCE și implementarea acestuia
  • Metode actor-critice

Lucrul cu OpenAI Gym

  • Configurarea mediilor în OpenAI Gym
  • Simularea agenților în medii dinamice
  • Evaluarea performanței agenților

Tehnici Reinforcement Learning avansate

  • Învățarea prin consolidare a mai multor agenți
  • Gradient determinist profund al politicii (DDPG)
  • Optimizarea proximală a politicilor (PPO)

Implementarea modelelor Reinforcement Learning

  • Aplicații din lumea reală ale învățării prin consolidare
  • Integrarea modelelor RL în mediile de producție

Rezumat și etapele următoare

Cerințe

  • Experiență cu programarea Python
  • Înțelegere de bază a învățării profunde și a conceptelor de învățare automată
  • Cunoașterea algoritmilor și a conceptelor matematice utilizate în învățarea prin consolidare

Audiență

  • Oameni de știință în domeniul datelor
  • Profesioniști în domeniul învățării automate
  • Cercetători AI
 28 ore

Numărul de participanți


Pret per participant

Mărturii (4)

Upcoming Courses

Categorii înrudite