
Курс посвящен обучению с подкреплением (Reinforcement Learning) — одному из ключевых направлений машинного обучения и искусственного интеллекта. В рамках программы рассматриваются основные концепции RL, включая агенты, среды, вознаграждения и стратегии оптимизации. Изучаются алгоритмы Q-обучения, SARSA, Deep Q-Networks (DQN), Policy Gradient методы и Actor-Critic подходы.
- Teacher: Агзямов Эльдар Юнусович
- Teacher: Горбатов Сергей Васильевич