TD Learning и Q-learning // Демо-занятие курса «Reinforcement Learning»

Вместе с экспертом погрузимся во временно-разностное обучение и Q-learning. Поговорим об основных идеях обучения с подкреплением, которые делают алгоритм RL более гибким и эффективным. Разберем алгоритм SARSA с различными примерами реализации. Обсудим сильные и слабые стороны каждого решения. Для кого: DS/ML/DL специалисты, IT-специалисты, которые хотят погрузиться в обучение с подкреплением «Reinforcement Learning» -
Преподаватель: Андрей Маргерт - исследователь Машинного Обучения в Wageningen Research, работает над технологиями для улучшения качества, безопасности и доступности продуктов Пройдите опрос по итогам мероприятия -
Следите за новостями проекта: Telegram:
ВКонтакте:
LinkedIn:
Хабр:

TD Learning и Q-learning // Демо-занятие курса «Reinforcement Learning»

Смотрите также