Сайт использует сервис веб-аналитики Яндекс Метрика с помощью технологии «cookie». Пользуясь сайтом, вы даете согласие на использование данной технологии.
TD Learning и Q-learning // Демо-занятие курса «Reinforcement Learning»
Вместе с экспертом погрузимся во временно-разностное обучение и Q-learning. Поговорим об основных идеях обучения с подкреплением, которые делают алгоритм RL более гибким и эффективным. Разберем алгоритм SARSA с различными примерами реализации. Обсудим сильные и слабые стороны каждого решения. Для кого: DS/ML/DL специалисты, IT-специалисты, которые хотят погрузиться в обучение с подкреплением «Reinforcement Learning» - Преподаватель: Андрей Маргерт - исследователь Машинного Обучения в Wageningen Research, работает над технологиями для улучшения качества, безопасности и доступности продуктов Пройдите опрос по итогам мероприятия - Следите за новостями проекта: Telegram: ВКонтакте: LinkedIn: Хабр: