Сайт использует сервис веб-аналитики Яндекс Метрика с помощью технологии «cookie». Пользуясь сайтом, вы даете согласие на использование данной технологии.
#ии #reinforcementlearning #markovprocess Курс "Общий Искусственный Интеллект", читается на Факультете свободных искусств и наук Санкт-Петербургского Государственного Университета, весенний семестр 2022 года. Лекция 12, Как принимать решения?, часть 6 из 7 Слайды к лекции: 00:00 Дисконт 02:40 Дисконт как смерть 05:40 Ценность состояния 08:08 Уравнения Беллмана 13:30 Иллюстрация уравнения Беллмана 16:07 Q-функция и уравнение Беллмана для неё 20:43 Ценность состояния для марковского процесса принятия решений 22:54 Иллюстрация уравнения Беллмана для ценности состояния