ИИ-2022, Лекция 12, часть 6/7

#ии #reinforcementlearning #markovprocess Курс "Общий Искусственный Интеллект", читается на Факультете свободных искусств и наук Санкт-Петербургского Государственного Университета, весенний семестр 2022 года. Лекция 12, Как принимать решения?, часть 6 из 7 Слайды к лекции:
00:00 Дисконт 02:40 Дисконт как смерть 05:40 Ценность состояния 08:08 Уравнения Беллмана 13:30 Иллюстрация уравнения Беллмана 16:07 Q-функция и уравнение Беллмана для неё 20:43 Ценность состояния для марковского процесса принятия решений 22:54 Иллюстрация уравнения Беллмана для ценности состояния

Смотрите также