Сайт использует сервис веб-аналитики Яндекс Метрика с помощью технологии «cookie». Пользуясь сайтом, вы даете согласие на использование данной технологии.
СПбГУ -- 2025.10.16 -- Трансформеры в компьютерном зрении
Это лекция из курса "Глубокое обучение", который читается на Факультете математики и компьютерных наук СПбГУ осенью 2025 года. Все материалы этой и других лекций курса (слайды, доска, ноутбуки с кодом) размещены по адресу: Подписывайтесь на мой телеграм-канал "Sineкура": Разделы: 00:00 Базовые архитектуры: VisualBERT, ViT, Swin Transformer 19:56 Распознавание объектов: DETR, DINO и другие 44:28 Идея архитектур Perceiver 51:00 Сегментация медицинских снимков: U-Net с трансформерами 01:15:17 Мультимодальные латентные пространства: CLIP и BLIP