СПбГУ -- 2025.10.16 -- Трансформеры в компьютерном зрении

Это лекция из курса "Глубокое обучение", который читается на Факультете математики и компьютерных наук СПбГУ осенью 2025 года. Все материалы этой и других лекций курса (слайды, доска, ноутбуки с кодом) размещены по адресу:
Подписывайтесь на мой телеграм-канал "Sineкура":
Разделы: 00:00 Базовые архитектуры: VisualBERT, ViT, Swin Transformer 19:56 Распознавание объектов: DETR, DINO и другие 44:28 Идея архитектур Perceiver 51:00 Сегментация медицинских снимков: U-Net с трансформерами 01:15:17 Мультимодальные латентные пространства: CLIP и BLIP

Смотрите также