Обзор архитектуры Detection Transformer (DETR)

DETR — одна из самых популярных архитектур для детекции на основе трансформера. DETR позволяет избавиться от сложного постпроцессинга, довольно прост в использовании и отлично показывает себя на датасете COCO, занимая 4 место в лидерборде. В этом видео мы расскажем вам, как устроена данная архитектура. Спикер: Михаил Лиз — CV-инженер в компании 2gis, куратор курса по повышению квалификации в Computer Vision deepschool.ru Наш телеграм:
— в нем мы напоминаем теорию, разбираем статьи и делимся советами по обучению нейросетей Полезные ссылки: Оригинальная статья DETR:
Официальный репозиторий с кодом:
Оригинальная статья про трансформер:
Разбор с картинками метрики Generalized Intersection over Union (GIoU):
Разбор Венгерского алгоритма на Хабре:
Разбор позиционного кодирования в трансформерах:

Смотрите также