Сайт использует сервис веб-аналитики Яндекс Метрика с помощью технологии «cookie». Пользуясь сайтом, вы даете согласие на использование данной технологии.
Параллельные и распределенные вычисления 4. Скорость и синхронизация GPU-вычислений
Дата лекции: 03.10.2023 г. Лектор: Ахтямов Павел Ибрагимович 00:00:00 -- как замерять время работы в CUDA 00:11:05 -- разбор примера 00:14:00 -- подсчет кол-ва операций 00:21:00 -- расчет пропускной способности 00:29:15 -- способы ускорить вычисления 00:31:55 -- иерархия памяти 00:44:45 -- иерархия памяти ЦПУ 00:47:25 -- сравнение иерархии CPU и GPU 00:48:00 -- типы памяти 00:50:50 -- разделяемая (shared) память 00:56:00 -- необходимость синхронизации 00:56:55 -- примитив синхронизации 00:58:45 -- доступ к данным 01:02:10 -- поток управления 01:06:05 -- особенности синхронизации 01:10:45 -- информация по регистрам 01:12:30 -- итоги Плейлист: • Параллельные и распределённые вычисления (... Съёмка: Вашкевич Егор Монтаж: Стешенко Александр