Первичная обработка (очистка) данных

0:00 - введение, импорт модулей 4:59 - удаление дубликатов 7:26 - поиск отсутствующих значений +визуализация 11:50 - удаление строк с пропусками 18:22 - заполнение пустот чем-либо (импутация) 21:10 - заполнение пустот средним или медианой 25:31 - заполнение пустот, метод k ближайших соседей (kNN imputation) 32:51 - поиск и обработка выбросов (аномалий). Введение. 34:46 - обнаружение выбросов, визуализация данных 46:02 - обнаружение выбросов, DBSCAN кластерный анализ 56:44 - почему выбросы вредны? 1:00:42 - обработка выбросов

Смотрите также