Исследовательский анализ данных на Python | pandas, numpy, matplotlib, seaborn

В этом видео мы подробно рассмотрим разведочный анализ данных (EDA) с использованием мощных библиотек Python, таких как pandas, numpy, matplotlib и seaborn. Независимо от того, новичок вы или только совершенствуете свои навыки в области науки о данных, это пошаговое руководство поможет вам лучше понять свой набор данных и подготовить его к моделированию. Поддержите меня: BuyMeACoffee:
Patreon:   / dsfeorg   Ko-fi:
Подписывайтесь на меня: Twitter:
Github:
Рассматриваемые темы: 1. Проверка данных: первый взгляд на ваш набор данных 2. Проверка данных: выявление и устранение несоответствий 3. Обобщение данных: использование описательной статистики для понимания распределений 4. Обработка пропущенных данных: эффективная очистка, удаление и импутирование пропущенных данных 5. Исследование категориальных данных: анализ и визуализация категориальных признаков 6. Исследование числовых данных: анализ числовых тенденций и закономерностей 7. Обработка выбросов: обнаружение и управление экстремальными значениями Используемые библиотеки Python: pandas, numpy, matplotlib, seaborn Главы: 0:00 Введение 1:52 Проверка данных 5:43 Валидация данных 9:11 Обобщение данных 12:15 Обработка пропущенных данных 15:22 Импутация пропущенных данных 16:00 Исследование категориальных данных 20:00 Исследование числовых данных 21:53 Обработка выбросов Наборы данных: Данные Penguins:
Измененные данные Penguins:
Данные о зарплатах:
К концу этого руководства у вас будет прочная основа EDA и будьте готовы извлекать ценную информацию из любого набора данных. Не забудьте поставить лайк, поделиться и подписаться, чтобы получать больше контента о науке о данных! #pandaslibrary #python #dataanalysis

Смотрите также