Этот НЕВЕРОЯТНЫЙ трюк ускорит обработку ваших данных.

В этом видео мы обсуждаем лучший способ сохранения данных в файлы с помощью Python и Pandas. При работе с большими наборами данных наступает момент, когда вам нужно сохранить свои данные. Большинство людей используют CSV-файлы, поскольку их легко передавать и они широко используются. Но есть гораздо более эффективные варианты! Посмотрите, как Роб Мулла, мастер Kaggle, обсуждает альтернативные способы сохранения данных в файлах: файлы pickle, parquet и feather. Я провожу несколько тестов, чтобы показать, что вы можете сэкономить время, место и при этом сохранить важные метаданные о своих файлах! Временная шкала 00:00 Вступление 00:49 Создание данных 02:08 CSV-файлы 04:39 Настройка dtypes для CSV-файлов 06:15 Pickle-файлы 07:16 Parquet ❤️ 09:07 Feather 10:31 Другие параметры 11:02 Бенчмаркинг 12:19 Выводы 12:43 Заключение Code Gist:
Подпишитесь на меня на Twitch, чтобы смотреть прямые трансляции по кодингу:   / medallionstallion_   Другие видео: Ускоряем Pandas:    • Make Your Pandas Code Lightning Fast   Эффективные Pandas Кадры данных:    • Speed Up Your Pandas Dataframes   Введение в Pandas:    • A Gentle Introduction to Pandas Data Analy...   Видео об исследовательском анализе данных:    • Exploratory Data Analysis with Pandas Python   Аудиоданные в Python:    • Audio Data Processing in Python   Изображения в Python:    • Image Processing with OpenCV and Python   YouTube: https://youtube.com/@robmulla?sub_con...
Discord:   / discord   Twitch:   / medallionstallion_   Twitter:   / rob_mulla   Kaggle:
#python #код #наука о данных #pandas

Смотрите также