В этом видео мы обсуждаем лучший способ сохранения данных в файлы с помощью Python и Pandas. При работе с большими наборами данных наступает момент, когда вам нужно сохранить свои данные. Большинство людей используют CSV-файлы, поскольку их легко передавать и они широко используются. Но есть гораздо более эффективные варианты! Посмотрите, как Роб Мулла, мастер Kaggle, обсуждает альтернативные способы сохранения данных в файлах: файлы pickle, parquet и feather. Я провожу несколько тестов, чтобы показать, что вы можете сэкономить время, место и при этом сохранить важные метаданные о своих файлах! Временная шкала 00:00 Вступление 00:49 Создание данных 02:08 CSV-файлы 04:39 Настройка dtypes для CSV-файлов 06:15 Pickle-файлы 07:16 Parquet ❤️ 09:07 Feather 10:31 Другие параметры 11:02 Бенчмаркинг 12:19 Выводы 12:43 Заключение Code Gist:
Подпишитесь на меня на Twitch, чтобы смотреть прямые трансляции по кодингу: / medallionstallion_ Другие видео: Ускоряем Pandas: • Make Your Pandas Code Lightning Fast Эффективные Pandas Кадры данных: • Speed Up Your Pandas Dataframes Введение в Pandas: • A Gentle Introduction to Pandas Data Analy... Видео об исследовательском анализе данных: • Exploratory Data Analysis with Pandas Python Аудиоданные в Python: • Audio Data Processing in Python Изображения в Python: • Image Processing with OpenCV and Python YouTube:
https://youtube.com/@robmulla?sub_con... Discord: / discord Twitch: / medallionstallion_ Twitter: / rob_mulla Kaggle:
#python #код #наука о данных #pandas