Сайт использует сервис веб-аналитики Яндекс Метрика с помощью технологии «cookie». Пользуясь сайтом, вы даете согласие на использование данной технологии.
ETL Лучшие Практики: Полное руководство для начинающих и не только (ETL Best Practices)
Ты только начинаешь создавать ETL процессы или ты хочешь улучшить свои навыки в создании ETL процессов? Тогда это видео для тебя. В этом видео я покажу худшие и лучшие практики при создании ETL-процессов. Также мы разберём что такое "плохо" и что такое "хорошо". 📌 Что вы узнаете: • Как собирать RAW данные • Как работать с API • Лучшие практики для создания ETL-процессов • Худшие практики для создания ETL-процессов • Рекомендации при создании ETL-процессов 💻 Менторство/консультации по IT – 📂 Полный проект на GitHub: 👨💻 Подходит для начального уровня, junior и middle дата-инженеров, ищущих реальный опыт и сильное портфолио. 🔔 Подписывайтесь и ставьте лайк, если хотите больше практических видео! Ссылки: • Менторство/консультации по IT – • TG канал – • Instagram – / i__korsakov • Habr – • Git-репозиторий из видео – • Лучший пет-проект для дата-инженера (The best pet-project for a data-engineer) – • Лучший пет-проект для дата-инженера (The b... • Как зайти в контейнер? / How do I enter the container? – • Как зайти в контейнер? / How do I enter th... • Что такое контекст DAG и как его использовать? / What is a DAG context and how to use it? – • Что такое контекст DAG и как его использов... • Пишем первый простой DAG / Writing the first simple DAG – • Пишем первый простой DAG / Writing the fir... • Как установить пакеты в Airflow с использованием Dockerfile? / How install packages in Airflow? – • Как установить пакеты в Airflow с использо... • Как запустить Airflow в Docker? / How do I run Airflow in Docker? – • Как запустить Airflow в Docker? / How do I... • Что такое Docker network и как это работает? / What is the Docker network and how does it work? – • Что такое Docker network и как это работае... • Как загрузить данные в PostgreSQL при помощи Python? / How do upload data to PostgreSQL using Python – • Как загрузить данные в PostgreSQL при помо... • Как работает S3 и зачем он нужен в 2025 году? – • Как работает S3 и зачем он нужен в 2025 году? Тайминги: 00:00 – Начало 00:13 – Что такое ETL 01:43 – Про источник данных 02:27 – Разбор структуры проекта 03:11 – Разбор "плохой" практики реализации ETL 08:00 – Запуск "плохой" практики реализации ETL 14:04 – Разбор почему работать через worker плохо 14:51 – Разбор "хорошей" практики реализации ETL 19:57 – Подведение итогов #dataengineer #petproject #airflow #postgresql #minio #metabase #dwh #python #dataengineering #etl #docker #portfolio #датаинженер #etl #elt #s3 #datalake