Василий Мельник — Streaming Data Integration — ETL-инструмент для создания near realtime-процессов
Виталий Бодренков — Визуализация для ELT-процессов в DWH
Евгений Ненахов — Spark Streaming: брать или не брать?
Юрий Гусев — От потоков данных до ML-моделей. Секрет конструирования и тестирования признаков
Бронислав Житников — Как сделать так, чтобы вашему Apache NiFi было плохо
Зачем нужны даталейки (Data Lake)
Тимофей Брунько — CDC. От баззворда к реализации в Data Transfer
DataFrame — настоящее и будущее
Александр Бобряков — Apache Flink на примере задачи дедупликации