Александр Боргардт — Колонки и векторные инструкции

Ближайшая конференция — SmartData 2024, 4 сентября (online), 8–9 сентября, (Москва + трансляция). Подробности и билеты:
— — Колоночные СУБД помогают нам решать проблему быстрой обработки данных за счет колоночного представления данных, компрессии типов и векторизации. Если верить определению из Википедии, то векторизация применяется только в колоночных СУБД. На самом деле, векторизация окружает дата-инженера повсюду: NumPy, pandas, Apache Spark, Numba. В докладе разберем основы работы колонок и векторизации. Рассмотрим, где можно еще ощутить мощь векторизации, и узнаем, что мешает ей эффективно работать.

Смотрите также