Как SRE следит за стабильностью и скоростью HeadHunter / Антон Иванов (HeadHunter)

Приглашаем на конференцию HighLoad++ 2025, которая пройдет 6 и 7 ноября в Москве! Программа, подробности и билеты по ссылке:
________ Презентация и тезисы:
В докладе хочу рассказать о том, как мы построили процесс, позволяющий каждый месяц улучшать стабильность сайта, с какими техническими проблемами сталкиваемся и как решаем. В частности: как мы определяем, когда сайт работает, а когда - нет? что делаем, когда сайт лежит? как настроили мониторинг и другие инструменты для быстрой локализации проблемы; как нагружаем сайт, чтобы заранее выявить узкое место?

Смотрите также