Как мы внедряли tracing || Охэхэнный бекенд

Представьте: у вас пара сотен микросервисов, которые внезапно ломаются. Причем даже не все, а какая-нибудь одна страница. Если вы хорошо знакомы с системой, трудностей с починкой не будет. Но если вы видите систему впервые, может уйти масса времени, прежде чем удастся найти источник проблемы. Такой расклад нас не устроил. В нашем новом эпизоде рассказываем о том, как мы внедряли tracing в hh.ru. Поехали! В новом выпуске: Что такое трейсинг и зачем он нужен Сырая технология VS deprected: кто круче? Несколько итераций нашей системы трейсинга Внутри: 00:00 – Интро 00:20 – Вступление 00:49 – Что такое tracing? 02:00 – Как мы выбирали систему tracing? 02:40 – Первый опыт с OpenTelemetry 03:34 – Эксперимент с клиентом на базе JSON RPC 05:06 – Меняем Zipkin на Jaeger, отказ от Apache Cassandra 06:03 – Семплирование как способ сохранения ресурсов 08:15 – Tail-based sampling и работа с ним 08:43 – Проблемы с производительностью и возвращение к OkHttp Cloud 10:38 – Заключение Полезные ссылки: Клиент:
Сервер:
Наш канал в телеге:
Наш чат в телеге:
Наш блог на Хабре:
Наша группа в VK: https://vk.com/hh_tech
Наш Дзен:
🔥 Подписывайтесь на наш канал, следите за новыми полезными роликами! #OpenTelemetry #Tracing #Backend #Zipkin #Jaeger #Opentracing #java #LargeScaleSystems #ОхэхэнныйБекенд #ОхэхэнныйФронтенд #Бекенд #Фронтенд #Разработка #Архитектура #ОхэхэнныеИстории #ОhhнныеИстории #ОххенныеИстории #HeadhunterDev #HhDev #HeadhunterDevelopment

Смотрите также