Availability, Reliability and Fault Tolerance - як це готують і навіщо Chaos Engineering?

Зустрічайте сьомий випуск Fwdays Architecture Talks! Наші постійні спікери — Олександр Савченко, Олексій Петров та гість випуску Антон Молдован, DraftKings & NBomber LLC обговорять теми: — High Availability, Reliability and Fault Tolerance - коли ми починаємо про це думати та говорити, і чи точно воно треба? — Основні метрики (uptime SLAs, RTO, RPO, MTBF, MTTR) — Що додати в архітектуру для досягнення Availability, Reliability and Fault Tolerance Корисні посилання: Recommended Book by O.Savchenko: Software Architecture Metrics: Case Studies to Improve the Quality of Your Architecture -
Availability and Beyond: Understanding and Improving the Resilience -
ISO 25010 Reliability -
Reliability Metrics -
Fault Tolerance: Definition, Testing & Importance -
Realizing and Refining Architectural Tactics: Availability -
SEI Architectural Tactics for Availability -
A Cheat Sheet for Designing Fault-Tolerant Systems -
8 Most Important Tips for Designing Fault-Tolerant System -    • 8 Most Important Tips for Designing Fault-...   Common Failure Causes -
Chaos Engineering -
[Paper] Meaningful Availability
[Paper] Metastable Failures
[Paper] Metastable Failures in the Wild
На що варто підписатися: – Більше цікавого для розробників:
– Телеграм-канал Fwdays: ​
– Телеграм-канал Олексія:
– LinkedIn Олексія:   / alexhelkar   – LinkedIn Олександра:   / o-savchenko   – LinkedIn Антона:
Таймкоди: 00:00 - Інтро 01:59 - High Availability, Reliability and Fault Tolerance 13:32 - Основні метрики 35:37 - Як досягнути Availability, Reliability and Fault Tolerance? 41:57 - Chaos Engineering 50:12 - Databases 56:50 - Поради в базах даних 01:07:18 - Управління навантаженнями 01:12:01 - Retry у системах 01:16:16 - Stateful services 01:19:00 - Summary 01:21:01 - Підписуйтесь і ставте вподобайку

Смотрите также