Как крошечная ошибка привела к сбою AWS | DynamoDB us-east-1: объяснение сбоя

Даже самые надёжные облачные платформы дают сбои, и этот сбой в работе AWS это доказал. 19–20 октября 2025 года небольшая проблема с гонкой DNS в системе управления AWS DynamoDB привела к одному из крупнейших сбоев в работе облака за последнее время. Эта ошибка уничтожила IP-адреса основной конечной точки DynamoDB в регионе us-east-1, нарушив запуск EC2, выполнение лямбда-выражений, балансировщики сетевой нагрузки и даже консоль управления AWS. В этом видео мы подробно разберём произошедшее: от проектирования планировщика DNS и энактора до того, как процесс очистки случайно удалил актуальные записи. Вы увидите, как сбой распространился по сервисам AWS, почему тесная связанность усилила последствия и какие уроки мы можем применить, чтобы повысить отказоустойчивость наших систем. От автоматических выключателей и постепенного снижения производительности до многорегиональной архитектуры и возможности наблюдения – этот реальный сбой показывает, почему отказоустойчивость и изоляция критически важны для проектирования современных систем. Ресурсы: Блог ByteMonk:
Курс по проектированию систем:
LinkedIn:   / bytemonk   Github:
Обзор AWS:
Временные метки 0:30 – Что произошло 19–20 октября 2025 г. 1:00 – Затронутые сервисы: EC2, Lambda, NLB, Console 1:27 – Как DynamoDB управляет DNS (Planner и Enactors) 2:30 – Корневая причина: состояние гонки 3:20 – Момент, когда всё сломалось 5:00 – Каскадные сбои: EC2, Lambda, IAM и За пределами 7:40 – Развертывание Sevalla 9:00 – Уроки каскада: тесная связанность и зависимости 9:50 – Предотвращение сбоев: автоматические выключатели и плавная деградация 11:06 – Многорегиональная архитектура: почему некоторые клиенты оставались онлайн 12:02 – Уроки наблюдаемости и мониторинга 12:30 – Важные выводы для системных проектировщиков и архитекторов    • System Design Interview Basics      • System Design Questions   https://www.youtube.com/playlist?list...
IWU    • Machine Learning Basics      • Microservices      • Emerging Tech   АВС Сертификация: Сертифицированный специалист AWS по облачным технологиям:    • How to Pass AWS Certified Cloud Practition...   Сертифицированный специалист по архитектуре решений AWS:    • How to Pass AWS Certified Solution Archite...   Сертифицированный специалист по архитектуре решений AWS:    • How to Pass AWS Certified Solution Archite...   #AWS #DynamoDB #SystemDesign #CloudComputing #Resilience #DistributedSystems #bytemonk

Смотрите также