Даже самые надёжные облачные платформы дают сбои, и этот сбой в работе AWS это доказал. 19–20 октября 2025 года небольшая проблема с гонкой DNS в системе управления AWS DynamoDB привела к одному из крупнейших сбоев в работе облака за последнее время. Эта ошибка уничтожила IP-адреса основной конечной точки DynamoDB в регионе us-east-1, нарушив запуск EC2, выполнение лямбда-выражений, балансировщики сетевой нагрузки и даже консоль управления AWS. В этом видео мы подробно разберём произошедшее: от проектирования планировщика DNS и энактора до того, как процесс очистки случайно удалил актуальные записи. Вы увидите, как сбой распространился по сервисам AWS, почему тесная связанность усилила последствия и какие уроки мы можем применить, чтобы повысить отказоустойчивость наших систем. От автоматических выключателей и постепенного снижения производительности до многорегиональной архитектуры и возможности наблюдения – этот реальный сбой показывает, почему отказоустойчивость и изоляция критически важны для проектирования современных систем. Ресурсы: Блог ByteMonk:
Курс по проектированию систем:
LinkedIn: / bytemonk Github:
Обзор AWS:
Временные метки 0:30 – Что произошло 19–20 октября 2025 г. 1:00 – Затронутые сервисы: EC2, Lambda, NLB, Console 1:27 – Как DynamoDB управляет DNS (Planner и Enactors) 2:30 – Корневая причина: состояние гонки 3:20 – Момент, когда всё сломалось 5:00 – Каскадные сбои: EC2, Lambda, IAM и За пределами 7:40 – Развертывание Sevalla 9:00 – Уроки каскада: тесная связанность и зависимости 9:50 – Предотвращение сбоев: автоматические выключатели и плавная деградация 11:06 – Многорегиональная архитектура: почему некоторые клиенты оставались онлайн 12:02 – Уроки наблюдаемости и мониторинга 12:30 – Важные выводы для системных проектировщиков и архитекторов • System Design Interview Basics • System Design Questions
https://www.youtube.com/playlist?list... IWU • Machine Learning Basics • Microservices • Emerging Tech АВС Сертификация: Сертифицированный специалист AWS по облачным технологиям: • How to Pass AWS Certified Cloud Practition... Сертифицированный специалист по архитектуре решений AWS: • How to Pass AWS Certified Solution Archite... Сертифицированный специалист по архитектуре решений AWS: • How to Pass AWS Certified Solution Archite... #AWS #DynamoDB #SystemDesign #CloudComputing #Resilience #DistributedSystems #bytemonk