Подразделение облачных сервисов Amazon AWS в понедельник с трудом восстанавливалось после масштабного сбоя, который привел к отключению тысяч веб—сайтов, а также некоторых самых популярных приложений в мире — Snapchat и Reddit – и разрушил бизнес по всему миру. Эти беспорядки ознаменовали собой крупнейшие сбои в работе Интернета со времен прошлогодней массовой забастовки, которая привела к сбоям в работе технологических систем в больницах, банках и аэропортах и подчеркнула уязвимость взаимосвязанных технологий в мире. После примерно восьмичасовых сбоев некоторые приложения начали постепенно возвращаться в рабочее состояние по состоянию на 12:00 по восточному времени (14:00 по Гринвичу). Однако AWS признала, что ошибки с повышенным уровнем вероятности по-прежнему влияют на работу нескольких сервисов AWS.
По данным веб-сайта Downdetector, отслеживающего сбои в работе AWS, на 11:46 утра по восточному времени более 7800 пользователей были отключены. Эта цифра выше, чем предыдущий пиковый показатель в 5800 сообщений, зафиксированный в 3:48 утра по восточному времени.
“Мы определили источник проблем с подключением к сети, которые повлияли на сервисы AWS. Основная причина заключается в базовой внутренней подсистеме, отвечающей за мониторинг работоспособности наших систем балансировки сетевой нагрузки”, – говорится в последнем обновлении AWS на странице состояния.
По словам AWS, проблема возникла из-за “внутренней сети EC2”.
EC2 относится к сервису Amazon Elastic Compute Cloud, который предоставляет облачные ресурсы AWS по запросу. Компании используют EC2 для запуска виртуальных серверов, необходимых им для разработки, запуска и размещения приложений, и могут увеличивать или уменьшать емкость по мере необходимости. В то время как некоторые приложения, такие как Reddit и Roblox, в значительной степени стабилизировались, согласно веб-сайту Downdetector, отслеживающему сбои в работе, другие, включая Snapchat, Venmo и Duolingo от PayPal, вновь столкнулись с проблемами, замеченными ранее в тот же день.
Сайт AWS, известный предыдущими сбоями в работе
AWS предоставляет вычислительные мощности, хранилища данных и другие цифровые услуги компаниям, правительствам и частным лицам и является крупнейшим в мире облачным провайдером, за которым следуют Microsoft Azure и Google Cloud от Alphabet. Сбои в работе серверов компании могут привести к перебоям в работе веб—сайтов и платформ — от приложений для доставки еды до игровых платформ и систем авиаперевозок, – которые основаны на облачной инфраструктуре компании. На своей странице статуса AWS сообщила, что сбой в работе произошел в понедельник в офисе компании US-EAST-1 в северной Вирджинии, старейшем и крупнейшем в мире веб-сервисе. Сайт страдал от сбоев в работе в 2021 и 2020 годах.
Согласно документации на веб-сайте AWS, сайт US-EAST-1 часто является регионом по умолчанию для многих сервисов AWS.
В ответ на запрос о комментариях AWS перенаправила агентство Reuters на свою страницу статуса. Amazon не ответила на запрос о комментариях.
Трудное восстановление
Компания Ókla, которой принадлежит Downdetector, сообщила, что более 4 миллионов пользователей сообщили о проблемах из-за инцидента. Например, в Snapchat в последний раз было зарегистрировано более 7500 сообщений на Downdetector, что ниже пикового показателя в более чем 22 000, но все же выше, чем 4000 случаев отключения, зафиксированных примерно в 7 утра по восточному времени.
Стартап с искусственным интеллектом Perplexity, криптовалютная биржа Coinbase и торговое приложение Robinhood столкнулись с перебоями в работе платформы и приписали их AWS.
Собственные сервисы Amazon, включая веб-сайт для покупок Prime Video и Alexa, также пострадали, хотя Downdetector в последний раз показал снижение степени серьезности.
В число пострадавших игровых платформ попали Fortnite, принадлежащая Epic Games, а также Clash Royale и Clash of Clans. Конкурент Uber Lyft также потерпел крах в Соединенных Штатах.
В своем посте на X президент Signal Мередит Уиттакер подтвердила, что приложение для обмена сообщениями также пострадало от сбоя, хотя миллиардер Илон Маск, которому принадлежит X, заявил, что его платформа продолжает работать.
Риск зависимости от нескольких поставщиков услуг
В Великобритании с проблемами также столкнулись Lloyd Bank, Bank of Scotland и поставщики телекоммуникационных услуг Vodafone и BT, сообщается на британском веб-сайте Downdetector, а также на веб-сайте налогового, платежного и таможенного управления Великобритании HMRC.
Эта проблема подчеркивает, насколько взаимосвязаны повседневные цифровые технологии
какими стали услуги и насколько они теперь зависят от небольшого
количество глобальных облачных провайдеров, и один сбой приводит к хаосу
по словам экспертов и ученых, это связано с бизнесом и повседневной жизнью.
“Основная причина этой проблемы заключается в том, что все эти крупные
компании полагались только на одну услугу”, – сказал Нишант
Састри, директор по исследованиям в Университете Суррея
Факультет компьютерных наук.
В то время как не было никаких указаний на потенциальную
кибератака, стоящая за отключением электроэнергии в понедельник, масштаб сбоя
это породило спекуляции.
“Когда происходит что-то подобное, беспокойство о том, что это
киберинцидент понятен”, – сказал Рейф Пиллинг, директор
специалист по анализу угроз в фирме по кибербезопасности Sophos.
“AWS оказывает далеко идущее и сложное влияние, поэтому любой
проблема может привести к серьезному расстройству."