Вид с высоты птичьего полета на центр обработки данных Amazon Web Services, известный как US East 1 в Эшберне, штат Вирджиния. Фото: Reuters

Amazon.com облачный сервис вернулся к нормальной работе в понедельник днем, сообщила компания, после сбоя в работе Интернета, который вызвал глобальный переполох среди тысяч сайтов, включая некоторые из самых популярных веб-приложений, таких как Snapchat и Reddit.

Тем не менее, Amazon заявила, что в некоторых сервисах AWS накопилось много сообщений, обработка которых займет несколько часов.

На AWS размещаются приложения и компьютерные процессы для компаний по всему миру, и из-за сбоев сотрудники из Лондона в Токио были переведены в автономный режим, а другие не могли выполнять обычные повседневные задачи, такие как оплата услуг парикмахеров или смена авиабилетов. В понедельник днем пользователи жаловались на сохраняющиеся трудности с использованием таких сервисов, как цифровой кошелек Venmo и сайт видеозвонков Zoom.

Это стало крупнейшим сбоем в работе Интернета с тех пор, как прошлогодняя массовая забастовка привела к сбоям в работе технологических систем в больницах, банках и аэропортах, подчеркнув уязвимость взаимосвязанных технологий в мире.

По меньшей мере в третий раз за последние пять лет кластер AWS в Северной Вирджинии, известный как US-EAST-1, стал причиной крупного сбоя в работе Интернета.

Amazon не ответила на запрос о дополнительной ясности в отношении того, почему этот конкретный центр обработки данных продолжает подвергаться воздействию. Проблемы были связаны с так называемой системой доменных имен, или DNS, которая не позволяла приложениям находить правильный адрес для AWS DynamoDB API, облачной базы данных, используемой для хранения пользовательской информации и других важных данных.

Основная причина – мониторинг работоспособности сети

Ранее AWS заявила, что основной причиной сбоя стала базовая подсистема, которая отслеживает работоспособность своих сетевых балансировщиков нагрузки, используемых для распределения трафика между несколькими серверами.

Проблема, по словам AWS, возникла из-за “внутренней сети EC2”, сервиса Amazon Elastic Compute Cloud, который предоставляет облачные возможности по требованию в AWS.

Вскоре после 15:00 по североамериканскому времени (19:00 по Гринвичу) Amazon сообщила: “Все сервисы AWS вернулись к нормальной работе. В некоторых сервисах, таких как AWS Config, Redshift и Connect, по-прежнему накапливается количество сообщений, которые они завершат обрабатывать в течение следующих нескольких часов”.

Кен Бирман, профессор компьютерных наук Корнеллского университета, сказал, что разработчикам программного обеспечения необходимо повысить отказоустойчивость. Он сказал, что AWS предоставляет разработчикам инструменты, которые они могут использовать для самозащиты в случае возникновения проблем в одном из своих обширных центров обработки данных, а разработчики также могут создавать резервные копии с помощью других облачных провайдеров.

“Когда люди сокращают расходы и стараются использовать все возможности, чтобы запустить приложение, а затем забывают, что они пропустили этот последний шаг и на самом деле не защитили себя от сбоев в работе, именно эти компании действительно нуждаются в тщательной проверке позже”, – сказал Бирман агентству Reuters.

Проблема на сайте AWS, известная предыдущими сбоями в работе

AWS предоставляет вычислительные мощности, хранилища данных и другие цифровые услуги компаниям, правительствам и частным лицам и является крупнейшим в мире облачным провайдером, за которым следуют Microsoft Azure и Google Cloud от Alphabet.

Сбои в работе серверов компании могут привести к перебоям в работе веб-сайтов и платформ – от приложений для доставки еды до игровых платформ и систем авиаперевозок, – которые основаны на облачной инфраструктуре компании.

На своей странице статуса AWS сообщила, что сбой в работе в понедельник произошел в офисе компании US-EAST-1, старейшем и крупнейшем в мире веб-сервисах. Сайт страдал от сбоев в работе в 2021 и 2020 годах.

Согласно документации на веб-сайте AWS, сайт US-EAST-1 часто является регионом по умолчанию для многих сервисов AWS.

“Уязвимые инфраструктуры”

Эта проблема подчеркивает, насколько взаимосвязанными стали повседневные цифровые сервисы и их зависимость от небольшого числа глобальных облачных провайдеров, и, по мнению экспертов и ученых, один сбой может привести к хаосу в бизнесе и повседневной жизни.

“Это отключение еще раз подчеркивает нашу зависимость от относительно хрупкой инфраструктуры”, – сказал Джейк Мур, глобальный консультант по кибербезопасности европейской компании ESET по кибербезопасности.

В Великобритании под удар попали Lloyd Bank, Bank of Scotland и поставщики телекоммуникационных услуг Vodafone и BT, сообщается на британском веб-сайте Downdetector, а также на веб-сайте налогового, платежного и таможенного управления Великобритании HMRC.

“Основная причина этой проблемы заключается в том, что все эти крупные компании полагаются только на один сервис”, – сказал Нишант Састри, директор по исследованиям на факультете компьютерных наук Университета Суррея.

Компания Ókla, которой принадлежит Downdetector, сообщила, что более 4 миллионов пользователей сообщили о проблемах из-за инцидента.

“Для крупных компаний часы простоя облачных вычислений оборачиваются потерей производительности и доходов на миллионы долларов”, – сказал Райан Гриффин, руководитель практики киберпространства в страховой компании McGill and Partners в США.

Уолл-стрит в целом осталась равнодушной, в результате чего акции Amazon выросли на 1,6% до 216,48 долларов.

От Snapchat до Venmo: из-за сбоев в работе приложений

По словам Оклы, по меньшей мере тысяча компаний пострадали от сбоя. Пострадали такие приложения, как Reddit, Roblox, Snapchat и Duolingo.

Стартап с искусственным интеллектом Perplexity, криптовалютная биржа Coinbase и торговое приложение Robinhood столкнулись с перебоями в работе платформы и приписали их AWS.

Собственные сервисы Amazon, включая веб-сайт для покупок Prime Video и Alexa, также пострадали.

Среди игровых платформ, которые пострадали, были Fortnite, принадлежащая Epic Games, Clash Royale и Clash of Clans. Конкурент Uber – Lyft – также потерпел неудачу в Соединенных Штатах.

В своем посте на X президент Signal Мередит Уиттакер подтвердила, что приложение для обмена сообщениями пострадало от сбоя, хотя миллиардер Илон Маск, которому принадлежит X, заявил, что его платформа продолжает работать.

By Редакция сайта

Редакция сайта NewsUAE.ru — это команда профессиональных журналистов и аналитиков, освещающих ключевые события и актуальные новости в ОАЭ и мире. Мы публикуем только проверенные факты, предоставляем экспертные мнения и оперативные репортажи. Наша цель — объективная подача информации и всесторонний анализ событий для наших читателей. Связаться с редакцией: [email protected].