Na manhã desta segunda-feira, 20 de outubro, a internet foi abalada por uma grande interrupção nos serviços da Amazon Web Services (AWS). Plataformas populares como Amazon, Alexa, Snapchat, Fortnite, Epic Games Store, ChatGPT, Prime Video, Canva, Duolingo, Zoom, além da aplicação do McDonald’s e jogos como Roblox e Clash Royale foram afetados.
O painel de status da AWS informou sobre um “aumento nas taxas de erro e latências” na região US-EAST-1 (Virgínia do Norte), a mais movimentada da empresa, e afirmou que estava trabalhando para resolver o problema. Os problemas começaram a ser monitorados às 03:11 ET (09:11 no horário da península da Espanha), com um anúncio inicial prometendo atualizações em 45 minutos.
Por volta das 08:40, usuários começaram a relatar dificuldades em acessar os serviços afetados, com queixas generalizadas em redes sociais e fóruns. A situação é global, mas a intensidade do impacto varia conforme a dependência de cada serviço da infraestrutura da AWS.
“Perplexity está fora do ar no momento. A causa raiz é um problema na AWS. Estamos trabalhando para resolver”, declarou o CEO da Perplexity, Aravind Srinivas, em uma rede social.
O que está causando o problema
A AWS explicou que a interrupção é resultado de um “aumento de erros e latências” que afeta múltiplos serviços na região US-EAST-1. A importância desta área na estrutura da AWS resulta em um efeito dominó, já que muitas empresas optam por alocar suas operações ali devido a custo e disponibilidade. Componentes críticos, como autenticação e DNS, que utilizam infraestrutura compartilhada, também contribuíram para a propagação do problema.
Os usuários enfrentam sintomas frequentes, como:
- Páginas que não carregam ou apresentam códigos de erro 5xx.
- APIs que falham ou expiram.
- Dificuldades ao subir ou baixar conteúdo.
- Serviços automatizados que não funcionam.
Serviços essenciais, como Fortnite e Snapchat, também estão enfrentando interrupções. A popularidade da AWS, utilizada por muitas plataformas como Netflix, Spotify, Reddit e Airbnb, intensifica o impacto de qualquer falha.
Cronologia do incidente
- 03:11 ET: AWS relata aumento de erros na US-EAST-1.
- 03:51 ET: Anúncio de que a empresa está trabalhando para mitigar o problema.
- 08:40: Relatos de erros de conectividade começam a surgir fora dos EUA.
- Média manhã (horário da Europa): Serviços continuam a apresentar problemas, mas a causa ainda não foi confirmada oficialmente.
Impacto na Europa
Na Europa, a situação é desigual; alguns serviços funcionam normalmente, enquanto outros falham ao iniciar sessão ou ao carregar conteúdo. O impacto pode mudar rapidamente à medida que a AWS tenta mitigar os problemas.
Empresas afetadas, como a Perplexity, comunicaram publicamente a situação, e plataformas de design e jogos também emitiram avisos sobre a degradação de serviços. A interrupção do Alexa é um exemplo claro do impacto causado pela queda da AWS, tornando inoperativas funções cotidianas dos usuários.
O que dizem as empresas afetadas
Além da AWS, muitas empresas afetadas estão reconhecendo publicamente a dependência da infraestrutura da Amazon. O caso da Alexa, vital para muitos usuários, exemplifica como a interrupção pode afetar diretamente a experiência do cliente e a operação de negócios.
O que fazer agora
Usuários finais devem:
- Verificar o status dos serviços.
- Evitar reinstalações ou exclusões de dados enquanto o problema persiste.
- Tentar novamente mais tarde, devido à intermitência dos serviços.
Equipes de TI devem:
- Evitar mudanças urgentes durante a interrupção, a menos que tenham um plano claro.
- Migrar tráfego para regiões funcionais, se possível.
- Manter os clientes informados sobre a situação.
Conclusão
A situação atual da AWS reafirma a importância de uma arquitetura de serviço resiliente, diversificando a infraestrutura para evitar tais interrupções. A dependência excessiva de uma única região pode potencialmente colocar em risco operações inteiras, conforme demonstrado por este evento.

