Cloudflare, uma das principais peças da infraestrutura da internet, admitiu que o apagão global ocorrido em 18 de novembro de 2025 foi resultado de uma falha interna em sua própria rede e não de um ciberataque. Durante várias horas, milhões de usuários em todo o mundo enfrentaram páginas de erro em vez de acessar os sites que dependem dos serviços de CDN e segurança da empresa.
Em um relatório técnico abrangente, a empresa detalhou o que aconteceu, por que seus mecanismos de proteção falharam e quais medidas serão adotadas para evitar que um incidente semelhante ocorra novamente. O CEO da Cloudflare descreveu o evento como “o pior apagão desde 2019” e considerou o incidente “inaceitável” devido à relevância da empresa no ecossistema da internet.
O problema começou às 11h20 (UTC), quando a rede da Cloudflare começou a retornar massivamente erros HTTP 5xx, um sinal de falha interna. Para os usuários finais, isso se traduziu em páginas de erro ao invés do conteúdo habitual. A análise indicou que a causa foi uma cadeia de eventos desencadeada por uma alteração nas permissões de um dos sistemas de bancos de dados usados para gerenciar bots, o que resultou em um arquivo de configuração muito maior do que o esperado.
Esse arquivo, conhecido como “feature file”, é distribuído a todos os servidores da rede e informa ao sistema de detecção de bots quais características analisar para classificar cada requisição. A duplicação no número de características causou a quebra de um limite interno do software, resultando em um colapso no proxy central da Cloudflare.
Durante os primeiros momentos do incidente, a equipe foi levada a suspeitar de um ataque DDoS devido ao comportamento intermitente do volume de erros, mas acabou identificando que a causa era interna. Uma vez isolado o problema, os engenheiros puderam restaurar os serviços afetados, com o tráfego essencial começando a se recuperar às 14h30 e a normalidade total sendo alcançada apenas às 17h06 (UTC).
A Cloudflare revelou que não apenas o serviço de CDN e segurança foi impactado, mas também outros produtos que dependem da mesma infraestrutura, como Workers KV e Cloudflare Access. O tempo de resposta da rede de distribuição de conteúdos também aumentou drasticamente devido à falha e à sobrecarga dos sistemas de observação e depuração.
O incidente levou a empresa a prometer uma série de melhorias, incluindo endurecimento da ingestão de arquivos de configuração, introdução de “kill switches” globais e uma revisão dos modos de falha dos módulos do proxy central. Embora reconheça a gravidade do apagão, a Cloudflare espera que cada evento desse tipo contribua para o fortalecimento de sua infraestrutura.






