Imagem: Cath Virginia / The Verge
A Cloudflare divulgou a causa da interrupção massiva de terça-feira que tirou do ar serviços como o ChatGPT e o X. Diferentemente das suspeitas iniciais de ataque cibernético ou DDoS, a empresa confirmou que o problema foi um bug no banco de dados e não estava relacionado às suas tecnologias de IA generativa (como o “AI Labyrinth”) ou ao DNS. O CTO Matthew Prince explicou que a falha ocorreu no sistema de Bot Management da empresa.
O problema central foi uma mudança em uma consulta no banco de dados ClickHouse, que levou o sistema a gerar um grande número de linhas de “recurso” duplicadas para o arquivo de configuração do modelo de machine learning que pontua as solicitações de bots.
Esse crescimento exponencial do arquivo ultrapassou os limites de memória predefinidos, desativando o sistema de proxy principal que processa o tráfego de clientes que utilizam o módulo de bots.
Para o leitor, a explicação técnica da Cloudflare reforça a fragilidade da infraestrutura da internet, onde uma pequena alteração em uma consulta de banco de dados pode ter efeitos cascata e paralisar uma parte significativa da web, afetando milhões de usuários e serviços vitais.
Quer saber mais detalhes técnicos sobre o “bug” na consulta ClickHouse e quais clientes da Cloudflare não foram afetados pelo problema?
Leia o artigo completo em The Verge e confira a explicação completa da empresa!








