Meta apresenta nova infraestrutura de IA: Catalina
A Meta revelou detalhes sobre sua nova arquitetura de hardware para inteligência artificial, chamada de Catalina, durante o Open Compute Project (OCP). Essa nova infraestrutura combina o poder do NVIDIA Blackwell GB200 NVL72, o padrão Open Rack v3 (ORv3) e a refrigeração líquida de alta densidade. Com isso, a empresa reforça sua estratégia de escalabilidade em um mercado dominado por soluções proprietárias, apostando na colaboração aberta e padronizada.
Crescimento Exponencial na IA
Em 2022, a Meta contava com clústeres de cerca de 6.000 GPUs, dedicados principalmente a sistemas de recomendação. Com o avanço da IA generativa e modelos de linguagem, esse número saltou para 16.000-24.000 GPUs em 2023. A previsão para 2024 é que a empresa opere com mais de 100.000 GPUs, um aumento que se deve ao treinamento de modelos complexos como o Llama 3.1, que exigiu um suporte robusto de 16.000 GPUs H100.
O Que É Catalina?
Catalina consiste em um sistema de pods de IA, onde cada pod é formado por dois racks de TI com 72 GPUs. Cada rack é estruturado com 18 bandejas de computação, 9 NVSwitches para interconexão e conexões NVLink que criam um domínio de memória coeso. A integração de refrigeração líquida assistida por ar (ALC) permite o uso dessa tecnologia em centros de dados convencionais.
Open Rack v3 e Estandarização
Catalina é a primeira implementação de alta potência do Open Rack v3 (ORv3), que é crucial para suportar cargas extremas de até 94 kW por rack. A arquitetura modular do ORv3 não apenas permite maior potência, mas também melhora a segurança e reduz o tempo de manutenção.
Refrigeração, Sustentabilidade e Futuro
A Meta implementou um design de refrigeração híbrido com um sistema de gestão monitorado para detecção de vazamentos e com compatibilidade para novas infraestruturas. Embora a Catalina utilize GPUs da NVIDIA, a empresa está ampliando suas plataformas para incluir outros fornecedores, como AMD e Broadcom.
Colaboração Com A Microsoft
A parceria com a Microsoft desde 2018 tem sido fundamental. Juntas, elas têm contribuído para o desenvolvimento de padrões no setor, como o SAI (Switch Abstraction Interface) e o Open Accelerator Module (OAM).
Conclusão
A introdução de Catalina não é apenas um avanço técnico, mas simboliza a filosofia da Meta de que a abertura tecnológica é essencial para democratizar a IA. Com sua estratégia, a empresa visa não apenas ser líder tecnológica, mas também promover um ecossistema colaborativo que redefine a indústria.
A apresentação de Catalina destaca a importância de uma infraestrutura flexível e escalável, que prepara o terreno para futuras inovações em inteligência artificial.