Uma startup de IA aposta em AMD com maior cluster de GPUs
A startup de infraestrutura para inteligência artificial, TensorWave, anunciou o lançamento do maior cluster de treinamento com GPUs AMD na América do Norte, equipada com 8.192 aceleradores Instinct MI325X. Este sistema, que utiliza refrigeração líquida direta ao chip, marca um importante avanço tecnológico e uma forte alternativa ao domínio da NVIDIA no mercado.
Imagens do cluster foram compartilhadas na rede X (anteriormente Twitter), revelando prateleiras de alta densidade com laços de refrigeração em destaque. O sistema já está totalmente operacional, oferecendo capacidade de treinamento em nuvem sob demanda para empresas.
Arquitetura MI325X: desempenho inigualável
O AMD Instinct MI325X, lançado no final de 2024, representa a mais ousada entrada da AMD no mercado de aceleradores de IA até o momento. Cada MI325X possui 256 GB de memória HBM3e e um largura de banda de 6 TB/s, oferecendo até 2,6 PFLOPS de desempenho em FP8. Embora as GPUs da AMD não consigam competir com as opções de escala da NVIDIA, a TensorWave aposta na densidade térmica e eficiência por rack.
Refrigeração líquida: uma solução inovadora
Cada MI325X consome cerca de 1.000 watts, tornando a refrigeração a ar impraticável em larga escala. Para contornar esse desafio, a TensorWave implementou um sistema de refrigeração líquida direta, que permite manter temperaturas ideais sem a necessidade de conectores e ventiladores massivos. Essa abordagem é fundamental para futuros modelos, como o MI350X, que poderá ter um consumo de até 1.400 watts por GPU.
Visão estratégica e apoio ao ecossistema
O lançamento do cluster acontece dois meses após a TensorWave levantar 100 milhões de dólares em uma rodada de investimentos, liderada pela AMD Ventures e o fundo Magnetar Capital. Ao contrário de muitos concorrentes que utilizam hardware da NVIDIA, a TensorWave escolheu a AMD por considerar o ecossistema ROCm (Radeon Open Compute) maduro para aplicações de grande escala.
Embora a NVIDIA ainda domine o mercado com seu ecossistema CUDA, o sucesso inicial da TensorWave representa um passo importante na diversificação das soluções para treinamento de IA em larga escala.
O futuro da Intel: novas tecnologias em vista
A TensorWave também planeja integrar as GPUs MI350X na segunda metade de 2025, que trarão suporte a novas precisões e maiores exigências térmicas. Com mais de 8.000 GPUs da AMD operando em cargas reais, a empresa se posiciona como uma alternativa competitiva à NVIDIA, tanto em custo quanto em eficiência térmica, abrindo caminho para projetos de IA sustentável e escalável.
Com essa nova jornada, a TensorWave busca não apenas inovar, mas também inspirar outras empresas a explorar o potencial do ecossistema AMD na inteligência artificial.