NVIDIA revoluciona o mercado de IA com seu novo sistema GB200 NVL72
A nova geração de inteligência artificial está passando por uma transformação significativa com a introdução da arquitetura Mixture of Experts (MoE), e a NVIDIA se posiciona como líder nesse avanço tecnológico. O novo sistema GB200 NVL72, projetado para a execução de modelos de IA generativa em larga escala, promete um aumento de até 10 vezes no desempenho em inferência em comparação com sua geração anterior, o H200. Com isso, a economia da IA nos grandes centros de dados está mudando radicalmente.
Os modelos tradicionais de IA exigiam cada vez mais capacidade, levando a redes densas com milhões de parâmetros ativados em cada token processado. Contudo, essa abordagem estava se tornando insustentável em termos de custo computacional e energético. A arquitetura MoE, por outro lado, inverte esse paradigma ao organizar a rede em “especialistas” que são ativados de forma dinâmica, dependendo da tarefa a ser realizada. Essa técnica não só reduz o custo por token, como também melhora a eficiência energética.
Entretanto, escalar a implementação do MoE em ambientes de produção apresenta desafios notáveis. Problemas como limitações de memória e a necessidade de comunicação rápida entre as GPUs podem se tornar gargalos significativos. A proposta da NVIDIA, com o GB200 NVL72, é superar esses obstáculos ao conectar 72 GPUs Blackwell em um único domínio de interconexão de alta velocidade. Essa abordagem permite uma comunicação ultrarrápida, reduzindo a pressão sobre a memória de cada GPU e permitindo a ativação eficiente dos especialistas.
Com um desempenho de 1,4 exaflops e 30 TB de memória compartilhada, o GB200 NVL72 está permitindo que modelos de ponta como Kimi K2 Thinking e DeepSeek-R1 atinjam resultados impressionantes. As empresas que utilizam esses sistemas, incluindo provedoras de serviços de IA e grandes multinacionais, já estão percebendo melhorias significativas em throughput, redução de custos e latência.
Além disso, a arquitetura MoE se mostra promissora não apenas para modelos de linguagem, mas também para sistemas multimodais que combinam diferentes tipos de dados, como texto, imagem e áudio. Isso abre a possibilidade de criar “fábricas de IA”, onde um pool de especialistas pode atender simultaneamente a diversas demandas de diferentes aplicações, otimizando a utilização do hardware.
Com o lançamento do GB200 NVL72, a NVIDIA se firma como uma peça central na evolução da inteligência artificial, moldando o futuro da tecnologia de forma mais eficiente e acessível. As organizações que adotarem essas inovações estarão melhor posicionadas para enfrentar os desafios e atender à crescente demanda por serviços baseados em IA.






