A NVIDIA apresentou oficialmente sua nova plataforma de computação para Inteligência Artificial, chamada Rubin, durante o CES em Las Vegas, em homenagem à astrônoma Vera Rubin. A empresa destacou a crescente demanda por capacidade de computação para o treinamento e a inferência de modelos de IA, afirmando que o custo para levar esses modelos a produção está aumentando drasticamente. A solução proposta pela NVIDIA é uma arquitetura integrada, composta por seis novos chips que operam como um único supercomputador de IA.
A plataforma Rubin é baseada em um conceito que a NVIDIA denomina “códiseño extremo”, onde CPU, GPU, rede, segurança, operações e armazenamento são projetados de forma coordenada para evitar os gargalos comuns no sistema. Isso inclui a CPU NVIDIA Vera, a GPU NVIDIA Rubin, o switch NVLink 6, o SuperNIC ConnectX-9, a DPU BlueField-4 e o switch Ethernet Spectrum-6. O foco é reduzir significativamente o tempo de treinamento e custos por token durante a inferência, especialmente com o aumento da complexidade dos modelos.
O CEO da NVIDIA, Jensen Huang, destacou que a platforma Rubin chega “na hora certa”, promovendo uma evolução a cada ano dos supercomputadores de IA e integrando chips para alcançar “a próxima fronteira” do setor. A empresa estipula metas ambiciosas, como reduzir em até 10 vezes o custo por token em inferência em comparação com a geração anterior, Blackwell, e a possibilidade de treinar modelos Mixture-of-Experts (MoE) utilizando quatro vezes menos GPUs.
A NVIDIA apresentou duas configurações principais para a nova plataforma: a NVIDIA Vera Rubin NVL72, uma solução em escala de rack que integra 72 GPUs Rubin e 36 CPUs Vera; e a NVIDIA HGX Rubin NVL8, uma plataforma de servidor orientada para ambientes generativos baseados em x86.
Dentre as inovações que a Rubin traz, destacam-se o NVLink de sexta geração, projetado para oferecer velocidades de comunicação extremamente altas entre as GPUs e um novo sistema de armazenamento chamado Inference Context Memory Storage Platform, que visa melhorar a escalabilidade dos modelos de raciocínio.
A company também enfatizou o papel da rede na arquitetura, introduzindo o Ethernet Spectrum-6, que promete oferecer conectividade mais confiável e eficiente que soluções anteriores.
Os primeiros produtos baseados em Rubin estão previstos para serem disponibilizados na segunda metade de 2026, com grandes provedores de nuvem, como AWS, Google Cloud e Microsoft, já se preparando para incorporá-los em suas ofertas. A NVIDIA busca não apenas revigorar suas ofertas de IA, mas também estabelecer um novo padrão industrial para a computação em nuvem e o desenvolvimento de IA.






