NVIDIA lança GPU Rubin CPX, uma revolução na inteligência artificial
A inteligência artificial está em constante evolução, e a NVIDIA acaba de dar um importante passo com o lançamento da GPU Rubin CPX. Este novo processador representa não apenas um avanço em relação às gerações anteriores, mas também inaugura uma nova categoria de hardware dentro do ecossistema CUDA: os processadores para inferência de contexto massivo.
De acordo com a NVIDIA, a Rubin CPX permitirá que sistemas de IA trabalhem com janelas de contexto de até um milhão de tokens, algo impensável há apenas dois anos. Essa novidade deverá impactar fortemente áreas em crescimento, como assistentes de programação e geração de vídeos multimodais.
A GPU é descrita pela NVIDIA como a “primeira GPU CUDA projetada para suportar contextos de escala massiva”, onde os modelos podem processar centenas de milhares ou até milhões de unidades de informação de uma só vez. Isso grantirá que copilotos de programação compreendam projetos inteiros, incluindo repositórios completos e históricos de interações, enquanto aplicações de vídeo serão capazes de processar uma hora de conteúdo em um único contexto.
Para isso, a Rubin CPX integra aceleradores de atenção de longo alcance e códecs de vídeo, com um design focado em eficiência energética e alto desempenho. A nova GPU oferece até 30 petaflops em precisão NVFP4 e possui 128 GB de memória GDDR7.
O lançamento não se limita à GPU; a Rubin CPX é parte da plataforma NVIDIA Vera Rubin NVL144 CPX, que combina CPUs e GPUs para alcançar 8 exaflops de IA em um único rack. Esse sistema vem com 100 TB de memória rápida e um desempenho que supera em 7,5 vezes as gerações anteriores.
Durante a apresentação, o CEO da NVIDIA, Jensen Huang, destacou a magnitude dessa inovação. “Assim como a RTX revolucionou os gráficos, a Rubin CPX é a primeira GPU CUDA pensada para a IA contextual massiva”, afirmou.
Além das especificações técnicas, a NVIDIA também enfatiza um aspecto econômico: espera-se que sistemas baseados na Rubin CPX gerem 5 bilhões de dólares em receita por tokens para cada 100 milhões investidos em infraestrutura. Essa métrica sugere um novo paradigma no qual o hardware não apenas potencia a tecnologia, mas também se torna um multiplicador econômico.
Empresas como Cursor e Runway já vislumbram como a Rubin CPX poderá transformar seus produtos, permitindo geração de código ultrarrápida e maior controle na criação de vídeos, respectivamente. Essas capacidades visam não apenas melhorias incrementais, mas uma expansão significativa das possibilidades de uso.
A NVIDIA também lança uma série de ferramentas e softwares para facilitar a adoção da nova GPU, como a plataforma de inferência escalável NVIDIA Dynamo e os modelos multimodais Nemotron™.
A expectativa é que a Rubin CPX esteja disponível até o final de 2026, dando às grandes corporações tempo para se prepararem para esse avanço tecnológico. Este lançamento indica que a fronteira da IA não está mais em aumentar parâmetros, mas sim em expandir a capacidade de entendimento em tempo real.
Com a Rubin CPX, a NVIDIA estabelece um novo padrão na exploração do potencial da IA, posicionando-se na vanguarda da próxima era de aplicações inteligentes.