• About
  • Advertise
  • Careers
  • Contact
Sábado, 18 Abril 2026
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

NVIDIA Rubin: seis chips, um “supercomputador” e a corrida para baratear o token na era da IA de raciocínio

por Notícias Tecnologia
06/01/2026
em Tecnologia
0
0
ACÇÕES
7
VISTAS
Share on FacebookShare on Twitter

A NVIDIA apresentou oficialmente sua nova plataforma de computação para Inteligência Artificial, chamada Rubin, durante o CES em Las Vegas, em homenagem à astrônoma Vera Rubin. A empresa destacou a crescente demanda por capacidade de computação para o treinamento e a inferência de modelos de IA, afirmando que o custo para levar esses modelos a produção está aumentando drasticamente. A solução proposta pela NVIDIA é uma arquitetura integrada, composta por seis novos chips que operam como um único supercomputador de IA.

A plataforma Rubin é baseada em um conceito que a NVIDIA denomina “códiseño extremo”, onde CPU, GPU, rede, segurança, operações e armazenamento são projetados de forma coordenada para evitar os gargalos comuns no sistema. Isso inclui a CPU NVIDIA Vera, a GPU NVIDIA Rubin, o switch NVLink 6, o SuperNIC ConnectX-9, a DPU BlueField-4 e o switch Ethernet Spectrum-6. O foco é reduzir significativamente o tempo de treinamento e custos por token durante a inferência, especialmente com o aumento da complexidade dos modelos.

O CEO da NVIDIA, Jensen Huang, destacou que a platforma Rubin chega “na hora certa”, promovendo uma evolução a cada ano dos supercomputadores de IA e integrando chips para alcançar “a próxima fronteira” do setor. A empresa estipula metas ambiciosas, como reduzir em até 10 vezes o custo por token em inferência em comparação com a geração anterior, Blackwell, e a possibilidade de treinar modelos Mixture-of-Experts (MoE) utilizando quatro vezes menos GPUs.

A NVIDIA apresentou duas configurações principais para a nova plataforma: a NVIDIA Vera Rubin NVL72, uma solução em escala de rack que integra 72 GPUs Rubin e 36 CPUs Vera; e a NVIDIA HGX Rubin NVL8, uma plataforma de servidor orientada para ambientes generativos baseados em x86.

Dentre as inovações que a Rubin traz, destacam-se o NVLink de sexta geração, projetado para oferecer velocidades de comunicação extremamente altas entre as GPUs e um novo sistema de armazenamento chamado Inference Context Memory Storage Platform, que visa melhorar a escalabilidade dos modelos de raciocínio.

A company também enfatizou o papel da rede na arquitetura, introduzindo o Ethernet Spectrum-6, que promete oferecer conectividade mais confiável e eficiente que soluções anteriores.

Os primeiros produtos baseados em Rubin estão previstos para serem disponibilizados na segunda metade de 2026, com grandes provedores de nuvem, como AWS, Google Cloud e Microsoft, já se preparando para incorporá-los em suas ofertas. A NVIDIA busca não apenas revigorar suas ofertas de IA, mas também estabelecer um novo padrão industrial para a computação em nuvem e o desenvolvimento de IA.

Tags: baratearchipsCorridaEraNVIDIApararaciocínioRubinSeisSupercomputadortoken
Notícias Tecnologia

Notícias Tecnologia

Related Posts

Oracle abre em Casablanca sua primeira região de nuvem pública no norte da África

por Notícias Tecnologia
18/04/2026
0

Oracle expande sua presença na África com nova região de cloud em Casablanca A Oracle anunciou a abertura de uma...

Abertura do Concurso 2026 da Parceria Europeia para Aceleração da Indústria de Chips

por Notícias Tecnologia
18/04/2026
0

A Fundação para a Ciência e a Tecnologia (FCT) anunciou recentemente a abertura do concurso de 2026 da Parceria Europeia...

Oracle e AWS estreitam a conexão entre suas nuvens para acelerar a multinuvem

por Notícias Tecnologia
17/04/2026
0

Oracle e Amazon Web Services (AWS) uniram forças para uma nova colaboração que visa ampliar a conectividade multinuvem entre a...

Recommended

Jensen Huang pode receber um bônus de 4 milhões se a Nvidia cumprir metas

1 mês atrás
Silvia Pastor

Guia Essencial para Trabalhar na Alemanha com Vamos Europa: Passos e Dicas Importantes

3 meses atrás

Popular News

  • Oracle abre em Casablanca sua primeira região de nuvem pública no norte da África

    0 shares
    Share 0 Tweet 0
  • Saborido Asesores Reforça seu Compromisso com Empresas Locais Através de um Serviço de Consultoria Integral

    0 shares
    Share 0 Tweet 0
  • Braga Surpreende com Reviravolta Histórica em Sevilha e Atinge as Meias-Finais da Liga Europa

    0 shares
    Share 0 Tweet 0
  • Principais Tendências e Inovações no Comércio Digital

    0 shares
    Share 0 Tweet 0
  • Banco Mundial busca expandir acesso à água potável para 1 bilhão de pessoas

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal