• About
  • Advertise
  • Careers
  • Contact
Sexta-feira, 5 Junho 2026
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

NVIDIA Rubin: seis chips, um “supercomputador” e a corrida para baratear o token na era da IA de raciocínio

por Notícias Tecnologia
06/01/2026
em Tecnologia
0
0
ACÇÕES
7
VISTAS
Share on FacebookShare on Twitter

A NVIDIA apresentou oficialmente sua nova plataforma de computação para Inteligência Artificial, chamada Rubin, durante o CES em Las Vegas, em homenagem à astrônoma Vera Rubin. A empresa destacou a crescente demanda por capacidade de computação para o treinamento e a inferência de modelos de IA, afirmando que o custo para levar esses modelos a produção está aumentando drasticamente. A solução proposta pela NVIDIA é uma arquitetura integrada, composta por seis novos chips que operam como um único supercomputador de IA.

A plataforma Rubin é baseada em um conceito que a NVIDIA denomina “códiseño extremo”, onde CPU, GPU, rede, segurança, operações e armazenamento são projetados de forma coordenada para evitar os gargalos comuns no sistema. Isso inclui a CPU NVIDIA Vera, a GPU NVIDIA Rubin, o switch NVLink 6, o SuperNIC ConnectX-9, a DPU BlueField-4 e o switch Ethernet Spectrum-6. O foco é reduzir significativamente o tempo de treinamento e custos por token durante a inferência, especialmente com o aumento da complexidade dos modelos.

O CEO da NVIDIA, Jensen Huang, destacou que a platforma Rubin chega “na hora certa”, promovendo uma evolução a cada ano dos supercomputadores de IA e integrando chips para alcançar “a próxima fronteira” do setor. A empresa estipula metas ambiciosas, como reduzir em até 10 vezes o custo por token em inferência em comparação com a geração anterior, Blackwell, e a possibilidade de treinar modelos Mixture-of-Experts (MoE) utilizando quatro vezes menos GPUs.

A NVIDIA apresentou duas configurações principais para a nova plataforma: a NVIDIA Vera Rubin NVL72, uma solução em escala de rack que integra 72 GPUs Rubin e 36 CPUs Vera; e a NVIDIA HGX Rubin NVL8, uma plataforma de servidor orientada para ambientes generativos baseados em x86.

Dentre as inovações que a Rubin traz, destacam-se o NVLink de sexta geração, projetado para oferecer velocidades de comunicação extremamente altas entre as GPUs e um novo sistema de armazenamento chamado Inference Context Memory Storage Platform, que visa melhorar a escalabilidade dos modelos de raciocínio.

A company também enfatizou o papel da rede na arquitetura, introduzindo o Ethernet Spectrum-6, que promete oferecer conectividade mais confiável e eficiente que soluções anteriores.

Os primeiros produtos baseados em Rubin estão previstos para serem disponibilizados na segunda metade de 2026, com grandes provedores de nuvem, como AWS, Google Cloud e Microsoft, já se preparando para incorporá-los em suas ofertas. A NVIDIA busca não apenas revigorar suas ofertas de IA, mas também estabelecer um novo padrão industrial para a computação em nuvem e o desenvolvimento de IA.

Tags: baratearchipsCorridaEraNVIDIApararaciocínioRubinSeisSupercomputadortoken
Notícias Tecnologia

Notícias Tecnologia

Related Posts

FCT e Campus France Anunciam Concurso para Projetos de Mobilidade Bilateral entre Portugal e França – Iniciativa Programa Pessoa 2026

por Notícias Tecnologia
04/06/2026
0

A Fundação para a Ciência e a Tecnologia (FCT) e o Campus France anunciaram o lançamento de mais uma edição...

Telefónica transforma suas antigas centrais de cobre em nós edge para IA, 5G e dados soberanos

por Notícias Tecnologia
03/06/2026
0

Em uma iniciativa inovadora, a Telefónica está transformando uma parte significativa de sua infraestrutura na Espanha através do "Plano Edge"....

Expansão da Avaliação Prévia ERC-PT para o Concurso ERC Plus

por Notícias Tecnologia
02/06/2026
0

O ERC-PT Pre-Assessment, um serviço da Fundação para a Ciência e a Tecnologia (FCT) voltado para apoiar as candidaturas nacionais...

Recommended

Cai em Gran Canária o grupo por trás das filtragens massivas de dados de políticos e jornalistas nas redes sociais

11 meses atrás

Conduzindo a Agricultura Sustentável: Novas Diretrizes para a PAC 2028-2034

1 mês atrás

Popular News

  • Silvia Pastor

    CTX Se Consolida como o Segundo Grande Evento Tecnológico da Espanha com Impacto Econômico de 100 Milhões

    0 shares
    Share 0 Tweet 0
  • Expansão da Infraestrutura 5G: Crescimento de 12,5% em Estações no Primeiro Trimestre

    0 shares
    Share 0 Tweet 0
  • Portugal Brilha na Diplomacia Humanista com Sucesso no Conselho de Segurança

    0 shares
    Share 0 Tweet 0
  • Comissão Apresenta Iniciativa OceanEye para Colocar a UE na Vanguarda da Observação Oceânica

    0 shares
    Share 0 Tweet 0
  • ANACOM Reporta Crescimento de 12,5% nas Estações 5G em Comparação Anual

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal