• About
  • Advertise
  • Careers
  • Contact
Quinta-feira, 25 Junho 2026
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

NVIDIA Rubin CPX: a GPU que redefine a inferência de contexto longo na era da IA

por Notícias Tecnologia
11/09/2025
em Tecnologia
0
0
ACÇÕES
3
VISTAS
Share on FacebookShare on Twitter

A inferência como campo de batalha na Inteligência Artificial

A inferência emergiu como o novo campo de batalha na inteligência artificial, com modelos avançando para se tornarem sistemas agênticos que podem raciocinar em múltiplos passos e gerir contextos complexos. Para atender a essa demanda, a NVIDIA introduziu a GPU Rubin CPX, projetada especificamente para acelerar as cargas de trabalho de contexto massivo.

O Desafio da Inferência em Grande Escala

À medida que a IA se torna parte fundamental de várias indústrias, as exigências crescem. Por exemplo, assistentes de programação precisam analisar repositórios completos e suas interdependências. No campo de vídeos, a geração de conteúdos longos requer uma coesão mantida ao longo de horas, representando a necessidade de processar mais de um milhão de tokens.

Essas demandas sobrecarregam as infraestruturas convencionais, apenas aptas para contextos mais curtos, criando desafios em termos de memória, largura de banda e eficiência energética.

Inferência Desagregada: Separar para Otimizar

A NVIDIA propõe uma arquitetura de inferência desagregada, dividindo o processamento em duas fases distintas:

  1. Fase de Contexto: Intensiva em computação, onde grandes volumes de dados são ingeridos.
  2. Fase de Geração: Intensiva em memória, demandando transferências rápidas para a produção de resultados contínuos.

Essa separação permite uma otimização mais eficaz dos recursos, embora introduza complexidades adicionais na coordenação de caches e gerenciamento de memória.

Rubin CPX: Aceleração para Contextos Massivos

A GPU Rubin CPX é uma solução para o gargalo na fase de contexto, oferecendo 30 petaFLOPs de computação, 128 GB de memória GDDR7 e três vezes mais aceleração em mecanismos de atenção em comparação com versões anteriores. Esses atributos a colocam em destaque para aplicações de alto valor, como desenvolvimento de software, geração de vídeos de alta definição e pesquisas em larga escala.

Vera Rubin NVL144 CPX: Potência em Escala ExaFLOP

A Rubin CPX é parte da arquitetura Vera Rubin NVL144 CPX, que agrega 144 GPUs para a fase de contexto e geração, além de 36 CPU, oferecendo uma capacidade impressionante de 8 exaFLOPs. Esta nova plataforma promete revolucionar a maneira como as empresas utilizam IA.

Economia da Inferência: ROI no Centro

Além do desempenho, a NVIDIA aponta um impacto econômico significativo. Com a Rubin CPX, espera-se um retorno sobre o investimento (ROI) de 30 a 50 vezes, gerando até 5 bilhões de dólares em receitas. Essa abordagem sugere uma mudança no foco, valorizando tokens processados de forma rentável.

Casos de Uso Transformadores

Os benefícios da Rubin CPX se refletem em aplicações práticas, desde desenvolvimento de software com compreensão profunda de repositórios a geração de vídeos coesos e pesquisa em tempo real em grandes bases de knowledge.

Ecosistema Preparado

A Rubin CPX se integra perfeitamente ao stack de software da NVIDIA, otimizando inferências de modelos de linguagem e potencializando as capacidades de inteligência artificial.

Disponibilidade

A NVIDIA espera que a Rubin CPX esteja disponível no final de 2026, alinhando-se à crescente demanda por inferência em larga escala.

Conclusão

Com a Rubin CPX, a NVIDIA não apenas apresenta mais uma GPU, mas também uma nova abordagem para a inferência, que redefine os padrões da inteligência artificial, focando na eficiência e viabilidade econômica. A plataforma Vera Rubin NVL144 CPX promete colocar a inferência maciça no centro das discussões tecnológicas e empresariais.

Tags: ContextoCPXEraGPUinferênciaLongoNVIDIAredefineRubin
Notícias Tecnologia

Notícias Tecnologia

Related Posts

Financiamento ERC Advanced Grant alcança 16 projetos inovadores em Portugal

por Notícias Tecnologia
24/06/2026
0

O Conselho Europeu de Investigação (ERC) divulgou, no dia 23 de junho, a seleção de 319 projetos no concurso ERC...

Sarenet inaugura seu novo data center no hub de comunicação de Derio

por Notícias Tecnologia
22/06/2026
0

Sarenet, operador especializado em serviços de voz, dados e hospedagem para empresas, inaugurou seu novo centro de dados no Hub...

FCT e DAAD Anunciam Concurso de Mobilidade Bilateral 2026 entre Portugal e Alemanha

por Notícias Tecnologia
22/06/2026
0

A Fundação para a Ciência e a Tecnologia (FCT) e o Serviço Alemão de Intercâmbio Académico (DAAD) anunciaram uma nova...

Recommended

Setor Imobiliário Celebra Nova Redução do IVA na Construção

4 meses atrás

Iberia impulsiona sua transformação digital com a AWS, mas a que preço para a soberania tecnológica europeia?

1 ano atrás

Popular News

  • Assembleia Geral da EJTN: Encontro em Limassol, Chipre, Junho de 2026

    0 shares
    Share 0 Tweet 0
  • UTAD Fortalece Colaboração Acadêmica com a Universidade da Cidade de Macau

    0 shares
    Share 0 Tweet 0
  • Claro! Aquí tienes un título en portugués sobre el IPMA:“IPMA: Previsões Meteorológicas e Alertas Climáticos para a Próxima Semana”

    0 shares
    Share 0 Tweet 0
  • Convocação do REDI Une Mais de 200 Profissionais na Celebração do Orgulho Corporativo em Barcelona

    0 shares
    Share 0 Tweet 0
  • Principais Temas em Defesa do Consumidor

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal