• About
  • Advertise
  • Careers
  • Contact
Quinta-feira, 11 Setembro 2025
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

NVIDIA Rubin CPX: a GPU que redefine a inferência de contexto longo na era da IA

por Notícias Tecnologia
11/09/2025
em Tecnologia
0
0
ACÇÕES
0
VISTAS
Share on FacebookShare on Twitter

A inferência como campo de batalha na Inteligência Artificial

A inferência emergiu como o novo campo de batalha na inteligência artificial, com modelos avançando para se tornarem sistemas agênticos que podem raciocinar em múltiplos passos e gerir contextos complexos. Para atender a essa demanda, a NVIDIA introduziu a GPU Rubin CPX, projetada especificamente para acelerar as cargas de trabalho de contexto massivo.

O Desafio da Inferência em Grande Escala

À medida que a IA se torna parte fundamental de várias indústrias, as exigências crescem. Por exemplo, assistentes de programação precisam analisar repositórios completos e suas interdependências. No campo de vídeos, a geração de conteúdos longos requer uma coesão mantida ao longo de horas, representando a necessidade de processar mais de um milhão de tokens.

Essas demandas sobrecarregam as infraestruturas convencionais, apenas aptas para contextos mais curtos, criando desafios em termos de memória, largura de banda e eficiência energética.

Inferência Desagregada: Separar para Otimizar

A NVIDIA propõe uma arquitetura de inferência desagregada, dividindo o processamento em duas fases distintas:

  1. Fase de Contexto: Intensiva em computação, onde grandes volumes de dados são ingeridos.
  2. Fase de Geração: Intensiva em memória, demandando transferências rápidas para a produção de resultados contínuos.

Essa separação permite uma otimização mais eficaz dos recursos, embora introduza complexidades adicionais na coordenação de caches e gerenciamento de memória.

Rubin CPX: Aceleração para Contextos Massivos

A GPU Rubin CPX é uma solução para o gargalo na fase de contexto, oferecendo 30 petaFLOPs de computação, 128 GB de memória GDDR7 e três vezes mais aceleração em mecanismos de atenção em comparação com versões anteriores. Esses atributos a colocam em destaque para aplicações de alto valor, como desenvolvimento de software, geração de vídeos de alta definição e pesquisas em larga escala.

Vera Rubin NVL144 CPX: Potência em Escala ExaFLOP

A Rubin CPX é parte da arquitetura Vera Rubin NVL144 CPX, que agrega 144 GPUs para a fase de contexto e geração, além de 36 CPU, oferecendo uma capacidade impressionante de 8 exaFLOPs. Esta nova plataforma promete revolucionar a maneira como as empresas utilizam IA.

Economia da Inferência: ROI no Centro

Além do desempenho, a NVIDIA aponta um impacto econômico significativo. Com a Rubin CPX, espera-se um retorno sobre o investimento (ROI) de 30 a 50 vezes, gerando até 5 bilhões de dólares em receitas. Essa abordagem sugere uma mudança no foco, valorizando tokens processados de forma rentável.

Casos de Uso Transformadores

Os benefícios da Rubin CPX se refletem em aplicações práticas, desde desenvolvimento de software com compreensão profunda de repositórios a geração de vídeos coesos e pesquisa em tempo real em grandes bases de knowledge.

Ecosistema Preparado

A Rubin CPX se integra perfeitamente ao stack de software da NVIDIA, otimizando inferências de modelos de linguagem e potencializando as capacidades de inteligência artificial.

Disponibilidade

A NVIDIA espera que a Rubin CPX esteja disponível no final de 2026, alinhando-se à crescente demanda por inferência em larga escala.

Conclusão

Com a Rubin CPX, a NVIDIA não apenas apresenta mais uma GPU, mas também uma nova abordagem para a inferência, que redefine os padrões da inteligência artificial, focando na eficiência e viabilidade econômica. A plataforma Vera Rubin NVL144 CPX promete colocar a inferência maciça no centro das discussões tecnológicas e empresariais.

Tags: ContextoCPXEraGPUinferênciaLongoNVIDIAredefineRubin
Notícias Tecnologia

Notícias Tecnologia

Related Posts

Snowflake reforça a colaboração com seus parceiros para impulsionar a era da AI Data Cloud

por Notícias Tecnologia
11/09/2025
0

Snowflake aprimora sua Rede de Parceiros para impulsionar a colaboração e o suporte ao cliente A empresa Snowflake, especializada em...

Cisco apresenta Data Fabric: a aposta para transformar dados de máquina em inteligência pronta para IA

por Notícias Tecnologia
11/09/2025
0

Cisco Lança Cisco Data Fabric para Transformar Dados em Ativos Estratégicos Em um movimento estratégico na era da inteligência artificial,...

O relógio avança: a contagem regressiva para deixar o SAP ECC e dar o salto para o S/4HANA

por Notícias Tecnologia
11/09/2025
0

Em 2027, fim do suporte para SAP ECC apresenta desafios e oportunidades para empresas O fim do suporte oficial para...

Recommended

ParTec processa a NVIDIA na Europa por violação de patentes em supercomputação de inteligência artificial

3 semanas atrás

O Banco Europeu de Investimentos eleva sua capacidade de financiamento para 100.000 milhões em 2025 para reforçar defesa, energia e liderança tecnológica.

3 meses atrás

Popular News

  • NVIDIA Rubin CPX: a GPU que redefine a inferência de contexto longo na era da IA

    0 shares
    Share 0 Tweet 0
  • Últimas Novidades e Recursos Essenciais para o Consumidor

    0 shares
    Share 0 Tweet 0
  • Investindo no Futuro Azul da África: BlueInvest Africa 2025

    0 shares
    Share 0 Tweet 0
  • Snowflake reforça a colaboração com seus parceiros para impulsionar a era da AI Data Cloud

    0 shares
    Share 0 Tweet 0
  • PSD e CDS Rejeitam Proposta do PS para Suspensão do Alojamento Local

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal