• About
  • Advertise
  • Careers
  • Contact
Quinta-feira, 5 Fevereiro 2026
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

CoreWeave demonstra um salto de 6,5x em desempenho de GPU com NVIDIA GB300 NVL72 em comparação com H100 no modelo de raciocínio DeepSeek R1.

por Notícias Tecnologia
27/08/2025
em Tecnologia
0
0
ACÇÕES
1
VISTAS
Share on FacebookShare on Twitter

A corrida pela inteligência artificial de nova geração não ocorre apenas nos modelos, mas também na infraestrutura que os viabiliza. Com a chegada de modelos de raciocínio — capazes de realizar tarefas complexas em vários passos, analisar dados e atuar como agentes autônomos — o gargalo já não está mais na precisão, mas sim na latência e no desempenho de inferência.

Recentemente, a CoreWeave anunciou suas novas instâncias aceleradas com o NVIDIA GB300 NVL72, baseadas nas GPUs Blackwell Ultra, que alcançaram um desempenho 6,5 vezes superior em inferência sobre o modelo DeepSeek R1 em comparação com um cluster de GPUs H100.

A transição de modelos generativos básicos para modelos de raciocínio, como o DeepSeek R1, marca um salto qualitativo: agora, não é suficiente prever a próxima palavra; processos de “chain-of-thought” que envolvem múltiplas iterações e cálculos mais pesados se tornaram essenciais.

Um dos principais desafios é que esses modelos são extremamente sensíveis à latência. Um atraso na inferência pode torná-los ineficazes em aplicações em tempo real, como copilotagem de programação, agentes financeiros ou assistentes científicos.

A CoreWeave realizou uma comparação entre duas configurações: uma com 16 GPUs NVIDIA H100 em uma configuração de tensor parallelism 16-way (TP16) e outra com apenas 4 GPUs NVIDIA GB300 em uma infraestrutura NVL72, utilizando tensor parallelism 4-way (TP4). O resultado foi impressionante: com apenas um quarto das GPUs, a configuração com GB300 alcançou 6,5 vezes mais tokens por segundo, reduzindo drasticamente a sobrecarga de comunicação entre GPUs.

Para os clientes, isso se traduz em geração de tokens mais rápida, menor latência e um uso mais eficiente de recursos. O salto de desempenho se deve a um redesenho radical da arquitetura, que inclui uma memória imensa de até 37–40 TB, interconexões ultrarrápidas com NVLink, e uma rede otimizada end-to-end com o NVIDIA Quantum-X800 InfiniBand.

Além do hardware, a CoreWeave desenvolveu uma pilha de IA em nuvem para maximizar o potencial do GB300 NVL72, incluindo um Rack LifeCycle Controller, integração com Kubernetes e monitoramento avançado com dashboards do Grafana.

A eficiência alcançada pela CoreWeave não é apenas um marco técnico, mas um verdadeiro mudança de paradigma empresarial. Com isso, as empresas poderão acelerar a inovação, reduzir custos e confiar em uma infraestrutura de nuvem projetada para cargas de IA, com resiliência e confiabilidade.

O NVIDIA GB300 NVL72, implementado em larga escala pela CoreWeave, demonstra que os modelos de raciocínio já são uma realidade operacional. Esta combinação de maior memória, largura de banda extrema e uma nuvem otimizada permitirá a execução de modelos de próxima geração em tempo real, com custos reduzidos e escalabilidade mais eficiente que nunca.

Em um momento em que a indústria avança em direção a modelos de trilhões de parâmetros, este benchmark sugere que o futuro da IA em grande escala passa por arquiteturas como a do GB300 NVL72, onde hardware e software trabalham em perfeita harmonia.

Tags: 65xComparaçãoCoreWeaveDeepSeekdemonstradesempenhoGB300GPUH100ModeloNVIDIANVL72raciocíniosalto
Notícias Tecnologia

Notícias Tecnologia

Related Posts

Moya, G1 e IRON: a corrida pelo robô humanoide “crível” entra em outra tela

por Notícias Tecnologia
05/02/2026
0

A robótica humanoide está vivendo um momento crucial no desenvolvimento de tecnologias que prometem mais interação e funcionalidade em ambientes...

China deixa para trás a “memória barata”: DRAM e NAND se aproximam do preço coreano

por Notícias Tecnologia
05/02/2026
0

Nos últimos meses, o mercado global de memória tem vivenciado mudanças significativas, especialmente com o crescente aumento dos preços da...

Loongson 3B6000: o salto chinês em CPUs de PC existe, mas ainda não derruba a Intel e AMD

por Notícias Tecnologia
04/02/2026
0

Nos últimos anos, a indústria de tecnologia esteve em constante transformação, especialmente no que diz respeito ao desenvolvimento de chips....

Recommended

Elena Digital López

A Protectora do Investidor da BME Recebe Mais de 2.100 Consultas em 2024, Aumento de 6%

11 meses atrás

Exportações em Queda de 2,5% enquanto Importações Registram Aumento de 4,0%

12 meses atrás

Popular News

  • Descubra as belezas de Milão e Cortina d’Ampezzo: um guia para explorar o melhor da Itália

    0 shares
    Share 0 Tweet 0
  • UTAD Reúne Especialistas Internacionais para Discutir o Papel da IA no Ensino das Ciências Agrárias

    0 shares
    Share 0 Tweet 0
  • Moya, G1 e IRON: a corrida pelo robô humanoide “crível” entra em outra tela

    0 shares
    Share 0 Tweet 0
  • UPTEC Lança Plataforma Inovadora para Conectar Novos Empreendedores

    0 shares
    Share 0 Tweet 0
  • China deixa para trás a “memória barata”: DRAM e NAND se aproximam do preço coreano

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal