• About
  • Advertise
  • Careers
  • Contact
Quinta-feira, 25 Junho 2026
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

NVIDIA Groq 3 LPX: o novo motor para inferência de baixa latência

por Notícias Tecnologia
22/03/2026
em Tecnologia
0
0
ACÇÕES
6
VISTAS
Share on FacebookShare on Twitter

A Nvidia apresenta novo acelerador para reduzir latência em inferência de IA

A luta pelo avanço da inteligência artificial (IA) não se resume mais apenas ao treinamento de modelos maiores. Conforme a demanda cresce, a inferência se destaca como um dos maiores desafios, lidando com a latência e a velocidade de resposta em sistemas interativos. Nesse cenário, a Nvidia revelou o Groq 3 LPX, um novo acelerador rack-scale projetado especialmente para cargas de inferência com baixa latência na plataforma Vera Rubin.

Segundo a empresa, o Groq 3 LPX funciona como um complemento à Vera Rubin NVL72, em vez de substituí-la. As GPUs da linha Rubin continuarão a desempenhar um papel crucial no treinamento e em tarefas que exigem alto rendimento, enquanto o LPX focará em debugar operações onde cada milissegundo conta, como assistentes de código e sistemas multiagentes.

Os números apresentados pela Nvidia impressionam: o sistema, que pode ser montado com 256 Groq 3 LPU, oferece 315 PFLOPS de inferência FP8, totalizando 128 GB de SRAM e uma largura de banda de até 40 PB/s. Além disso, o LPX é descrito como o “sétimo chip” da arquitetura Vera Rubin, enfatizando que se trata de uma nova classe de processador, distinta das GPUs tradicionais.

A novidade se destaca não apenas pela capacidade de processamento, mas pela abordagem estratégica para resolver a bifurcação nas cargas de trabalho da inferência. A Nvidia reconhece que existem dois mundos: um focado na maximização de throughput, e outro onde a latência é crucial. Isso requer um equilíbrio delicado entre hardware projetado para processamento em massa e aquele otimizado para respostas rápidas.

O Groq 3 LPX adota uma arquitetura heterogênea que combina a robustez das GPUs com a necessidade de um tempo de resposta mais previsível. O design prioriza a execução determinista e a movimentação eficiente de dados, permitindo que o sistema minimize o jitter e mantenha a estabilidade dos tempos de resposta, um aspecto crucial em aplicações de IA interativa.

A Nvidia também interliga seu novo produto a uma mudança significativa na economia da IA. À medida que a demanda por interações mais rápidas e dinâmicas aumenta, a empresa acredita que o fluxo convencional de chat por turnos está se transformando em colaborações contínuas, exigindo não apenas mais requisições, mas também uma agilidade maior nas respostas.

Utilizando o software de orquestração Dynamo, a Nvidia promete que o Groq 3 LPX será fundamental na filtragem e encaminhamento de requisições, ajudando a manter a latência sob controle durante momentos de alta demanda. Além disso, o modelo será especialmente adequado para processos de decodificação especulativa.

Embora a empresa apresente números promissores, como a promessa de até 35 vezes mais throughput por megavatio, esses dados ainda precisam de validação prática quando a nova arquitetura for implementada em cenários reais.

Em suma, o lançamento do Groq 3 LPX sinaliza a intenção da Nvidia de avançar na criação de uma infraestrutura de IA que combine throughput, latência e rentabilidade, demonstrando que a evolução da IA agêntica não diz respeito apenas aos modelos, mas também a uma nova camada de hardware especializado.

Tags: BaixaGroqinferêncialatênciaLPXmotorNovoNVIDIApara
Notícias Tecnologia

Notícias Tecnologia

Related Posts

Financiamento ERC Advanced Grant alcança 16 projetos inovadores em Portugal

por Notícias Tecnologia
24/06/2026
0

O Conselho Europeu de Investigação (ERC) divulgou, no dia 23 de junho, a seleção de 319 projetos no concurso ERC...

Sarenet inaugura seu novo data center no hub de comunicação de Derio

por Notícias Tecnologia
22/06/2026
0

Sarenet, operador especializado em serviços de voz, dados e hospedagem para empresas, inaugurou seu novo centro de dados no Hub...

FCT e DAAD Anunciam Concurso de Mobilidade Bilateral 2026 entre Portugal e Alemanha

por Notícias Tecnologia
22/06/2026
0

A Fundação para a Ciência e a Tecnologia (FCT) e o Serviço Alemão de Intercâmbio Académico (DAAD) anunciaram uma nova...

Recommended

FAO Celebra 80 Anos e Convoca a Sociedade Global a Combater a Fome

8 meses atrás

O primeiro mochileiro da China e seu legado viajante

4 semanas atrás

Popular News

  • Silvia Pastor

    Convocação do REDI Une Mais de 200 Profissionais na Celebração do Orgulho Corporativo em Barcelona

    0 shares
    Share 0 Tweet 0
  • Principais Temas em Defesa do Consumidor

    0 shares
    Share 0 Tweet 0
  • ONU Reafirma Compromisso Global no Combate ao HIV em Encontro Internacional

    0 shares
    Share 0 Tweet 0
  • Comissão Europeia celebra medidas da NEAFC sobre o cavala e lamenta o aumento adicional da quota pela Rússia em 2026

    0 shares
    Share 0 Tweet 0
  • Microbiota Materna: Revelando a Saúde de Mães e Recém-Nascidos

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal