• About
  • Advertise
  • Careers
  • Contact
Domingo, 19 Abril 2026
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

NVIDIA se destaca (com números) na era MoE: Signal65 estima que GB200 NVL72 pode ser até 15× mais rentável por token do que AMD MI355X

por Notícias Tecnologia
10/01/2026
em Tecnologia
0
0
ACÇÕES
6
VISTAS
Share on FacebookShare on Twitter

O debate sobre a infraestrutura de Inteligência Artificial está se alejando da discussão única sobre “desempenho bruto” e começa a focar em um aspecto mais pragmático: o custo para atender cada token. À medida que a demanda por respostas rápidas e uma boa “sensação” de interação cresce, os modelos MoE (Mixture of Experts) colocam a indústria diante de um desafio importante: a comunicação entre nós e a latência interna se tornam quase tão relevantes quanto o poder de cálculo.

Neste contexto, a empresa Signal65 publicou uma análise sobre o que chama de “nova economia da inferência” para MoE, comparando plataformas da NVIDIA e da AMD. O estudo destaca que o custo relativo por token depende do custo da plataforma e da quantidade de tokens por segundo que ela realmente entrega em termos de interatividade. A conclusão é impressionante: em uma configuração voltada para MoE, um rack NVIDIA GB200 NVL72 pode oferecer até 28 vezes mais throughput por GPU em comparação com a AMD MI355X, mantendo um nível alto de interatividade (75 tokens/segundo/usuário), tradando em até 15 vezes mais “performance por dólar”.

Os modelos MoE operam ativando “especialistas” (sub-redes especializadas) de forma dinâmica, oferecendo mais eficiência em relação aos modelos densos, mas também exigindo um grande volume de troca de dados. Quando um MoE é escalado, surgem padrões de comunicação que prejudicam a latência e pressionam a largura de banda. Assim, a NVIDIA foca na ideia de rack-scale, que combina computação e memória de alta velocidade para minimizar esses custos associados ao movimento de dados.

Por sua vez, a AMD expõe sua linha Instinct, centrada em memória e largura de banda, com o MI355X posicionado como um acelerador que oferece 288 GB de HBM3E e até 8 TB/s de largura de banda. Embora AMD tenha um produto competitivo em termos de densidade de memória, o debate gira em torno de quem domina melhor o “tecido conectivo” de seus sistemas.

O relatório da Signal65 utiliza medições de desempenho de terceiros para traçar um panorama claro das diferenças entre as plataformas. Para um objetivo de 25 tokens por segundo por usuário, a análise conclui que a GB200 supera a MI355X em termos de custo e performance. À medida que a interação desejada aumenta para 75 tokens, a disparidade torna-se ainda mais acentuada. No entanto, é importante ressaltar que esses números se baseiam em um cenário específico e devem ser filtrados através de uma análise mais profunda do contexto operacional.

Esses resultados ressaltam que no cenário de MoE, onde a comunicação interna e a latência são cruciais, a arquitetura do sistema completo é um fator determinante para a economia da inferência, mesmo que o concorrente ofereça aceleradores com especificações atraentes. A tendência é que, à medida que o setor avança em direção a experiências cada vez mais interativas, a métrica de tokens por segundo a objetivos de latência específica possa se tornar um indicador-chave de desempenho.

Tags: AMDatéDestacaEraestimaGB200maisMI355XMoENúmerosNVIDIANVL72PodeporrentávelserSignal65token
Notícias Tecnologia

Notícias Tecnologia

Related Posts

ISEG Apresenta Resultados Iniciais do Programa Nacional para Incentivar Meninas nas STEM

por Notícias Tecnologia
19/04/2026
0

No próximo dia 20 de abril, o ISEG – Lisbon School of Economics & Management, em Lisboa, será palco da...

Oracle abre em Casablanca sua primeira região de nuvem pública no norte da África

por Notícias Tecnologia
18/04/2026
0

Oracle expande sua presença na África com nova região de cloud em Casablanca A Oracle anunciou a abertura de uma...

Abertura do Concurso 2026 da Parceria Europeia para Aceleração da Indústria de Chips

por Notícias Tecnologia
18/04/2026
0

A Fundação para a Ciência e a Tecnologia (FCT) anunciou recentemente a abertura do concurso de 2026 da Parceria Europeia...

Recommended

Crise Humanitária dos Refugiados Rohingya e a Situação em Mianmar em Foco na ONU

7 meses atrás
FUCHS España incrementa un 25% su producción para atender nuevos mercados y fortalecer su posición en el sector de la automoción

FUCHS Espanha Aumenta Produção em 25% para Expansão de Mercados e Consolidação no Setor Automotivo

1 ano atrás

Popular News

  • Trecho do Ecocaminho da Maia Fechado por Motivos de Segurança Após Condições Climáticas Adversas

    0 shares
    Share 0 Tweet 0
  • Gesincor Asesores Lança Campanha de Imposto com Economia e Tranquilidade para Contribuintes

    0 shares
    Share 0 Tweet 0
  • Dentistas solicitam ‘ação imediata’ para o Programa de Promoção da Saúde Bucal

    0 shares
    Share 0 Tweet 0
  • UE e Islândia Avançam na Cooperação Marítima em Diálogo de Alto Nível em Reiquiavique

    0 shares
    Share 0 Tweet 0
  • Conflito no Sul do Líbano Resulta em Fatalidade e Vítimas entre Forças de Paz

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal