• About
  • Advertise
  • Careers
  • Contact
Sexta-feira, 5 Junho 2026
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

NVIDIA se destaca (com números) na era MoE: Signal65 estima que GB200 NVL72 pode ser até 15× mais rentável por token do que AMD MI355X

por Notícias Tecnologia
10/01/2026
em Tecnologia
0
0
ACÇÕES
6
VISTAS
Share on FacebookShare on Twitter

O debate sobre a infraestrutura de Inteligência Artificial está se alejando da discussão única sobre “desempenho bruto” e começa a focar em um aspecto mais pragmático: o custo para atender cada token. À medida que a demanda por respostas rápidas e uma boa “sensação” de interação cresce, os modelos MoE (Mixture of Experts) colocam a indústria diante de um desafio importante: a comunicação entre nós e a latência interna se tornam quase tão relevantes quanto o poder de cálculo.

Neste contexto, a empresa Signal65 publicou uma análise sobre o que chama de “nova economia da inferência” para MoE, comparando plataformas da NVIDIA e da AMD. O estudo destaca que o custo relativo por token depende do custo da plataforma e da quantidade de tokens por segundo que ela realmente entrega em termos de interatividade. A conclusão é impressionante: em uma configuração voltada para MoE, um rack NVIDIA GB200 NVL72 pode oferecer até 28 vezes mais throughput por GPU em comparação com a AMD MI355X, mantendo um nível alto de interatividade (75 tokens/segundo/usuário), tradando em até 15 vezes mais “performance por dólar”.

Os modelos MoE operam ativando “especialistas” (sub-redes especializadas) de forma dinâmica, oferecendo mais eficiência em relação aos modelos densos, mas também exigindo um grande volume de troca de dados. Quando um MoE é escalado, surgem padrões de comunicação que prejudicam a latência e pressionam a largura de banda. Assim, a NVIDIA foca na ideia de rack-scale, que combina computação e memória de alta velocidade para minimizar esses custos associados ao movimento de dados.

Por sua vez, a AMD expõe sua linha Instinct, centrada em memória e largura de banda, com o MI355X posicionado como um acelerador que oferece 288 GB de HBM3E e até 8 TB/s de largura de banda. Embora AMD tenha um produto competitivo em termos de densidade de memória, o debate gira em torno de quem domina melhor o “tecido conectivo” de seus sistemas.

O relatório da Signal65 utiliza medições de desempenho de terceiros para traçar um panorama claro das diferenças entre as plataformas. Para um objetivo de 25 tokens por segundo por usuário, a análise conclui que a GB200 supera a MI355X em termos de custo e performance. À medida que a interação desejada aumenta para 75 tokens, a disparidade torna-se ainda mais acentuada. No entanto, é importante ressaltar que esses números se baseiam em um cenário específico e devem ser filtrados através de uma análise mais profunda do contexto operacional.

Esses resultados ressaltam que no cenário de MoE, onde a comunicação interna e a latência são cruciais, a arquitetura do sistema completo é um fator determinante para a economia da inferência, mesmo que o concorrente ofereça aceleradores com especificações atraentes. A tendência é que, à medida que o setor avança em direção a experiências cada vez mais interativas, a métrica de tokens por segundo a objetivos de latência específica possa se tornar um indicador-chave de desempenho.

Tags: AMDatéDestacaEraestimaGB200maisMI355XMoENúmerosNVIDIANVL72PodeporrentávelserSignal65token
Notícias Tecnologia

Notícias Tecnologia

Related Posts

FCT e Campus France Anunciam Concurso para Projetos de Mobilidade Bilateral entre Portugal e França – Iniciativa Programa Pessoa 2026

por Notícias Tecnologia
04/06/2026
0

A Fundação para a Ciência e a Tecnologia (FCT) e o Campus France anunciaram o lançamento de mais uma edição...

Telefónica transforma suas antigas centrais de cobre em nós edge para IA, 5G e dados soberanos

por Notícias Tecnologia
03/06/2026
0

Em uma iniciativa inovadora, a Telefónica está transformando uma parte significativa de sua infraestrutura na Espanha através do "Plano Edge"....

Expansão da Avaliação Prévia ERC-PT para o Concurso ERC Plus

por Notícias Tecnologia
02/06/2026
0

O ERC-PT Pre-Assessment, um serviço da Fundação para a Ciência e a Tecnologia (FCT) voltado para apoiar as candidaturas nacionais...

Recommended

Cai em Gran Canária o grupo por trás das filtragens massivas de dados de políticos e jornalistas nas redes sociais

11 meses atrás

Conduzindo a Agricultura Sustentável: Novas Diretrizes para a PAC 2028-2034

1 mês atrás

Popular News

  • Silvia Pastor

    CTX Se Consolida como o Segundo Grande Evento Tecnológico da Espanha com Impacto Econômico de 100 Milhões

    0 shares
    Share 0 Tweet 0
  • Expansão da Infraestrutura 5G: Crescimento de 12,5% em Estações no Primeiro Trimestre

    0 shares
    Share 0 Tweet 0
  • Portugal Brilha na Diplomacia Humanista com Sucesso no Conselho de Segurança

    0 shares
    Share 0 Tweet 0
  • Comissão Apresenta Iniciativa OceanEye para Colocar a UE na Vanguarda da Observação Oceânica

    0 shares
    Share 0 Tweet 0
  • ANACOM Reporta Crescimento de 12,5% nas Estações 5G em Comparação Anual

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal