A AMD apresentou novos resultados de desempenho em inteligência artificial que destacam suas placas gráficas profissionais RDNA 3 de 48 GB, posicionando-as à frente da RTX 4090 da Nvidia. Segundo testes conduzidos com o software DeepSeek R1, a Radeon Pro W7900 e a Radeon Pro W7800, ambas com 48 GB de VRAM, demonstraram um desempenho até 7,3 vezes superior ao da RTX 4090 em determinados cenários de inferência de modelos de linguagem.
David McAfee, vice-presidente e gerente geral das CPUs Ryzen e da Radeon Graphics na AMD, compartilhou em sua conta no X (anteriormente Twitter) uma série de testes realizados com as versões LM Studio 0.3.12 e Llama.cpp runtime 1.18, comparando o desempenho das GPUs em quatro configurações distintas. Os resultados mostraram que, em tarefas como Distill Qwen 32B 8-bit, as GPUs da AMD apresentaram desempenhos significativos superiores, registrando até 19,8 tokens por segundo nas variantes da Radeon Pro W7900.
Os dados revelaram que as GPUs RDNA 3 de 48 GB são:
– 7,3 vezes mais rápidas no Distill Qwen 32B 8-bit.
– 6,5 vezes mais rápidas em outra variante do Distill Qwen 32B 8-bit.
– 5,5 vezes mais rápidas no Distill Llama 70B 4-bit.
– 5,2 vezes mais rápidas em outra variante do Distill Llama 70B 4-bit.
Um dos fatores que contribui para este desempenho é a quantidade de VRAM disponível. Na inferência com modelos de linguagem extensos (LLM), os parâmetros são armazenados diretamente na memória da GPU, permitindo que as placas da AMD lidem com modelos maiores do DeepSeek R1 sem a necessidade de dividir a carga entre várias GPUs.
Entretanto, esse desempenho elevado tem um custo. A Radeon Pro W7900 de 48 GB é vendida por 3.500 dólares, 1.500 dólares acima do preço base da RTX 5090 (2.000 dólares) e 2.000 dólares mais do que a RTX 4090 (1.500 dólares em seu lançamento). Apesar disso, a proposta da AMD continua sendo mais acessível em comparação à RTX A6000 Ada de 48 GB, que é a opção mais próxima da Nvidia em termos de capacidade de VRAM.
Com esses resultados, a AMD se posiciona como uma concorrente forte para tarefas de inteligência artificial. No entanto, a empresa tem evitado comparar suas GPUs com a mais recente RTX 5090, o modelo topo de linha da Nvidia. Em ocasiões passadas, quando a AMD divulgou benchmarks semelhantes da RX 7900 XTX, a Nvidia se apressou em apresentar dados que mostravam sua GPU superando a da AMD em testes semelhantes.
Espera-se que a Nvidia responda com novos benchmarks para provar o desempenho de seus modelos mais recentes, especialmente considerando que a RTX 5090 possui apenas 32 GB de GDDR7 em comparação aos 48 GB das placas da AMD. O cenário das GPUs para inteligência artificial continua a evoluir, e embora a AMD mostre vantagens em VRAM e desempenho em certos testes, a batalha pela supremacia em IA entre a Nvidia e a AMD ainda está longe de ser decidida.