O avanço implacável da inteligência artificial (IA) e o desenvolvimento de novas gerações de memória HBM (High Bandwidth Memory) estão levando ao limite o consumo energético das GPUs aceleradoras para IA. Um relatório conjunto do Instituto Avançado de Ciência e Tecnologia da Coreia (KAIST) e do laboratório TERA antecipa uma escalada sem precedentes nas necessidades energéticas dos sistemas de computação de alto desempenho.
Memória ultrarrápida e de grande capacidade
Atualmente, a tecnologia HBM3E permite que aceleradoras como a NVIDIA B300 e a AMD MI350 alcancem capacidades de até 288 GB de memória de alto desempenho. Entretanto, a próxima geração, HBM4, aumentará este limite para 384 GB no caso da NVIDIA (série Rubin) e 432 GB na AMD (série MI400), com lançamentos previstos para o próximo ano. No entanto, as verdadeiras inovações virão com HBM5, HBM6 e HBM7, que poderão atingir capacidades máximas astronômicas: HBM5 com 500 GB, HBM6 entre 1,5 e 1,9 TB, e HBM7 com até 6 TB por aceleradora, impulsionando aplicações de IA generativa, big data e simulação científica.
Aumentos significativos no consumo energético
O relatório detalha o aumento dramático no consumo energético das GPUs para IA. Por exemplo, a futura GPU NVIDIA Rubin — prevista para 2026 — terá um consumo de chip de 800 W, enquanto a versão completa, com HBM4 e chip duplo, poderá alcançar até 2.200 W. Atualmente, as AMD MI350 já estão na casa dos 1.400 W em sistemas de refrigeração líquida.
A médio prazo, a GPU NVIDIA Feynman (prevista para 2029) pode escalar até 900 W no núcleo e 4.400 W para a placa completa, utilizando quatro chips e HBM5 para fornecer um bandwith de 48 TB/s. Projeções para 2032 indicam que uma aceleradora baseada em 4 chips com HBM6 pode chegar a 6.000 W, enquanto uma hipotética placa de 8 chips, com 32 módulos de HBM7 e mais de 1 TB/s de largura de banda, poderia superar os 15.000 W em 2035.
Desafios para os centros de dados
O crescimento exponencial do consumo energético das GPUs para IA representa um desafio significativo para os centros de dados, que podem precisar de infraestruturas energéticas próprias, como usinas nucleares ou fontes renováveis dedicadas. O consumo de uma única placa de 15.000 W é equivalente ao de uma residência média por vários dias.
Especialistas alertam que, caso essa tendência não seja moderada por meio de inovações em eficiência e arquitetura, o modelo de crescimento atual poderá ser insustentável, tanto do ponto de vista ambiental quanto econômico.
O futuro é viável?
O relatório conclui com uma reflexão preocupante: “Se a evolução tecnológica continuar nesse caminho, cada centro de dados precisará de sua própria central elétrica”. A indústria enfrenta o desafio de equilibrar a potência exigida pela IA com a eficiência energética e a sustentabilidade, elementos cruciais para o futuro digital.