Google Lança Nova Geração de TPUs na Conferência Hot Chips
Durante a conferência Hot Chips, a Google surpreendeu os participantes ao anunciar o Ironwood, a nova geração de suas Unidades de Processamento Tensorial (TPUs). Esse novo chip foi projetado especificamente para inferência de modelos de linguagem e raciocínio em grande escala, representando uma mudança significativa em relação às gerações anteriores, que se concentravam mais no treinamento.
O Ironwood se destaca pela sua capacidade de escalar até 9.216 chips em um único nó, o que permite atingir um desempenho impressionante de 42,5 exaflops (FP8). Ele também conta com 1,77 PB de memória HBM3e que pode ser acessada diretamente e é compartilhada através de switches de circuito óptico (OCS), duplicando a escala em comparação com a TPUv4.
Eficácia e Confiabilidade
A eficiência elétrica é uma prioridade, com a Google afirmando que o Ironwood oferece o dobro do desempenho por watt em relação ao Trillium e até seis vezes mais eficiência em relação à TPUv4. Isso é possível graças a uma arquitetura multi-chiplet, que inclui oito pilhas de HBM3e por chip e um sistema de refrigeração líquido de terceira geração. A confiabilidade do sistema também foi levada em conta, incorporando recursos como checkpointing automático e detecção de corrupção silenciosa de dados.
Integração com Inteligência Artificial
O design do chip foi otimizado com IA, destacando uma tendência de usar inteligência artificial não apenas para executar carga de trabalho, mas também para projetar o hardware que sustentará a próxima era de modelos de IA. Com a 4ª geração de SparseCore, o Ironwood traz melhorias significativas nas operações de embeddings e operações coletivas.
Exclusividade no Google Cloud
O novo chip será exclusivo do Google Cloud, integrado em sua oferta de Cloud TPU, e não estará disponível como hardware independente. Para os clientes, o Ironwood promete inferência em tempo real de modelos de raciocínio, além de maior estabilidade e eficiência em larga escala.
Com o Ironwood, a Google busca consolidar sua liderança em hardware de IA, especialmente em um mercado onde concorrentes como a NVIDIA estão cada vez mais presentes. Esta nova geração de TPUs representa um passo importante para a empresa na era dos modelos de bilhões de parâmetros, que são essenciais para a inteligência artificial confiável e eficiente.