Google Cloud Lança Ironwood e Novas Instâncias Axion para Impulsionar a Inteligência Artificial
Google Cloud anunciou a chegada de Ironwood, sua sétima geração de TPUs (Tensor Processing Units), junto com novas instâncias Axion baseadas em ARM Neoverse — N4A (em prévia) e C4A metal (bare metal ARM, a ser lançada em breve). Essa iniciativa sinaliza uma mudança na abordagem da Inteligência Artificial, priorizando inferências rápidas e econômicas em detrimento do foco exclusivo no treinamento.
Ironwood foi projetado para atender modelos de última geração, oferecendo latência mínima e elasticidade em data centers, enquanto Axion promete um melhor custo-benefício para operações de computação geral, sustentando aplicações, microserviços e bancos de dados.
Ironwood e a Revolução em Inferências
Desenvolvido com um enfoque em “sistema primeiro”, Ironwood representa a TPU mais eficiente já criada pela Google. A empresa promete um aprimoramento de até 10 vezes no desempenho pico em comparação à TPU v5p. Essa nova geração é crucial para modelos generativos, exigindo melhorias significativas em largura de banda, memória e conectividade entre chips.
Os deployments de Ironwood organizam TPUs em pods interconectados, possibilitando a união de até 9.216 chips em um único domínio com 1,77 PB de memória HBM compartilhada. Os clusters podem crescer ainda mais, conforme a demanda, pela rede Jupiter.
A Google também introduziu conmutação óptica e resfriamento líquido em larga escala para garantir a resiliência e a performance contínua necessária para a operação desses supercomputadores.
Impacto No Mercado
Os primeiros sinais do mercado são promissores. Empresas como Anthropic e Lightricks expressaram interesse em utilizar Ironwood para acelerar o acesso a milhões de usuários e melhorar a qualidade de produtos criativos, respectivamente. A relação custo-desempenho e a capacidade de escalabilidade são aspectos que atraem a atenção de novos clientes.
Axion: Eficácia em Ações Cotidianas
A linha Axion de CPUs ARM Neoverse chega com um objetivo claro: otimizar o “trabalho cotidiano” que alimenta a IA. Com instâncias diferentes que variam em potência e preço, Axion busca atender desde microserviços até simulações complexas, garantindo eficiência em diversos ambientes operacionais.
As primeiras avaliações dos usuários sinalizam uma melhoria significativa em desempenho e custo, destacando a flexibilidade e a eficácia na gestão de recursos.
Conclusão
Com Ironwood e Axion, a Google Cloud posiciona-se como um protagonista em um mercado que não apenas foca na capacidade de treinamento, mas também na qualidade e economia das inferências. À medida que as tecnologias evoluem, a co-desenvolução de hardware e software da Google promete revolucionar operações em IA e estabelecer novos padrões de eficiência no setor.





