A sétima geração de aceleradores de inteligência artificial do Google já tem nome e silício: TPU v7 Ironwood. Desenvolvida para competir diretamente com as GPUs Blackwell da NVIDIA em cargas de inferência em larga escala, esta nova família de chips não é apenas um movimento estratégico para o Google Cloud, mas também representa uma oportunidade milionária para a MediaTek, que colaborou no design e agora busca transferir parte desse aprendizado para seu próximo SoC móvel de alta gama, o Dimensity 9600.
Ironwood: a TPU com a qual o Google quer desafiar a NVIDIA
Ironwood é a sétima geração de TPU do Google e foi projetada para o treinamento e a inferência de modelos imponentes, tanto densos quanto Mixture-of-Experts. Cada chip TPU7x integra:
- Dois TensorCores para computação matricial (incluindo FP8) e
- Quatro SparseCores, otimizados para trabalhar com estruturas esparsas, como embeddings, comuns em modelos de linguagem.
- 192 GiB de memória HBM3E por chip, com uma largura de banda próxima a 7,4 TB/s.
A arquitetura adota um design dual-chiplet: cada chip físico é dividido em dois “dispositivos” lógicos, cada um com seu próprio TensorCore, SparseCores e 96 GiB de HBM. As duas metades se comunicam através de uma conexão die-to-die até seis vezes mais rápida que as interconexões tradicionais entre chips (ICI).
Em nível de sistema, o Google escala esses chips em configurações extremas:
- 64 chips formam um “cubo” básico de TPU, interconectados com 1,2 TB/s de largura de banda bidirecional por chip.
- Vários cubos se conectam por meio de uma rede de Optical Circuit Switching (OCS) para criar um superpod de 9.216 chips, com aproximadamente 42,5 exaFLOPS FP8 e 1,77 PB de HBM compartilhada.
Com essas cifras, Ironwood reduz significativamente a lacuna em computação, memória e largura de banda em relação à plataforma GB200/GB300 da NVIDIA, adotando uma abordagem muito agressiva em eficiência energética e custo total de propriedade (TCO) para inferência, o segmento que mais cresce na nuvem.
O papel da MediaTek: do I/O do Ironwood ao design de SoCs móveis
A parte mais interessante dessa história para a indústria móvel está em quem ajudou o Google a desenvolver essa potência. Ao contrário das gerações anteriores, onde a Broadcom foi o parceiro chave de design, vários relatórios indicam que o Google se apoiou na MediaTek para desenhar os módulos de entrada/saída (I/O) do Ironwood, responsáveis pela comunicação do chip com o restante do sistema.
Essa mudança tem várias implicações:
- Mudança de parceiro estratégico: o Google diversifica sua dependência em relação à Broadcom e aposta em um fornecedor com ampla experiência em SoCs para consumo, onde a relação desempenho/consumo é crítica.
- Know-how reutilizável: embora uma TPU de datacenter e um SoC móvel sejam arquiteturas muito distintas, o design de I/O de alta velocidade, a gestão de energia e o empacotamento avançado compartilham problemas semelhantes.
- Impacto econômico direto: estimativas da UBS apontam que a MediaTek pode ter uma receita de cerca de 4 bilhões de dólares devido à sua colaboração com o Google nessa sétima geração de TPUs.
Para a MediaTek, trata-se não apenas de uma nova linha de negócios em IA para datacenters, mas também de um banco de testes de alto nível para melhorar a eficiência de seus futuros chipsets móveis, em um momento em que a empresa apostou em designs muito agressivos em desempenho.
Dimensity 9600: um flagship que precisa de cada miliwatt de eficiência
O Dimensity 9600 será o próximo carro-chefe da MediaTek para smartphones 5G de alta gama. As previsões o colocam em 2026 como um SoC fabricado em um dos nós mais avançados da TSMC, com um desempenho que se situaria entre o Snapdragon 8 Elite Gen 6 “normal” e a versão Pro da Qualcomm.
Paralelamente, a empresa vem de uma estratégia arriscada: com os Dimensity 9300 e 9500, já dispensou os tradicionais núcleos de eficiência, apostando apenas em configurações com núcleos grandes (big cores), o que gerou debates sobre seu consumo real em cenários prolongados de uso.
Nesse contexto, qualquer ganho na gestão de energia é precioso. E é aí que se encaixa o aprendizado no Ironwood:
- Power gating mais agressivo
Desenhar I/O para uma TPU que movimenta terabytes por segundo de HBM força a operação de desativação seletiva de blocos quando não estão em uso. A MediaTek pode aplicar essas técnicas ao Dimensity 9600 para desligar controladores, barramentos e periféricos de forma mais granular, reduzindo o consumo em repouso e em uso leve. - Melhor voltage scaling
Ironwood opera com margens de tensão muito otimizadas para maximizar a eficiência em FP8 e BF16. Ajustar os algoritmos de regulação de voltagem no Dimensity 9600 — por exemplo, através de curvas DVFS mais finas — pode ajudar o SoC a operar pelo máximo tempo possível em pontos “doces” de eficiência. - Refinamento do clock-gating
A experiência em ajustar rotas de clock em uma TPU de alta densidade pode ser reutilizada para reduzir o clock onde não há desempenho visível. Em um SoC móvel sem núcleos de eficiência, a capacidade de “diminuir o ritmo” de blocos inteiros quando não contribuem com valor é fundamental para não sobrecarregar a bateria.
Wccftech e outras fontes ressaltam que a MediaTek não pode transferir diretamente todo o aprendizado do Ironwood para um processador móvel, devido às diferenças entre um ASIC de datacenter e um AP de smartphone. No entanto, a empresa ainda pode ter espaço para melhorias iterativas que podem fazer diferença na autonomia em comparação à Qualcomm e à Apple.
IA na Nuvem e IA no Bolso: dois frentes, uma mesma batalha
A colaboração entre Google e MediaTek também é um indicativo de como está se configurando a cadeia de valor da IA:
- Na nuvem, Ironwood e os TPUs do Google competem para reduzir o custo por token inferido e aumentar o desempenho por watt, buscando erodir o domínio da NVIDIA em hyperscalers.
- Nos dispositivos, os Dimensity e Snapdragon de nova geração competem para executar modelos generativos e assistentes locais com o mínimo impacto possível em bateria e temperatura.
A MediaTek agora atua em ambas as frentes. Seu trabalho nos módulos de I/O do Ironwood a coloca na linha de frente da IA de ultra escala em datacenters, enquanto o Dimensity 9600 será a vitrine do quanto dessa experiência pode ser destilada em um chip que cabe no bolso.
Se o salto de eficiência se materializar, o usuário final não verá “TPU v7” nas especificações do seu celular, mas poderá perceber maior autonomia, menos throttling e capacidades de IA local mais sustentáveis. E, em um mercado onde todos se destacam por TOPS e NPU, talvez a verdadeira vantagem competitiva esteja, mais uma vez, em algo tão antigo quanto a engenharia de eficiência.





