Oracle introduz novas instâncias bare metal na OCI com AMD MI355X
A Oracle anunciou a disponibilização geral de suas novas instâncias bare metal na Oracle Cloud Infrastructure (OCI), agora equipadas com GPUs AMD Instinct™ MI355X. Essa nova geração, que sucedeu a MI300X, apresenta aumento significativo em memória e largura de banda, além de novas precisões FP4/FP6/FP8, tudo isso baseado na arquitetura CDNA 4. De acordo com a empresa, é o primeiro hiperescalador a disponibilizar publicamente as MI355X e o único a oferecer tanto MI355X quanto MI300X em seu portfólio.
Avanços da MI355X em relação à geração anterior
As melhorias proporcionadas pela MI355X incluem:
- Memória e Bandwidth por GPU: 288 GB HBM3e, representando um aumento de 50%, e 8 TB/s de largura de banda, um crescimento de 51%.
- Precisão e Performance: Suporte a FP4/FP6/FP8, gerando aproximadamente 2,5 vezes mais desempenho em FP8/FP16 em comparação com a geração anterior (CDNA 3).
- Recursos de Sistema: Cada servidor conta com CPU EPYC de 5ª geração (128 núcleos), 3 TB DDR5, 2,3 TB HBM3e agregados (8×288 GB) e 61,44 TB de armazenamento local NVMe—um aumento de 100%.
- Rede e Escalabilidade: Redes de 400 Gbps e racks refrigerados a líquido que podem escalar até 64 GPUs por rack.
Recursos da nova instância bare metal
Identificada como BM.GPU.MI355X.8, essa instância é equipada com 8 GPUs AMD Instinct™ MI355X (288 GB por GPU), somando 2,3 TB de HBM3e. A estrutura também inclui uma CPU de 128 núcleos e 61,44 TB de armazenamento. O preço começa em 8,60 dólares por hora, conforme anunciado pela Oracle.
Estrutura de alta performance em nuvem
A OCI Supercluster Zettascale permite a escalabilidade de até 131.072 GPUs, com redes RDMA, prometendo latência ultra-baixa. A Oracle destaca que as MI355X oferecem aproximadamente 3 vezes a capacidade computacional em relação à geração anterior, facilitando a eficiência de projetos de treinamento em larga escala.
Ecossistema aberto e compatibilidade
A plataforma ROCm™ da AMD suporta as novas instâncias, facilitando a integração com frameworks padrão como PyTorch e TensorFlow, além de promover a migração de CUDA para ROCm sem a necessidade de reescritura extensiva.
Casos de sucesso
Empresas como a Absci, atuando no setor biotech, e a Seekr, focada em IA explicável, já utilizam as instâncias em seus processos de treinamento, evidenciando a eficácia da nova tecnologia.
Conclusão
Essas novidades da Oracle não apenas prometem um salto significativo em termos de desempenhos e capacidades, mas também estabelecem um novo padrão no mercado de nuvens, especialmente em um cenário competitivo onde a eficiência e o custo são primordiais. As instâncias já estão disponíveis para solicitação na OCI e a Oracle planeja expandir sua infraestrutura de IA no próximo ano.





