Apple Implementa RDMA sobre Thunderbolt 5 em macOS 26.2, Prometendo Potencial para IA
Apple anunciou uma inovação significativa ao ativar o Remote Direct Memory Access (RDMA) sobre Thunderbolt 5 em seu sistema operacional macOS 26.2. Tradicionalmente associado a supercomputação e data centers, o RDMA permite a transferência direta de dados entre memórias de diferentes máquinas, minimizando a sobrecarga e a latência, o que pode ser um divisor de águas em ambientes de computação de alto desempenho (HPC).
A empresa descreve a nova funcionalidade como ideal para casos de uso como a inferência distribuída de inteligência artificial. A promessa é atraente: conectar múltiplos Macs via Thunderbolt 5, reduzindo a latência de comunicação quando comparado aos métodos tradicionais baseados em TCP/IP. No entanto, as experiências iniciais dos usuários indicam que, apesar do potencial, existem desafios a serem superados para que a tecnologia funcione de forma ideal.
O RDMA permite que dois computadores troquem dados sem a necessidade de a CPU copiar constantemente buffers, reduzindo a latência e liberando ciclos de CPU para tarefas úteis. A Apple escolheu o Thunderbolt 5, uma interface projetada para altas taxas de transferência, como meio físico para viabilizar essa tecnologia, oferecendo um aumento de largura de banda de até 80 Gb/s em comparação com o Thunderbolt 4.
Um dos aspectos técnicos intrigantes é que o framework de machine learning da Apple, conhecido como MLX, já inclui um backend de comunicação chamado JACCL, que utiliza RDMA sobre Thunderbolt. Segundo a documentação, esse backend oferece latências significativamente menores do que alternativas convencionais, sinalizando que a Apple não está implementando o RDMA apenas como uma curiosidade, mas como um passo estratégico para tornar a computação distribuída em Macs mais viável.
No entanto, a ativação do RDMA não é um processo simples. Atualmente, necessário entrar em modo de recuperação do macOS e executar um comando no Terminal. Além disso, a topologia de rede exigida pelo JACCL é bastante restrita. Ele necessita de uma malha totalmente conectada, o que implica que cada par de nós deve ser conectado diretamente por um cabo Thunderbolt, um requisito que se torna impraticável à medida que o número de nós aumenta.
Organizar macs em tal topologia pode levar a um aumento exponencial no cabeamento necessário, dificultando a escalabilidade. Além disso, a escassez de equipamentos como switches Thunderbolt 5 adequados torna essa implementação ainda mais complicada.
A limitação de portas nos Macs também é um fator a ser considerado. A configuração com chips M4 Max e M3 Ultra oferece diferentes quantidades de portas Thunderbolt 5, influenciando diretamente o número de nós que podem ser conectados em uma malha completa. Usuários relataram que em configurações com M4 Max, é difícil ultrapassar cinco nós sem complicações.
Além disso, os testes iniciais indicam alguns problemas, como sobrecarga de CPU e rede quando o sistema opera em modos ineficientes de reencaminhamento. A documentação da Apple aconselha a desativar o Thunderbolt Bridge e a manter as redes isoladas para evitar problemas de desempenho.
Os desenvolvedores estão começando a documentar suas experiências, mas muitos relatam dificuldades com a escassa documentação oficial e a falta de respostas claras. Nesse sentido, projetos comunitários como o Exo têm sido utilizados para testar e otimizar a implementação dos clusters de Macs com RDMA.
Para aqueles que desejam explorar essa nova capacidade sem riscos, recomenda-se que separem ambientes de laboratório e produção, planejem cuidadosamente a topologia da rede e estejam cientes das limitações de configuração.
Com essa iniciativa, a Apple sinaliza um movimento para integrar o RDMA de maneira mais acessível em ambientes de trabalho pessoal, colocando a supercomputação nas mãos de usuários regulares. Embora hoje em dia essas implementações demandem um conhecimento e configuração minuciosos, o potencial para transformar a computação distribuída é inegável.






