Meta avança em sua estratégia de independência em hardware com o desenvolvimento de seu primeiro chip de inteligência artificial (IA) baseado na arquitetura RISC-V, projetado especificamente para o treinamento de modelos avançados. De acordo com um relatório da Reuters, a empresa colaborou com a Broadcom no design desse acelerador personalizado, que está sendo fabricado pela TSMC, com o intuito de reduzir a dependência das unidades de processamento gráfico (GPUs) da Nvidia, incluindo modelos como H100, H200, B100 e B200.
Esse desenvolvimento faz parte da iniciativa Meta Training and Inference Accelerator (MTIA), que visa a criação de hardware especializado em IA. A companhia já começou a implantar de forma limitada seus primeiros aceleradores para avaliar o desempenho antes de expandir a produção.
Meta vem explorando há anos a arquitetura RISC-V como uma alternativa aos processadores convencionais. A principal vantagem dessa arquitetura é sua natureza aberta e flexível, permitindo que a Meta personalize o conjunto de instruções sem a necessidade de pagar licenças a terceiros.
Embora os detalhes técnicos do novo chip ainda não sejam conhecidos, espera-se que ele inclua memória HBM3 ou HBM3E, uma vez que os modelos de IA exigem uma enorme capacidade de processamento de dados. Além disso, é provável que o acelerador utilize uma arquitetura de matriz sistólica, similar à de outros chips de treinamento, o que permite realizar cálculos de maneira eficiente através de uma rede estruturada de unidades de processamento.
O programa MTIA já enfrentou diversos desafios no passado. Em 2022, a Meta interrompeu o desenvolvimento de seu primeiro processador de inferência por não conseguir atingir os objetivos de desempenho e eficiência energética. Essa falha levou a empresa a fazer grandes pedidos de GPUs da Nvidia para atender suas necessidades imediatas de treinamento de modelos de IA.
Desde então, a Meta tornou-se um dos maiores clientes da Nvidia, adquirindo dezenas de milhares de GPUs para treinar modelos como Llama Foundation e aprimorar seus algoritmos de recomendações e publicidade, além de realizar processos de inferência em suas plataformas, que somam mais de três bilhões de usuários diários.
Apesar dessas dificuldades, a empresa continua comprometida com sua estratégia de desenvolvimento de hardware próprio. Em 2023, a Meta começou a utilizar chips MTIA para tarefas de inferência e espera empregar seu acelerador de treinamento em maior escala até 2026, desde que cumpra os requisitos de desempenho e consumo energético.
Se o acelerador de treinamento de IA da Meta também estiver baseado em RISC-V, ele pode representar um dos chips mais potentes já criados com essa arquitetura aberta. Esse avanço fortaleceria a viabilidade do RISC-V em aplicações de alto desempenho, desafiando a predominância de arquiteturas proprietárias como ARM e x86 no mercado de IA.
À medida que a Meta avança em seu objetivo de desenvolver soluções de hardware personalizadas para seus centros de dados, seu novo chip tem o potencial de mudar o panorama da computação em IA, promovendo um ecossistema mais aberto e eficiente para o desenvolvimento de modelos de inteligência artificial.