Positron AI desafia o domínio da NVIDIA com alternativas eficientes em tecnologia de inferência
No crescente universo da inteligência artificial, a NVIDIA tem se destacado com seu hardware robusto, introduzindo plataformas como Blackwell e a nova Rubin, que exigem sofisticadas configurações de refrigeração líquida. Contudo, a Positron AI, sob a liderança de Mitesh Agarwal, discorda dessa visão. A empresa acredita que há espaço para soluções de inferência que sejam mais econômicas e eficientes, considerando centros de dados que ainda operam com refrigeração a ar.
A proposta da Positron se materializa em dois modelos de aceleradores: Atlas, atualmente em operação, e Asimov, que deve ser lançado em breve. Segundo Agarwal, esses dispositivos consomem entre duas e cinco vezes menos energia que uma GPU da NVIDIA durante processos de inferência, além de serem compatíveis com racks convencionais, o que permite o uso da infraestrutura já existente. “O 95% da capacidade instalada atualmente é refrigerada a ar. Enquanto a Rubin e Blackwell requerem novos investimentos, nós operamos onde já há infraestrutura”, afirma o CEO.
A briga entre refrigeração a ar e líquida não se trata apenas de preferência, mas de custos e complexidade. A NVIDIA pode exigir até 2.000 W por GPU em suas novas gerações, enquanto a proposta da Positron envolve chips que operam com menos de 400 W, permitindo uma utilização mais eficiente de energia. A construção de centros refrigerados a líquido, embora mais eficiente em escala, demanda investimentos que chegam a 50% a mais do que os sistemas a ar.
Agarwal destaca a importância de sua arquitetura própria de memória, que promete diminuir a dependência de componentes críticos e melhorar a escalabilidade. Com uma produção local ancorada pela Intel Foundry, a Positron pretende evitar gargalos comuns na indústria e atender a uma demanda crescente de maneira mais ágil.
O plano da Positron é claro: otimizar o desempenho por euro investido, oferecendo até 5 vezes mais eficiência em cargas que exigem grande uso de memória. Isso se traduz, segundo a empresa, em um retorno sobre investimento em torno de 15 a 16 meses, em contraste com o período de 2 a 2,5 anos prometido pela NVIDIA.
O CEO também comenta a competição com alternativas como AWS Trainium e Google TPU, onde a Positron busca se destacar em desempenho econômico em inferências de alto valor. O foco, segundo ele, está em atender nichos de mercado, especialmente onde as limitações de energia e infraestrutura tornam difícil a implementação de tecnologias de ponta.
“Enquanto o treinamento pode continuar concentrado em algumas poucas soluções generalistas, a inferência está se diversificando, criando oportunidades para chips dedicados”, afirma Agarwal. O mercado de inferência projeta um crescimento expressivo, com potenciais gastos de cerca de 400 bilhões de dólares até 2028.
No final, a Positron AI oferece uma alternativa viável e descomplicada em um setor que demanda rapidez e eficiência, colocando-se como uma alternativa respeitável contra gigantes estabelecidos e prometendo revolucionar a forma como a inferência em IA é abordada no mercado.
