No CES 2026, a NVIDIA revelou duas novas soluções que prometem revolucionar o ambiente de desenvolvimento de Inteligência Artificial: o NVIDIA DGX Spark e o NVIDIA DGX Station. Focadas no chamado “desktop do desenvolvedor”, essas máquinas têm como objetivo permitir que equipes de engenharia, pesquisa e ciência de dados possam testar, ajustar e executar modelos avançados localmente, com a possibilidade de escalar posteriormente para a nuvem.
A competição para executar modelos cada vez maiores de IA já não se limita aos data centers. A NVIDIA busca democratizar o acesso a modelos pesados, apresentando o DGX Spark como um sistema compacto de “plug-and-play”, ideal para o uso no dia a dia de desenvolvedores. Por outro lado, o DGX Station é projetado para ambientes que lidam com cargas de fronteira, como laboratórios de pesquisa e empresas que necessitam experimentar com modelos em larga escala sem depender exclusivamente de recursos da nuvem.
Uma das características mais notáveis do DGX Spark é sua capacidade de trabalhar com modelos de até 100 bilhões de parâmetros, enquanto o DGX Station é capaz de lidar com modelos de até 1 trilhão de parâmetros. Ambas as máquinas utilizam a inovadora arquitetura Grace Blackwell, que combina memória unificada e desempenho otimizado para atender às exigências atuais de processamentos em IA.
A NVIDIA destaca a importância do formato NVFP4, que permite a compressão de modelos em até 70%, facilitando a execução de modelos grandes em configurações de desktop. Além disso, foram apresentadas demonstrações ao vivo que evidenciam a capacidade das novas máquinas, como um pré-treinamento que teria atingido 250.000 tokens por segundo.
A empresa também enfatiza sua colaboração com iniciativas de software de código aberto, buscando melhorar ainda mais o desempenho de suas máquinas e apoiar a comunidade de desenvolvedores. Com a disponibilidade prevista para a primavera de 2026, a NVIDIA está determinada a transformar a forma como a IA é desenvolvida, propondo uma solução híbrida que combina desenvolvimento local com a escalabilidade dos data centers e da nuvem.





