A NVIDIA anunciou o lançamento do Nemotron 3, uma nova família de modelos de inteligência artificial que promete revolucionar o desenvolvimento de sistemas multiagente. Com tamanhos que variam entre Nano, Super e Ultra, o objetivo principal é tornar o processo de criação de agentes especializados mais acessível, transparente e eficiente.
Com a crescente adoção de arquiteturas multiagente, onde diferentes bots trabalham em conjunto, a NVIDIA percebeu a necessidade de uma abordagem que equilibrasse eficiência e abertura. O novo modelo utiliza uma arquitetura híbrida chamada “mixture-of-experts” (MoE), que ativa apenas partes do modelo conforme necessário, reduzindo o custo e a latência. A empresa afirma que o Nemotron 3 Nano, que possui 30 bilhões de parâmetros, oferece uma capacidade de processamento até quatro vezes maior do que seu antecessor, o Nemotron 2 Nano, além de diminuir a geração de tokens de raciocínio em até 60%.
Os modelos serão disponibilizados em três versões. O Nemotron 3 Nano está disponível imediatamente, enquanto as versões Super e Ultra, voltadas para aplicações mais complexas, são esperadas na primeira metade de 2026. Um destaque importante é que o Nemotron 3 Nano possui uma janela de contexto de 1.000.000 de tokens, permitindo a execução de tarefas mais longas e complexas sem perda de precisão.
Além de modelos abertos, a NVIDIA se posiciona como a primeira empresa a oferecer um pacote que inclui datasets, ambientes e bibliotecas de aprendizado reforçado para facilitar a criação de agentes. Entre as ferramentas lançadas estão o NeMo Gym e NeMo RL, disponíveis como código aberto no GitHub e Hugging Face.
A NVIDIA também menciona a disponibilidade do Nemotron 3 Nano em plataformas de inferência como Hugging Face e por meio de provedores como Baseten e DeepInfra. Para o mercado corporativo, a empresa oferece o NIM, um microserviço para implementação em qualquer infraestrutura que utilize tecnologia NVIDIA.
O Nemotron 3 chega em um momento crucial, onde muitas organizações enfrentam altos custos com os agentes de IA. A NVIDIA aposta que a combinação de modelos abertos eficientes com um suporte robusto vai se tornar o padrão no futuro próximo, atendendo assim à crescente demanda por soluções de IA que equilibram desempenho e custo.






