A NVIDIA apresenta na GTC 2026 um novo plano de referência aberto para a inteligência artificial física, focando na importância dos dados. A empresa anunciou a Physical AI Data Factory Blueprint, uma arquitetura projetada para automatizar a geração, ampliação, avaliação e preparação de dados necessários para treinar robôs, agentes de visão artificial e sistemas de condução autônoma em grande escala. A mensagem central é clara: sem dados abundantes, variados e bem validados, não há robô confiável ou veículo autônomo capaz de evoluir de forma eficaz.
O que torna este anúncio significativo é que a NVIDIA não o apresenta como uma ferramenta isolada, mas como uma cadeia de trabalho completa que abrange desde os dados brutos até o conjunto final pronto para treinamento. Isso envolve a curadoria de dados reais e sintéticos, a criação de cenários raros e de difícil captura no mundo real, além da validação automática de resultados e a orquestração de todo o processo em uma infraestrutura em nuvem ou híbrida. Embora o blueprint completo ainda não esteja disponível no GitHub, a NVIDIA espera liberá-lo em abril, tendo já algumas partes-chave publicadas.
O desafio que a NVIDIA busca resolver é específico. Na robótica e na condução autônoma, não basta ter modelos potentes; é necessário treiná-los com enormes volumes de dados que incluam não apenas situações normais, mas também casos raros, falhas e condições adversas. Esses chamados cenários de “long tail” são caros e difíceis de capturar no mundo real, tornando a geração sintética e a simulação elementos centrais no desenvolvimento atual.
Além disso, a NVIDIA destaca que seu novo plano se apoia em vários componentes do ecossistema Cosmos. O Cosmos Curator processa, refina e anota grandes conjuntos de dados; o Cosmos Transfer amplia e diversifica esses dados; e o Cosmos Evaluator, disponível no GitHub, avalia automaticamente a qualidade de vídeos sintéticos. O elo que une tudo isso é o OSMO, um orquestrador aberto que coordena clústeres de treinamento, simulação e ambientes edge, ajudando os desenvolvedores a se concentrarem no modelo, ao invés de lutarem contra a infraestrutura.
Importante ressaltar que Microsoft Azure e Nebius não estão apenas como parceiros superficiais. A Microsoft já apresentou um Azure Physical AI Toolchain no GitHub, integrando seus serviços em nuvem com a pilha de IA física da NVIDIA, o que representa um movimento direcionado a ambientes empresariais. A Nebius, por sua vez, oferece essa integração como um serviço gerenciado, prometendo ciclos de iteração mais rápidos para seus usuários.
Esse anúncio é uma extensão da visão que a NVIDIA tem trabalhado em torno da chamada “IA física” e vem sendo utilizado em projetos como o Alpamayo, focado em cenários complexos. Com uma proposta que visa unir simulação, treinamento, avaliação e implantação, a NVIDIA sinaliza uma tendência de mercado em direção a pipelines completos de dados e validação prontos para escalar.
Com essa abordagem, a NVIDIA pretende transformar a computação acelerada em uma verdadeira fábrica de dados, mudando a dinâmica de quem pode produzir, depurar e validar informações com maior velocidade, além do modelo e do chip. A expectativa agora é ver como essa visão será adotada na prática por desenvolvedores independentes, startups e fabricantes fora do ecossistema da NVIDIA.





