Atualização da NVIDIA em Modelos de Mundo Abertos Revoluciona Treinamento de IA para Robótica e Veículos Autônomos
O desenvolvimento de inteligência artificial (IA) que atua no mundo real, como robôs e veículos autônomos, depende fundamentalmente de dados variados, precisos e seguros. Tradicionalmente, obter esses dados em ambientes reais é um processo caro, lento e frequentemente perigoso. Para superar esse desafio, a NVIDIA atualizou seus Modelos de Mundo Aberto (WFMs), com o lançamento do Cosmos Predict 2.5 e Cosmos Transfer 2.5. Essas ferramentas se integram ao Omniverse e ao ecossistema Isaac, permitindo a geração em larga escala de dados sintéticos fisicamente plausíveis, que aceleram a transição da simulação para o mundo real.
A principal inovação das novas versões se baseia na unificação e variação da geração de mundos. Isso inclui a capacidade de controlar aspectos como clima, iluminação e terreno de forma precisa e garantir a consistência entre diferentes câmeras. Com esses avanços, é possível testar e validar modelos de IA em uma cobertura de cenários que seria impraticável de serem coletados em locais reais, como ruas, fábricas ou campos.
O que trazem Cosmos Predict 2.5 e Cosmos Transfer 2.5?
-
Cosmos Predict 2.5: Este modelo combina em uma arquitetura leve as funções de Text2World, Image2World e Video2World. Mediante um simples prompt, imagem ou vídeo, o sistema cria mundos em vídeo coesos e controláveis, permitindo a simulação de cenas complexas e o fornecimento de múltiplas perspectivas para alimentar a percepção e o planejamento.
-
Cosmos Transfer 2.5: Proporciona a transferência de estilos entre mundos com alta fidelidade. Isso não só amplia a variabilidade dos dados sintetizados, mas também garante que mudanças em clima, iluminação e terreno sejam aplicadas de forma coerente em todas as câmeras. Este modelo é 3,5 vezes menor que seu antecessor e apresenta um desempenho significativamente melhor.
Ambos os WFMs se inserem em pipelines de dados sintéticos, desenhados para acelerar o chamado “gap” entre simulação e realidade, proporcionando vídeos fotorrealistas e anotações consistentes.
Pipeline de Dados Sintéticos: Da Captura à Simulação
A NVIDIA propõe um fluxo de trabalho em quatro etapas para a construção de dados sintéticos úteis:
-
Omniverse NuRec: Utiliza bibliotecas de reconstrução neural para criar gêmeos digitais a partir de capturas feitas com smartphones.
-
SimReady assets: Enriquecem o gêmeo digital com modelos 3D realistas, prontos para simulação.
-
Isaac Sim (MobilityGen): Produz dados em escala, controlando diversos sensores e cinemática.
-
NVIDIA Cosmos: Amplia o que foi gerado com variações plausíveis de clima, luz e terreno, aplicadas de forma coerente.
Essa abordagem resulta em milhões de amostras sintéticas com etiquetas perfeitas, diversificadas e que complementam os dados reais.
Aplicações Práticas e Impacto no Setor
Empresas como Skild AI, Serve Robotics, e Zipline já estão se beneficiando das novas funções. A Skild utiliza o Cosmos Transfer para aumentar a variabilidade dos dados em suas operações, enquanto a Serve Robotics combina dados de campo com simulações para suas frotas autônomas. A Zipline, especialista em drones de entrega, incorpora a tecnologia para otimizar sua operação.
Essas inovações são cruciais, visto que a IA física requer experiências e interações dinâmicas, demandando dados não só em continuidade, mas também em qualidade e diversidade.
Conclusão
A atualização dos WFMs pela NVIDIA representa um avanço significativo no treinamento de IA em ambientes complexos e dinâmicos, possibilitando a criação de dados sintéticos que não apenas substituem, mas complementam informações do mundo real. A crescente aplicação dessas tecnologias poderá transformar radicalmente setores como logística, robótica e mineração, mostrando que a simulação pode ter um papel tão vital quanto a realidade na formação de sistemas autônomos.






