NVIDIA Foca na Memória de Contexto para IA Agêntica com Nova Plataforma
Durante a CES, a NVIDIA fez um anúncio importante na corrida por um novo patamar na inteligência artificial agêntica, apresentando sua plataforma “NVIDIA Inference Context Memory Storage”. Com a introdução do processador de dados BlueField-4, a empresa visa resolver um problema crítico: a memória de contexto, essencial para modelos que realizam tarefas complexas e mantêm conversas prolongadas com lógica e coerência.
À medida que os modelos de IA se tornam mais complexos e o contexto das interações se estende, a quantidade de dados que precisa ser retida para garantir respostas coesas aumenta exponencialmente. Esse estado é normalmente representado pelo cache de chave-valor (KV cache), uma peça fundamental para a continuidade das respostas e para a experiência do usuário. Entretanto, a NVIDIA alerta que o armazenamento desse cache na GPU não é uma solução viável a longo prazo, devido à limitação de recursos e ao alto custo das memórias.
A resposta da NVIDIA para esse desafio é sua nova plataforma de armazenamento que promete estender a capacidade útil de memória além da GPU, permitindo uma troca de informações rápida entre os nós de clusters de sistemas de grande escala. Isso não só melhora a eficiência energética e o número de tokens processados por segundo, como também possibilita que agentes de IA mantenham conversas mais longas sem “esquecer” informações cruciais.
O BlueField-4 vai além de uma simples conexão de rede; ele opera como uma DPU (unidade de processamento de dados) e se integra ao framework DOCA, otimizando a gestão do KV cache e melhorando a segurança em ambientes multi-tenant. Isso, segundo a NVIDIA, assegura que as cargas de trabalho de IA sejam entregues com alta velocidade e eficiência.
Além disso, a plataforma também se conecta a outros componentes do ecossistema NVIDIA, como o Spectrum-X Ethernet, que fornece acesso de alta performance à memória de contexto. Com isso, a empresa sinaliza que a próxima geração de aplicações de IA não se limitará a perguntas e respostas simples, mas sim a sistemas de agentes que operam com memória tanto de curto quanto de longo prazo.
A NVIDIA revelou que diversas empresas do setor de armazenamento e infraestrutura já estão se unindo para construir plataformas em torno do BlueField-4, incluindo gigantes como Dell Technologies, HPE e IBM. A previsão é que a nova plataforma esteja disponível na segunda metade de 2026, prometendo revolucionar a forma como a IA é aplicada em empresas e setores variados.






