Qualcomm apresenta AI200 e AI250: aceleradores “rack-scale” para inferência generativa com mais memória, menor TCO e um salto de largura de banda efetiva

Qualcomm Revoluciona Inferência de IA com Novas Soluções AI200 e AI250

A Qualcomm anunciou importantes avanços na inferência de inteligência artificial (IA) em centros de dados com o lançamento das soluções AI200 e AI250. Estas inovações visam oferecer desempenho robusto a um custo total de propriedade (TCO) competitivo, focando na eficiência ao executar modelos generativos.

As soluções serão comercializadas como placas e racks completos, prometendo desempenho de nível rack, maior capacidade de memória e uma abordagem otimizada para o uso de energia. Durga Malladi, SVP & GM da Qualcomm Technologies, destacou que suas novas tecnologias redefinem as capacidades de inferência em larga escala sem comprometer a segurança ou a flexibilidade exigidas pelos modernos centros de dados.

Com uma previsão de lançamento escalonada, a solução AI200 estará disponível em 2026 e a AI250 em 2027. Ambas estão alinhadas com uma estratégia a longo prazo que prioriza melhorias constantes em eficiência energética e desempenho.

Soluções Focadas nas Necessidades do Mercado

A AI200 se destaca por sua memória de até 768 GB LPDDR por placa. Essa quantidade triplica a memória disponível em muitos aceleradores atuais, permitindo que a GPU maneje contextos longos e lotes maiores sem comprometer o desempenho.

Enquanto isso, a AI250 introduz a arquitetura de ‘near-memory computing’, que promete aumentar o largura de banda efetivo em mais de dez vezes e reduzir o consumo de energia, focando na eficiência e no desempenho em inferências.

Ambas as ofertas podem ser adquiridas como racks prontos para produção, operando com até 160 kW por rack, equipados com refrigeração líquida e suporte para protocolos PCIe e Ethernet, permitindo uma escalabilidade modular.

Preparação para o Futuro da Inferência

O suporte da Qualcomm se estende além do hardware, oferecendo uma pilha de software otimizada para facilitar a integração e operação das novas soluções. O objetivo é transformar a implementação de IA em um processo ágil com menos fricções, permitindo uma adoção mais rápida de modelos e frameworks já estabelecidos no mercado.

Com essas inovações, a Qualcomm solidifica sua posição no competitivo campo da inferência de IA, atendendo às crescentes demandas por soluções escaláveis e economicamente viáveis em um cenário tecnológico em constante evolução. As empresas precisam se preparar para uma nova era na qual o desempenho da inferência e a eficiência de custos se tornam essenciais para a implementação em larga escala de IA generativa.

Qualcomm apresenta AI200 e AI250: aceleradores “rack-scale” para inferência generativa com mais memória, menor TCO e um salto de largura de banda efetiva

Notícias Tecnologia

Related Posts

Oportunidades do Programa Portugal-Berkeley: Um Webinar Imperdível

NVIDIA impulsiona os padrões abertos de robótica: contribuições diretas ao ROS 2, novo SIG de “IA física”, ferramentas open-source e a chegada do Isaac ROS 4.0 no Jetson Thor

Object First lança Ootbi Mini: armazenamento imutável “anti-ransomware” para edge e pequenas escritórios, com honeypot integrado e gestor de frotas na nuvem.

Recommended

Principais Informações e Dicas para o Consumidor

Castro Group Apresenta Nova Marca para Flexibilidade de Trabalho e Residência

Popular News

NVIDIA impulsiona os padrões abertos de robótica: contribuições diretas ao ROS 2, novo SIG de “IA física”, ferramentas open-source e a chegada do Isaac ROS 4.0 no Jetson Thor

U.Porto Brilha no CNU de Judô 2025 com Medalhas de Prata e Bronze

The Modernist Weekend Retorna a Faro para Celebrar sua 4ª Edição

Claro, aquí tienes un título en portugués sobre a IPMA: “IPMA: Atualizações Cruciais sobre Previsões Meteorológicas e Mudanças Climáticas”

Aliança Estratégica para Implantar os Laboratórios de Isótopos de Cambridge em Genome Valley, Hyderabad

Connect with us

Welcome Back!

Retrieve your password