• About
  • Advertise
  • Careers
  • Contact
Sexta-feira, 1 Maio 2026
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

AWS levará Cerebras ao Bedrock para acelerar a inferência de IA

por Notícias Tecnologia
13/03/2026
em Tecnologia
0
0
ACÇÕES
7
VISTAS
Share on FacebookShare on Twitter

Amazon Web Services (AWS) e Cerebras estabelecem parceria para acelerar a inferência em Inteligência Artificial

A Amazon Web Services (AWS) anunciou uma nova colaboração com a Cerebras, visando reforçar a velocidade de inferência em sua plataforma de inteligência artificial. A parceria permitirá que a nuvem da Amazon implemente sistemas Cerebras CS-3 em seus centros de dados, tornando-os disponíveis para os clientes por meio do Amazon Bedrock. As empresas afirmam que o novo serviço estará disponível nos próximos meses, e que em 2026 será possível executar modelos abertos e o Amazon Nova no hardware da Cerebras.

Essa aliança não se resume apenas à inclusão de mais uma opção de hardware no portfolio da AWS. A proposta envolve a divisão das fases do processo de inferência, separando o “prefill”, responsável pelo processamento do prompt inicial, e o “decode”, que gera os tokens de saída. De acordo com a Amazon, essa abordagem permitirá que cada chip desempenhe as funções para as quais é mais adequado.

O design técnico da nova solução, que faz uso do chip Trainium da AWS para a fase de prefill, enquanto o Cerebras CS-3 cuidará do decode, destaca uma ideia clara, mas desafiadora em sua execução. A interconexão entre os dois sistemas será realizada através do Elastic Fabric Adapter, a conexão de alto desempenho da Amazon. A estimativa é que essa configuração possa oferecer até cinco vezes mais capacidade de geração de tokens rapidamente dentro do mesmo espaço físico.

O prefill, por ser uma tarefa intensiva em computação paralela, e o decode, que demanda acesso contínuo à memória, representam um gargalo crescente na atual corrida por soluções em IA. A Cerebras afirma que seu sistema CS-3 possui uma arquitetura capaz de oferecer até 15 vezes mais rapidez em cenários específicos de inferência em comparação com alternativas baseadas em GPU.

Com este movimento, a AWS busca não apenas resolver os gargalos de computação, mas também estabelecer o Amazon Bedrock como uma plataforma mais robusta para acesso a modelos e serviços de IA. Além disso, a Amazon enfatizou que a nova infraestrutura será executada de maneira integrada dentro de sua nuvem, preservando os padrões de segurança e isolamento que seus clientes valorizam.

Embora a parceria prometa facilitar a inferência em tempo real, as empresas também alertaram que as configurações entre prefill e decode poderão variar de acordo com as necessidades dos clientes, reconhecendo que muitas aplicações ainda podem requerer uma arquitetura mais tradicional.

Em um momento em que a velocidade de resposta se torna crucial, especialmente para ferramentas de assistentes e programação, este anúncio destaca a intenção da AWS de não somente expandir seu leque de ofertas, mas de também se distanciar da simples corrida por GPU, construindo um ecossistema integrado que possa atender à demanda crescente por inferência ágil em inteligência artificial.

Tags: AcelerarAWSBedrockCerebrasinferêncialevarápara
Notícias Tecnologia

Notícias Tecnologia

Related Posts

Ciclo ‘Arquivos do Saber’: Explorando a Relação entre Portugal e a NATO na Ciência e Diplomacia (1947-2010)

por Notícias Tecnologia
28/04/2026
0

A segunda sessão do Ciclo “Arquivos do Saber: Ciência, História e Memória” está agendada para o dia 13 de maio,...

VMware ESXi, Proxmox, Hyper-V e KVM: comparação real

por Notícias Tecnologia
27/04/2026
0

No cenário atual de virtualização, a escolha da plataforma deixou de ser apenas uma decisão técnica, passando a envolver questões...

Catalunha acelera 26 novos centros de dados: 2.000 MW em debate

por Notícias Tecnologia
26/04/2026
0

Catalunha busca se consolidar como um polo europeu de centros de dados em meio à crescente demanda por inteligência artificial...

Recommended

Cisco se une à AI Infrastructure Partnership para impulsionar o investimento em centros de dados de inteligência artificial

12 meses atrás

Martín Anselmi: Focado na Glória do Mundial de Clubes

1 ano atrás

Popular News

  • Guia Honesta das Highlands

    0 shares
    Share 0 Tweet 0
  • Gestão Florestal Sustentável: Sessões de Sensibilização e Informação sobre Bupi no Concelho

    0 shares
    Share 0 Tweet 0
  • Empreender Após a Dana: Um Programa Inclusivo na Comunidade Valenciana

    0 shares
    Share 0 Tweet 0
  • Relatório de Avaliação da Comissão Revela Progressos Lentos na Sustentabilidade da Pesca e Desafios Contínuos para os Pescadores da UE

    0 shares
    Share 0 Tweet 0
  • Dia Mundial da Liberdade de Imprensa: Defenda-se da Desinformação na Internet

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal