• About
  • Advertise
  • Careers
  • Contact
Sexta-feira, 20 Junho 2025
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

Red Hat lança a comunidade llm-d para impulsionar a inferência distribuída de IA generativa em grande escala

por Notícias Tecnologia
20/06/2025
em Tecnologia
0
0
ACÇÕES
0
VISTAS
Share on FacebookShare on Twitter

Red Hat Lança Projeto llm-d para Resolver Desafios na Inferência em Inteligência Artificial Generativa

A Red Hat, referência global em soluções de código aberto, anunciou o lançamento do projeto llm-d, que visa enfrentar um dos principais desafios da inteligência artificial generativa: a inferência em larga escala. O novo desenvolvimento se concentra em otimizar o desempenho e a eficiência com que modelos de linguagem geradores (LLMs) realizam tarefas no ambiente produtivo.

Construído com foco em ambientes nativos de Kubernetes, o llm-d combina uma arquitetura distribuída baseada em vLLM e um sistema de roteamento de rede inteligente com inteligência artificial. Essa sinergia permite a criação de nuvens de inferência que atendem às exigências operacionais mais rigorosas, mesmo em cenários intensivos.

Enquanto o treinamento de modelos continua essencial, um estudo da Gartner prevê que, até 2028, mais de 80% dos aceleradores de carga de trabalho nos datacenters serão dedicados à inferência, destacando a importância de ferramentas como o llm-d. Este sistema se propõe a oferecer uma alternativa escalável e flexível, superando as limitações da centralização da inferência em grandes servidores.

O llm-d não apenas promove a eficiência operacional, mas também busca reduzir drasticamente o custo total de propriedade (TCO) associado aos aceleradores de IA. Com inovações como o suporte avançado a modelos com vLLM, a desagregação de funções de IA e um serviço de roteamento otimizado, a Red Hat pretende facilitar a adoção responsável de tecnologias de IA generativa.

O projeto já conta com o apoio de grandes nomes da indústria, incluindo Google Cloud, IBM Research e NVIDIA, refletindo uma colaboração sólida que promete transformar o futuro da inferência em larga escala. Garantindo um ambiente de desenvolvimento inclusivo, a Red Hat se compromete a fomentar uma comunidade dinâmica em torno do llm-d.

Em suma, a Red Hat visa criar um futuro em que quaisquer modelos possam ser implementados em diferentes aceleradores e nuvens, oferecendo experiências de usuário consistentes e acessíveis. A visão é clara: com o llm-d, a empresa está se posicionando para ser pioneira na evolução da inferência de IA.

Tags: ComunidadedistribuídaescalagenerativaGrandeHatimpulsionarinferêncialançallmdparaRed
Notícias Tecnologia

Notícias Tecnologia

Related Posts

Ashburn vs Dallas: a batalha pela liderança dos data centers hyperscale em 2025

por Notícias Tecnologia
19/06/2025
0

A indústria de centros de dados dos Estados Unidos está passando por uma transformação significativa, com a demanda global por...

Veeam corrige uma vulnerabilidade crítica que permite execução remota de código no Backup & Replication

por Notícias Tecnologia
19/06/2025
0

Atualização Urgente da Veeam Software: Vulnerabilidade Crítica Identificada A Veeam Software divulgou uma atualização urgente para sua plataforma de backup,...

Bloqueio de fornecedor: o perigo invisível na nuvem e na tecnologia moderna

por Notícias Tecnologia
19/06/2025
0

Na era digital, a dependência de um único fornecedor pode se tornar um obstáculo significativo para a inovação e competitividade...

Recommended

Revolut Instala Caixas eletrônicos Físicos na Espanha e Planeja Oferecer Hipotecas em 2025

1 mês atrás

Roma Elimina o Porto e Mourinho Avança para as Oitavas da Liga Europa

4 meses atrás

Popular News

  • Picture of Axel Buffet

    Funcas Atualiza suas Projeções: IPC Médio Atingirá 2,6% em 2025 Após Aumento de Junho

    0 shares
    Share 0 Tweet 0
  • ONU Clama por Solidariedade Global em Dia Mundial dos Refugiados

    0 shares
    Share 0 Tweet 0
  • Portugal: Continuação da Tradição de Segurança para Investidores

    0 shares
    Share 0 Tweet 0
  • 41% dos Candidatos Espanhóis Usam IA para Criar Currículos, Mas Apenas 66% Possui Portfólio Digital

    0 shares
    Share 0 Tweet 0
  • Crise Humanitária: 22,5 Mil Crianças Afetadas por Conflitos Armados

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal