• About
  • Advertise
  • Careers
  • Contact
Segunda-feira, 29 Dezembro 2025
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

Red Hat lança a comunidade llm-d para impulsionar a inferência distribuída de IA generativa em grande escala

por Notícias Tecnologia
20/06/2025
em Tecnologia
0
0
ACÇÕES
3
VISTAS
Share on FacebookShare on Twitter

Red Hat Lança Projeto llm-d para Resolver Desafios na Inferência em Inteligência Artificial Generativa

A Red Hat, referência global em soluções de código aberto, anunciou o lançamento do projeto llm-d, que visa enfrentar um dos principais desafios da inteligência artificial generativa: a inferência em larga escala. O novo desenvolvimento se concentra em otimizar o desempenho e a eficiência com que modelos de linguagem geradores (LLMs) realizam tarefas no ambiente produtivo.

Construído com foco em ambientes nativos de Kubernetes, o llm-d combina uma arquitetura distribuída baseada em vLLM e um sistema de roteamento de rede inteligente com inteligência artificial. Essa sinergia permite a criação de nuvens de inferência que atendem às exigências operacionais mais rigorosas, mesmo em cenários intensivos.

Enquanto o treinamento de modelos continua essencial, um estudo da Gartner prevê que, até 2028, mais de 80% dos aceleradores de carga de trabalho nos datacenters serão dedicados à inferência, destacando a importância de ferramentas como o llm-d. Este sistema se propõe a oferecer uma alternativa escalável e flexível, superando as limitações da centralização da inferência em grandes servidores.

O llm-d não apenas promove a eficiência operacional, mas também busca reduzir drasticamente o custo total de propriedade (TCO) associado aos aceleradores de IA. Com inovações como o suporte avançado a modelos com vLLM, a desagregação de funções de IA e um serviço de roteamento otimizado, a Red Hat pretende facilitar a adoção responsável de tecnologias de IA generativa.

O projeto já conta com o apoio de grandes nomes da indústria, incluindo Google Cloud, IBM Research e NVIDIA, refletindo uma colaboração sólida que promete transformar o futuro da inferência em larga escala. Garantindo um ambiente de desenvolvimento inclusivo, a Red Hat se compromete a fomentar uma comunidade dinâmica em torno do llm-d.

Em suma, a Red Hat visa criar um futuro em que quaisquer modelos possam ser implementados em diferentes aceleradores e nuvens, oferecendo experiências de usuário consistentes e acessíveis. A visão é clara: com o llm-d, a empresa está se posicionando para ser pioneira na evolução da inferência de IA.

Tags: ComunidadedistribuídaescalagenerativaGrandeHatimpulsionarinferêncialançallmdparaRed
Notícias Tecnologia

Notícias Tecnologia

Related Posts

Proxmox e Ansible: quando a virtualização deixa de depender do “clique” e começa a funcionar como código

por Notícias Tecnologia
29/12/2025
0

A administração de infraestruturas virtualizadas está passando por uma transformação silenciosa, mas significativa. Cada vez mais tarefas que anteriormente eram...

A nuvem ultrapassa os 100 bilhões por trimestre: a Inteligência Artificial entra em produção e altera a corrida entre hiperescalas

por Notícias Tecnologia
29/12/2025
0

O mercado global de serviços de infraestrutura em nuvem ultrapassou um marco simbólico: US$ 102,6 bilhões em gastos no terceiro...

A RAM encarece devido à febre da IA: por que 2026 ameaça mudar os preços de notebooks, PCs e servidores

por Notícias Tecnologia
28/12/2025
0

Durante o ano de 2025, a compra de notebooks e a montagem de PCs se tornaram, surpreendentemente, uma experiência mais...

Recommended

Estudantes da FEUP Criam Protótipo Inovador de Barco Solar

7 meses atrás

Apple enfrenta sua possível “lacuna de silício”: o que aconteceria se Johny Srouji deixar a empresa

3 semanas atrás

Popular News

  • Proxmox e Ansible: quando a virtualização deixa de depender do “clique” e começa a funcionar como código

    0 shares
    Share 0 Tweet 0
  • Quinze Cidades onde os Preços de Imóveis Cairam no Último Ano

    0 shares
    Share 0 Tweet 0
  • A nuvem ultrapassa os 100 bilhões por trimestre: a Inteligência Artificial entra em produção e altera a corrida entre hiperescalas

    0 shares
    Share 0 Tweet 0
  • Inditex ultrapassa a marca de 200 bilhões e se consolida como o gigante do varejo europeu

    0 shares
    Share 0 Tweet 0
  • Indonésia Impulsiona a Pesca Sustentável para Garantir a Segurança Alimentar

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal