• About
  • Advertise
  • Careers
  • Contact
Quarta-feira, 27 Agosto 2025
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

Red Hat lança a comunidade llm-d para impulsionar a inferência distribuída de IA generativa em grande escala

por Notícias Tecnologia
20/06/2025
em Tecnologia
0
0
ACÇÕES
1
VISTAS
Share on FacebookShare on Twitter

Red Hat Lança Projeto llm-d para Resolver Desafios na Inferência em Inteligência Artificial Generativa

A Red Hat, referência global em soluções de código aberto, anunciou o lançamento do projeto llm-d, que visa enfrentar um dos principais desafios da inteligência artificial generativa: a inferência em larga escala. O novo desenvolvimento se concentra em otimizar o desempenho e a eficiência com que modelos de linguagem geradores (LLMs) realizam tarefas no ambiente produtivo.

Construído com foco em ambientes nativos de Kubernetes, o llm-d combina uma arquitetura distribuída baseada em vLLM e um sistema de roteamento de rede inteligente com inteligência artificial. Essa sinergia permite a criação de nuvens de inferência que atendem às exigências operacionais mais rigorosas, mesmo em cenários intensivos.

Enquanto o treinamento de modelos continua essencial, um estudo da Gartner prevê que, até 2028, mais de 80% dos aceleradores de carga de trabalho nos datacenters serão dedicados à inferência, destacando a importância de ferramentas como o llm-d. Este sistema se propõe a oferecer uma alternativa escalável e flexível, superando as limitações da centralização da inferência em grandes servidores.

O llm-d não apenas promove a eficiência operacional, mas também busca reduzir drasticamente o custo total de propriedade (TCO) associado aos aceleradores de IA. Com inovações como o suporte avançado a modelos com vLLM, a desagregação de funções de IA e um serviço de roteamento otimizado, a Red Hat pretende facilitar a adoção responsável de tecnologias de IA generativa.

O projeto já conta com o apoio de grandes nomes da indústria, incluindo Google Cloud, IBM Research e NVIDIA, refletindo uma colaboração sólida que promete transformar o futuro da inferência em larga escala. Garantindo um ambiente de desenvolvimento inclusivo, a Red Hat se compromete a fomentar uma comunidade dinâmica em torno do llm-d.

Em suma, a Red Hat visa criar um futuro em que quaisquer modelos possam ser implementados em diferentes aceleradores e nuvens, oferecendo experiências de usuário consistentes e acessíveis. A visão é clara: com o llm-d, a empresa está se posicionando para ser pioneira na evolução da inferência de IA.

Tags: ComunidadedistribuídaescalagenerativaGrandeHatimpulsionarinferêncialançallmdparaRed
Notícias Tecnologia

Notícias Tecnologia

Related Posts

Cloudflare lança novas ferramentas Zero Trust para garantir a adoção em massa da IA generativa

por Notícias Tecnologia
26/08/2025
0

Cloudflare Lança Novas Funcionalidades para Proteger Adoção de IA nas Empresas A Cloudflare, renomada empresa de conectividade em nuvem, anunciou...

O sul de Taiwan se consolida como um polo global de semiconductores e inteligência artificial com 300 startups internacionais

por Notícias Tecnologia
26/08/2025
0

No evento Meet Greater South 2025, realizado nos dias 22 e 23 de agosto no Centro de Exposições de Kaohsiung,...

F5, reconhecida como líder em proteção de aplicativos e API no relatório KuppingerCole 2025

por Notícias Tecnologia
26/08/2025
0

A cibersegurança no âmbito de aplicações web e APIs vive um novo momento com o último relatório Leadership Compass 2025...

Recommended

Gigas e Albadoc se unem para impulsionar a transformação digital da gestão documental na nuvem

3 meses atrás

Linux é obsoleto: O debate que moldou o futuro dos sistemas operacionais

3 meses atrás

Popular News

  • O muro invisível da Nuvem: Quando os gigantes tecnológicos se tornam inacessíveis em crises

    0 shares
    Share 0 Tweet 0
  • Lisboa Destaca-se como um dos Principais Centros de Crescimento das Rendas Imobiliárias

    0 shares
    Share 0 Tweet 0
  • Gartner 2025: os agentes de IA e os dados preparados marcam o roteiro tecnológico

    0 shares
    Share 0 Tweet 0
  • SK hynix marca um marco com o primeiro NAND QLC de 321 camadas: o futuro do armazenamento para a era da IA

    0 shares
    Share 0 Tweet 0
  • Refrigeração líquida: de opção experimental a imperativo nos data centers

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal