• About
  • Advertise
  • Careers
  • Contact
Terça-feira, 26 Agosto 2025
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

Intel consegue aproximar suas CPUs do desempenho das GPUs da NVIDIA em inteligência artificial graças a microkernels de 1 e 2 bits.

por Notícias Tecnologia
26/08/2025
em Tecnologia
0
0
ACÇÕES
0
VISTAS
Share on FacebookShare on Twitter

Intel Inova na Inferência de IA: Microkernels de 1 e 2 Bits Rivalizam com GPUs da NVIDIA

A batalha entre CPU e GPU na inteligência artificial (IA) acaba de ganhar um novo capítulo surpreendente. A Intel anunciou que seus processadores convencionais, por meio de um redesenho focado em microkernels otimizados, conseguem executar modelos de linguagem de grande tamanho (LLM) com uma eficiência que rivaliza com a renomada GPU NVIDIA A100, até então considerada o padrão para treinamento e inferência de IA.

O segredo não está em um novo chip revolucionário, mas na forma como as matrizes são multiplicadas nas CPUs. Utilizando microkernels projetados para maximizar as instruções AVX2 e novas disposições de dados, a Intel alcançou um desempenho até 7 vezes superior na inferência de modelos cuantizados em 1 e 2 bits, em comparação com a abordagem tradicional de 16 bits.

Transformação na Inferência

Historicamente, o padrão para inferência eficiente de LLMs utilizava pesos de 16 bits ou 4 bits, permitindo economia de memória e energia, mas sempre com uma perda de precisão. A Intel vai além, desenvolvendo microkernels capazes de “compactar” a informação de maneira extremamente eficiente, resultando em uma redução drástica de largura de banda e memória durante a execução em CPUs x86 modernas.

Testes mostram que enquanto a NVIDIA A100 alcança 250 tokens por segundo, os processadores Intel Core Ultra ficam entre 82 e 110 tokens, um resultado que surpreende pela proximidade, já que a GPU possui uma largura de banda 17 a 20 vezes superior.

Comparação Direta com GPUs

Os engenheiros da Intel testaram seus microkernels em três modelos de processadores recentes. O desempenho se mostrou consistente em modelos como Llama3-8B, Falcon3-1B e MobileLLM-1.5B. Em números, o modelo Llama3-8B apresentou uma aceleração de até 5,8 vezes em 2 bits em comparação com 16 bits.

Qualidade Mantida

A clave para esse avanço está no que a Intel denomina “up-convert and compute”. Isso envolve armazenar pesos do modelo em formatos de 1 ou 2 bits que são posteriormente convertidos para inteiros de 8 bits durante a inferência. Com operações otimizadas (FMA), e uma nova disposição de dados introduzida, a Intel conseguiu evitar perdas de desempenho.

Implicações do Avanço

Esse progresso é significativo por permitir que modelos avançados rodem em dispositivos com recursos limitados, democratizando o acesso a tecnologias que antes estavam restritas apenas a data centers. Além disso, os microkernels consomem entre 4 e 8 vezes menos memória e energia, abrindo novas possibilidades para dispositivos de baixa potência.

Um Desafio à NVIDIA

O que a Intel apresenta representa um desafio estratégico à NVIDIA, que dominou o campo da IA com suas GPUs. Se a inferência pode ser realizada em CPUs comuns, o mercado para GPUs pode perder sua atratividade. Embora a discrepância de desempenho ainda exista, essa nova abordagem sugere que, para determinados casos, a CPU pode ser suficiente.

Perspectivas Futuras

A Intel não pretende parar por aqui. A empresa já está trabalhando em portar essas otimizações para CPUs e SoCs ARM, possibilitando que dispositivos como smartphones e tablets também se beneficiem. Com a chegada das instruções AVX10.2, espera-se que as capacidades sejam ampliadas ainda mais.

Conclusão

O que antes parecia impossível — executar modelos complexos de IA em laptops — está se tornando uma realidade. Com microkernels de 1 e 2 bits, a Intel não apenas desafia a liderança da NVIDIA, mas também abre caminho para uma nova era de IA acessível. O futuro da inteligência artificial em dispositivos pessoais pode estar prestes a mudar radicalmente.

Tags: AproximarArtificialbitsConsegueCPUsdasdesempenhoGPUsGraçasIntelInteligênciamicrokernelsNVIDIAsuas
Notícias Tecnologia

Notícias Tecnologia

Related Posts

Vertiv lança OneCore: infraestrutura pré-fabricada para acelerar a era dos centros de dados de IA e HPC

por Notícias Tecnologia
26/08/2025
0

A corrida para construir centros de dados capazes de suportar cargas de inteligência artificial (IA) e computação de alto desempenho...

UltraRAM: a memória que promete unir armazenamento e RAM em um único chip

por Notícias Tecnologia
25/08/2025
0

UltraRAM: A Revolução na Memória de Computadores? Pesquisadores da Universidade de Lancaster, em colaboração com a Universidade de Warwick, estão...

Vantage Data Centers aposta $25 bilhões no Texas para construir um mega-campus de inteligência artificial

por Notícias Tecnologia
25/08/2025
0

A corrida global pela dominância da infraestrutura que suportará a inteligência artificial ganhou um novo capítulo com o anúncio da...

Recommended

Gigas e Albadoc se unem para impulsionar a transformação digital da gestão documental na nuvem

3 meses atrás

Linux é obsoleto: O debate que moldou o futuro dos sistemas operacionais

3 meses atrás

Popular News

  • O muro invisível da Nuvem: Quando os gigantes tecnológicos se tornam inacessíveis em crises

    0 shares
    Share 0 Tweet 0
  • Lisboa Destaca-se como um dos Principais Centros de Crescimento das Rendas Imobiliárias

    0 shares
    Share 0 Tweet 0
  • Gartner 2025: os agentes de IA e os dados preparados marcam o roteiro tecnológico

    0 shares
    Share 0 Tweet 0
  • SK hynix marca um marco com o primeiro NAND QLC de 321 camadas: o futuro do armazenamento para a era da IA

    0 shares
    Share 0 Tweet 0
  • Refrigeração líquida: de opção experimental a imperativo nos data centers

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal