• About
  • Advertise
  • Careers
  • Contact
Terça-feira, 31 Março 2026
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

A inferência da IA cairá mais de 90%, mas a conta total não diminuirá tanto

por Notícias Tecnologia
31/03/2026
em Tecnologia
0
0
ACÇÕES
0
VISTAS
Share on FacebookShare on Twitter

A economia da Inteligência Artificial Generativa deve passar por uma transformação radical nesta década, segundo previsões da consultoria Gartner. Até 2030, o custo de execução de inferência em um grande modelo de linguagem (LLM) com 1 trilhão de parâmetros pode cair mais de 90% em comparação a 2025. Além disso, espera-se que esses LLMs sejam até 100 vezes mais eficientes em custo do que os primeiros modelos desenvolvidos em 2022. No entanto, essa perspectiva otimista precisa ser analisada com cautela e em seu contexto adequado.

A redução nos custos é um aspecto importante, mas o verdadeiro desafio é compreender que, embora o preço por token diminua, o consumo total de tokens aumentará de forma ainda mais significativa. Isso implica que empresas de tecnologia, provedores de IA e equipes de produto não podem se apoiar apenas na diminuição de custos para equilibrar a equação econômica da IA avançada, especialmente conforme sistemas agênticos e fluxos de raciocínio complexos se tornarão mais comuns na produção.

A Gartner identifica que a diminuição dos custos será impulsionada por várias melhorias, como avanços em semicondutores, maior eficiência na infraestrutura, inovação no design de modelos e uma presença crescente de dispositivos edge para casos de uso específicos. O mercado se dividirá em dois cenários: os modelos de ponta, baseados em chips avançados, e os que utilizam uma mistura representativa de semicondutores, onde os custos permanecerão mais altos devido à menor potência computacional.

Essa análise evidencia que o futuro da inferência dependerá tanto da redução de preços quanto da infraestrutura necessária para suportar esses novos modelos. Além disso, a eficiência não será a mesma para todos, gerando uma competição não apenas em termos de custo, mas também em termos de quem pode oferecer uma infraestrutura superior e uma melhor orquestração de processos.

Outro ponto relevante levantado pela Gartner é que os custos unitários mais baixos podem não ser repassados integralmente aos clientes. As chamadas inteligências de fronteira, que exigem mais processamento, demandarão entre cinco e trinta vezes mais tokens por tarefa do que chatbots comuns. Isso se deve à complexidade das operações realizadas pelos agentes, que envolvem desdobramentos de problemas e consultas a múltiplas fontes de informação.

A conclusão é que a IA mais simples tende a se tornar uma utilidade mais barata, enquanto a inferência avançada e custosa será reservada para cenários em que atividades complexas demandam um investimento elevado. O verdadeiro valor no futuro estará em quem souber orquestrar cargas de trabalho, utilizando uma variedade de modelos de maneira eficiente.

Portanto, a previsão da Gartner não é de uma IA simplesmente barata, mas de uma tecnologia mais eficiente que exigirá um uso intensivo e uma boa engenharia de sistemas. Para o setor tecnológico, a lição é clara: a próxima grande batalha não será apenas treinar o modelo mais poderoso, mas garantir a viabilidade econômica para seu uso massivo. Assim, quem souber administrar melhor essa nova dinâmica de custos e complexidade terá uma vantagem competitiva no mercado.

Tags: cairáContadiminuiráinferênciamaisMasNãotantoTotal
Notícias Tecnologia

Notícias Tecnologia

Related Posts

Microsoft e NVIDIA querem acelerar a energia nuclear com IA

por Notícias Tecnologia
30/03/2026
0

A corrida para alimentar o auge da Inteligência Artificial (IA) está levando grandes empresas de tecnologia a voltarem seus olhares...

UiPath e Microsoft querem levar a automação ao coração do SOC

por Notícias Tecnologia
29/03/2026
0

A colaboração recente entre a UiPath e a Microsoft está redefinindo a segurança cibernética em um estágio em que a...

Bureau 1440 acelera Rassvet: assim a Rússia compete na internet por satélite

por Notícias Tecnologia
29/03/2026
0

A Rússia dá um passo significativo em direção à conectividade satelital com o lançamento de sua constelação Rassvet Em uma...

Recommended

VMware Cloud Foundation 9.0 adota OpenAPI para acelerar a automação e o desenvolvimento multicloud

8 meses atrás

Claro! Aquí tienes un título en portugués:

“GOC em Ação: Demonstração de Eficácia da Proteção Civil”

8 meses atrás

Popular News

  • A inferência da IA cairá mais de 90%, mas a conta total não diminuirá tanto

    0 shares
    Share 0 Tweet 0
  • Sete capitais de província superam 7% de rentabilidade em aluguel

    0 shares
    Share 0 Tweet 0
  • Boavista SAD Cai para a Segunda Divisão a Seis Jornadas do Fim

    0 shares
    Share 0 Tweet 0
  • Principais Tendências e Dicas para Consumidores

    0 shares
    Share 0 Tweet 0
  • Banco Mundial Lança Iniciativa para Impulsionar Energia Renovável e Criação de Empregos na Amazônia

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal