• About
  • Advertise
  • Careers
  • Contact
Segunda-feira, 13 Abril 2026
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

NVIDIA e OpenAI levam a inferência a 1,5 milhões de tokens por segundo com os modelos gpt-oss sobre a arquitetura Blackwell

por Notícias Tecnologia
13/08/2025
em Tecnologia
0
0
ACÇÕES
3
VISTAS
Share on FacebookShare on Twitter

NVIDIA e OpenAI Revolucionam o Desempenho da Inteligência Artificial com Novos Modelos de Código Aberto

A NVIDIA e a OpenAI anunciaram grandes avanços no desempenho da inteligência artificial com o lançamento dos modelos gpt-oss-20b e gpt-oss-120b. Esses modelos de código aberto são otimizados para a arquitetura Blackwell e prometem uma velocidade impressionante, atingindo até 1,5 milhões de tokens por segundo (TPS) em sistemas NVIDIA GB200 NVL72, permitindo atender simultaneamente cerca de 50.000 usuários.

Os novos modelos, focados em raciocínio textual, incorporam uma capacidade inovadora de chain-of-thought, além de chamadas a ferramentas, utilizando uma arquitetura Mixture of Experts (MoE) com ativações SwigGLU. Com camadas de atenção que suportam até 128.000 tokens, alternam entre atenção completa e uma janela deslizante de 128 tokens, proporcionando flexibilidade e eficiência na manipulação de dados.

Ambas as versões estão disponíveis em precisão FP4, permitindo que o modelo de 120B de parâmetros opere em uma única GPU de data center com 80 GB de memória, aproveitando totalmente os recursos da arquitetura Blackwell.

O treinamento do gpt-oss-120b demandou mais de 2,1 milhões de horas em GPUs NVIDIA H100 Tensor Core, enquanto o gpt-oss-20b utilizou aproximadamente dez vezes menos tempo. Para otimizar ainda mais o desempenho, a NVIDIA colaborou com empresas como Hugging Face e Ollama, implementando melhorias específicas em núcleos de atenção e pré-processamento.

A flexibilidade de implantação é um dos pontos fortes, com opções que vão desde data centers até PCs locais. Em ambientes corporativos, a plataforma open source NVIDIA Dynamo melhora a interatividade em sequências longas, e os modelos também estão disponíveis como microserviços prontos para serem integrados a diversas infraestruturas.

O sistema GB200 NVL72, que combina 72 GPUs Blackwell, proporciona um desempenho sem precedentes, permitindo que a plataforma atenda à demanda por modelos de última geração de forma eficiente e a baixo custo.

A colaboração entre NVIDIA e OpenAI não apenas estabelece um novo marco na inferência de modelos de linguagem em grande escala, mas também oferece uma arquitetura desenhada para escalabilidade e acessibilidade, trazendo inteligência artificial de alto desempenho a todos os desenvolvedores, independentemente do ambiente em que atuam.

Tags: ArquiteturaBlackwellGPTOSSinferêncialevamMilhõesmodelosNVIDIAOpenAIporSegundosobretokens
Notícias Tecnologia

Notícias Tecnologia

Related Posts

Intel oferece ao setor de defesa um roteiro com 18A, chiplets e embalagem avançada

por Notícias Tecnologia
12/04/2026
0

A Intel Foundry está a concentrar esforços em um dos mercados mais críticos e estratégicos da indústria de semicondutores: o...

Oportunidades de Inovação: Inscrições Abertas para o Concurso de Projetos MIT Portugal 2026

por Notícias Tecnologia
12/04/2026
0

Estão abertas até 25 de maio de 2026 as candidaturas para o Concurso de Projetos 2026 do Programa MIT Portugal,...

Programa UTAustin Portugal: Novas Iniciativas de Mobilidade para Estágios de Pesquisa em Doutorado

por Notícias Tecnologia
11/04/2026
0

O Programa UTAustin Portugal abriu oficialmente a Chamada de Manifestação de Interesse para os Estágios de Investigação de Doutoramento na...

Recommended

Prêmios Orgânicos da UE 2026: O Melhor da Agricultura Orgânica Europeia

2 meses atrás

Portugal Renova Seu Compromisso com o Progresso Social e a Redução das Desigualdades

2 meses atrás

Popular News

  • Crescente Interesse por Imóveis com Inquilinos: 9,7% das Vendas da Alfa Imobiliária na Espanha

    0 shares
    Share 0 Tweet 0
  • Novos Estatutos da Lusa Suscitam Queixa do Sindicato dos Jornalistas contra o Governo por Potenciais Ingerências Políticas

    0 shares
    Share 0 Tweet 0
  • OMS Emite Apelo Urgente para o Oriente Médio: A Importância da Preparação Contra Riscos Nucleares

    0 shares
    Share 0 Tweet 0
  • Estudantes da FMUP Aventureiros nos Pirinéus: Aprendendo a Salvar Vidas

    0 shares
    Share 0 Tweet 0
  • IPMA: Atualizações Meteorológicas e Impactos Climáticos Recentes

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal