• About
  • Advertise
  • Careers
  • Contact
Terça-feira, 24 Março 2026
  • Iniciar sessão
Sem resultados
Ver todos os resultados
Noticias Portugal
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
  • Home
  • Últimas notícias
  • Economia
  • Deporto
  • Sociedade
  • Internacional
  • Mais notícias
    • Tecnologia
    • Receitas
    • Viagens
Sem resultados
Ver todos os resultados
Noticias Portugal
Sem resultados
Ver todos os resultados
início da web Tecnologia

LangExtract do Google mira para o coração da extração documental com IA

por Notícias Tecnologia
24/03/2026
em Tecnologia
0
0
ACÇÕES
3
VISTAS
Share on FacebookShare on Twitter

Google lança LangExtract, uma biblioteca open source para extração de dados em documentos

Em um movimento que pode transformar a automação de processos documentais, a Google apresentou, em julho de 2025, uma nova ferramenta voltada para desenvolvedores: o LangExtract. Trata-se de uma biblioteca open source de Python que promete converter texto desordenado em dados estruturados, verificáveis e rastreáveis, permitindo que usuários localizem com precisão a origem de cada dado extraído em documentos não estruturados.

A iniciativa surge em um momento crucial, em que muitas empresas ainda se apoiam em expressões regulares frágeis ou em APIs fechadas e onerosas para extrair dados essenciais de contratos, relatórios e outros documentos. O LangExtract, ao elevar o padrão de automação, oferece uma abordagem moderna que inclui estrutura, rastreabilidade, revisão visual e flexibilidade na escolha do modelo subjacente.

O destaque do LangExtract não é apenas a extração de entidades, já comum em outras ferramentas, mas sim a possibilidade de mapeamento preciso das extrações ao texto original. Isso permite uma verificação visual do fragmento de onde o dado foi extraído, o que é especialmente relevante em setores onde erros podem acarretar riscos operacionais e regulatórios.

Além disso, a biblioteca proporciona uma visualização interativa, gerando um HTML autocontido que facilita a navegação entre as entidades detectadas e sua origem, oferecendo uma experiência de validação significativamente superior àquela proporcionada por saídas JSON.

Outro ponto interessante é que o LangExtract foi projetado para lidar com documentos extensos, utilizando fragmentação de texto e processamento em paralelo, questões comuns enfrentadas por usuários que lidam com grandes volumes de informações.

Embora seja impulsionada pelo modelo Gemini, a biblioteca não está restrita a um único fornecedor, permitindo suporte a modelos locais através de Ollama e OpenAI, além de plugins para a adição de provedores personalizados. Essa flexibilidade torna o LangExtract uma opção atraente para organizações que prezam pela privacidade dos dados.

Contudo, é importante destacar que o LangExtract não é uma solução mágica. A qualidade das extrações depende do modelo utilizado, das instruções fornecidas e da complexidade da tarefa. A biblioteca, licenciada sob Apache 2.0, não conta com suporte comercial completo da Google, mas já começa a ser adotada em diversos fluxos de trabalho, como demonstrado pelo suporte do Microsoft Presidio para detecção de dados sensíveis.

O verdadeiro impacto do LangExtract pode estar na maneira como redefine as expectativas em relação às ferramentas de extração documental. Ao combinar a extração estruturada com rastreabilidade e visualização interativa, a nova biblioteca promete desafiar ferramentas tradicionais a justificar sua relevância no mercado.

Tags: coraçãodocumentalExtraçãoGoogleLangExtractmirapara
Notícias Tecnologia

Notícias Tecnologia

Related Posts

Samsung reforça HBM4 com um corte de wafers mais preciso para melhorar a qualidade

por Notícias Tecnologia
24/03/2026
0

Samsung Electronics acelera modernização na fabricação de semicondutores com corte a laser A Samsung Electronics está dando um passo significativo...

Abertura dos Concursos PRIMA 2026: Oportunidades e Novidades

por Notícias Tecnologia
24/03/2026
0

A Parceria para a Investigação e Inovação na Região Mediterrânica (PRIMA) deu início à abertura dos concursos anuais de 2026,...

CISPE leva a Broadcom a Bruxelas pelo futuro da VMware na Europa

por Notícias Tecnologia
24/03/2026
0

A tensão entre a Broadcom e parte do ecossistema de nuvem europeu atingiu um novo patamar. A CISPE, a associação...

Recommended

Vozes de Força: A Cantora Revelação de Cabo Verde Celebra a Feminilidade em Suas Canções

7 meses atrás

Vilamoura: O Refúgio Perfeito Onde o Luxo se Encontra com a Serenidade

1 ano atrás

Popular News

  • Silvia Pastor

    Tokenização Bem-Sucedida: Calella Living Levanta Um Milhão de Euros em 21 Dias para Sua Promoção

    0 shares
    Share 0 Tweet 0
  • Cooperativas Inovadoras: 96 Novas Moradias Chegam ao Mercado de Santarém

    0 shares
    Share 0 Tweet 0
  • LangExtract do Google mira para o coração da extração documental com IA

    0 shares
    Share 0 Tweet 0
  • União Europeia e Austrália Fortalecem Relações com Parceria em Segurança e Defesa e Acordo Comercial

    0 shares
    Share 0 Tweet 0
  • Título em português: “DGPJ: Tradução do Manual da Apostila”

    0 shares
    Share 0 Tweet 0

Connect with us

  • About
  • Advertise
  • Careers
  • Contact

© 2025 Noticias Portugal

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Sem resultados
Ver todos os resultados
  • Home
  • Internacional
  • Economia
  • Viagens
  • Deporto
  • Sociedade
  • Tecnologia
  • Receitas

© 2025 Noticias Portugal