As Eleições Autárquicas em Portugal, realizadas no dia 12 de outubro de 2025, geraram um volume significativo de dados, resultando na recolha de 3.2 terabytes de conteúdo eleitoral pelo Arquivo.pt. Este projeto envolveu uma meticulosa coleta de informações a partir da web, utilizando 440 termos de pesquisa para localizar 43.000 páginas de endereços, incluindo sites de freguesias, municípios e partidos políticos.
A identificação de conteúdos eleitorais foi realizada através de uma lista de palavras-chave, que abrange temas políticos, sociais e econômicos, além de incluir nomes de candidatos e regiões. Durante a pesquisa, foram utilizadas técnicas avançadas de busca no Google, permitindo um resultado mais direcionado e eficiente. No total, 1.400 pesquisas foram realizadas, tanto antes quanto depois do evento eleitoral, e os resultados foram organizados em tabelas para facilitar a análise.
O Arquivo.pt utilizou duas ferramentas de rastreamento, o Heritrix e o Browsertrix-crawler, para a gravação dos conteúdos. O primeiro permitiu uma coleta em larga escala, enquanto o segundo focou em conteúdos dinâmicos, capturando informações que poderiam ser perdidas em uma coleta mais automática. Entretanto, a coleta enfrentou algumas limitações, como bloqueios de acesso a certos sites e dificuldades na captura de conteúdos de redes sociais.
Os dados coletados sobre as Eleições Autárquicas de 2025 estão disponíveis na plataforma Dados.Gov e, em breve, serão acessíveis para pesquisadores através do Arquivo.pt. A coleção será identificada como EAWP48, e após um ano, os conteúdos poderão ser pesquisados por qualquer pessoa, facilitando novos estudos e análises sobre o processo eleitoral em Portugal.
Origem: Archivo.pt




