O Arquivo.pt fez recentemente uma coleta especial de conteúdos relacionados com as Eleições Legislativas que ocorrerão em 18 de maio de 2025. Esta iniciativa resultou na gravação de mais de 8 mil páginas únicas, gerando aproximadamente 250 Gigabytes de dados. A coleção inclui notícias de diversos meios de comunicação, sites de partidos políticos e publicações de cidadãos, documentando um evento significativo na história política de Portugal.
A metodologia de coleta foi semi-automática, permitindo identificar e armazenar informações de forma ágil e eficiente. Os pesquisadores prepararam uma lista com 384 termos de pesquisa, que incluíam palavras relacionadas às eleições, nomes de candidatos e referências em várias línguas. Utilizando o Bing Search API, foram extraídos endereços de páginas que foram posteriormente gravadas com a ferramenta Browsertrix-crawler.
A busca ocorreu antes das eleições e foi complementada por duas coletas na semana subsequente, assegurando que novos conteúdos fossem incorporados à coleção. Os dados resultantes estão disponíveis para pesquisadores que desejem utilizá-los em seus estudos ou projetos. O Arquivo.pt também está incentivando a participação no Prêmio anual Arquivo.pt, que celebra iniciativas de pesquisa com base em seus dados.
Origem: Archivo.pt