Arquivo.pt permite voltar a visitar sites do passado

Após um ano de publicação, 80 por cento das páginas online desaparecem ou são alteradas. O serviço de preservação digital prestado pelo Arquivo.pt, uma iniciativa da FCT, existe para conservar esse histórico e contribuir para que informação valiosa não se perca.

Arquivo.pt permite voltar a visitar sites do passado

Sempre que desejar revisitar informação perdida na web no seu estado original, é possível encontrá-la em http://arquivo.pt. O domínio oferece um serviço de pesquisa público e gratuito sobre dados arquivados da web desde 1996.

Preservar a web requer um esforço contínuo e é na recuperação do acesso a estes endereços que o serviço prestado pelo Arquivo da Web Portuguesa (Arquivo.pt) se propõe ser útil, para que o conhecimento nela contido esteja acessível a gerações futuras.

Esta foi uma iniciativa da unidade FCCN da FCT, uma infraestrutura de investigação focada na preservação de conteúdos de interesse para a comunidade portuguesa.

Pode também servir utilizadores internacionais, uma vez que preserva páginas em várias línguas e oferece a possibilidade de acesso a conteúdos históricos em português a utilizadores estrangeiros, através de ferramentas de tradução automática.

A preservação da web é realizada de forma automática e recorre a um sistema informático de larga escala. Diariamente são recolhidas 300 publicações seleccionadas e, a cada três meses, todos os sites sob o domínio .pt são guardados. Após os dados serem recolhidos a informação é processada, de modo a ser pesquisáveis e acessível.

São arquivados cerca de 2 7000 milhões de ficheiros (95TB de informação), sendo que qualquer pessoa poderá sugerir endereços para preservação.

O Arquivo.pt surgiu entre 2001 e 2006 num projecto, realizado na FCUL, resultando de uma investigação nacional na área da preservação digital
Em 2007 a FCCN lançou o projeto “Arquivo da Web Portuguesa”, tendo sido realizada, em 2008, a primeira recolha da web portuguesa. Em 2012 foi disponibilizado o serviço público de pesquisa e acesso a páginas do passado.

No ano passado, o Arquivo.pt para preservação cerca de 580 milhões de ficheiros e o serviço de pesquisa registou, em média, 3 692 utilizadores por mês (90 por cento novos utilizadores).
Com o lançamento de uma nova versão do Arquivo.pt (versão Fénix) verificam-se melhorias de acesso e interoperabilidade do serviço de pesquisa do Arquivo.pt com outros arquivos da web, projetos de investigação ou aplicações web que possam vir a ser desenvolvidas (por exemplo, por alunos de Informática).

O Arquivo.pt realizou uma primeira tentativa de arquivar sites alojados sob o   domínio .eu, um projeto que surgiu no âmbito de atividades do Research Infrastructure for the Study of Archived Web Materials (RESAW), a rede europeia que tem como objetivo a criação de uma infraestrutura dedicada ao estudo de materiais arquivados da web.

As Eleições Presidenciais de 2016, têm lugar marcado no arquivo.pt, replicando o esforço já feito nesse sentido para as Eleições Legislativas de 2015, contando com a ajuda de voluntários que ajudaram a identificar 184 sites relacionados com a temática.

Para 2016 o Arquivo.pt tem grandes desafios, nomeadamente vir a ser mais conhecido e utilizado pelo público como uma ferramenta útil. Estará em desenvolvimento um protótipo de pesquisa de imagens arquivadas, função requisitada pelos utilizadores, e há ainda planos para potenciar a reprodução de conteúdos arquivados de forma a evitar falta de imagens na visualização das páginas arquivadas.

Tags

RECOMENDADO PELOS LEITORES

REVISTA DIGITAL

IT INSIGHT Nº 52 Novembro 2024

IT INSIGHT Nº 52 Novembro 2024

NEWSLETTER

Receba todas as novidades na sua caixa de correio!

O nosso website usa cookies para garantir uma melhor experiência de utilização.