Preservação: a construção da continuidade digital

Compartilhe
Nas iniciativas de acesso aberto à publicação online, cujo impulso e volume se converteram em uma força avassaladora nos últimos anos, torna-se cada vez mais importante considerar o problema da preservação dos conteúdos em longo prazo.
Um dos primeiros sinais que advertiu sobre o desafio e o problema da preservação digital foi lançado em 1996 em um relatório elaborado pela Research Libraries Group, um consórcio de bibliotecas com base nos Estados Unidos, que, em 2006, juntou-se ao Online Computer Library Center (OCLC) integrando WorldCat. Estes relatórios iniciais e análise dos problemas da preservação digital estavam focados em garantir que os materiais poderiam sobreviver a obsolescência técnica e perdas por erros de gestão, ou seja, que os materiais foram geridos durante todo seu ciclo de vida de modo que permaneçam acessíveis para aqueles que os necessitem. Esta foi a tarefa à qual se dedicaram ao longo de décadas e séculos as bibliotecas e arquivos, motivo pelo qual era natural que os primeiros informes de meados dos anos 90 eram uma simples transposição de sua tradição profissional aos suportes de informação que foram surgindo, particularmente a Internet.
Imagem: Infocus Technologies
Os estudos foram revelando novas questões e desafios além da catalogação. Então, foram criados metadados apropriados para melhorar a acessibilidade e a recuperação, também para controlar procedimentos de autenticação, ou a criação de registros de auditoria para garantir que o material não fosse alterado durante o processo por pessoas não autorizadas a fazê-lo. Os conteúdos deveriam ser preservados de modo que pudessem ser usados e adaptados para novas finalidades, e, eventualmente, para a criação de novos conteúdos.
O conceito de “preservação digital” foi sendo desenvolvido e sofisticado, e muda para uma perspectiva dinâmica e abrangente denominada “continuidade digital”, o que, de acordo com o The National Archives (EUA) é “a capacidade de usar a sua informação na forma que você desejar, por tanto tempo quanto você precise”.
Os tipos de materiais para preservar também irão expandir o seu alcance, pois além das cópias digitais dos conteúdos analógicos e textuais, se agregam dados da pesquisa científica, registros de processos de gerenciamento de registros do governo, recursos educacionais em repositórios digitais, portais de periódicos digitais em acesso aberto, data-sets institucionais, séries econômicas, meteorológicas, etc. Isto abrange, em especial, todos os conteúdos produzidos e publicados na Internet (born-digital) que precisa ser preservado.
As necessidades vão delineando desafios, não só tecnológicos, mas o mais importante, desafios institucionais que não foram planejados, e habilidades profissionais que não eram comuns no mercado. O tema central da discussão é que as funções normais da biblioteca precisam ser expandidas para incluir atividades relacionadas à organização e manipulação de dados e conjuntos de dados digitais, e para essas atividades não havia recursos, ou disciplinas formais, muito menos experiência suficiente.
Um estudo recente do mercado de trabalho sobre os conhecimentos, aptidões e habilidades solicitados para projetos de preservação digital estabelecem como os três primeiros de uma longa lista: (1) ser capaz de trabalhar em um ambiente intensivo de tecnologia, (2) o domínio de normas e especificações, e (3) domínio de ferramentas e aplicativos informáticos.
Desde o início, os pesquisadores da área notaram deficiências nas área de bibliotecas universitárias, particularmente a escassez de profissionais devidamente treinados para agir e apoiar essas atividades. […]
O desafio de garantir a preservação em longo prazo e acesso aos resultados de pesquisa, em especial os data-sets produzidos por projetos financiados com dinheiro público é um tema de grande destaque nos EUA. Essa importância se intensificou especialmente desde fevereiro deste ano, com o projeto de lei norte-americano Fair Access to Science and Technology Research Act (FASTR), que estabelece que todas as agências federais devem desenvolver um plano para colocar em acesso aberto os resultados da pesquisa, sendo que para este projeto foram alocados 100 milhões de dólares.
No entanto, a situação atual das instituições e recursos profissionais não é tão otimista, de acordo com um estudo publicado em novembro passado pelo Council on Library and Information Resources³ . Este estudo, conhecido como DataRes, que levou dois anos para ser concluído, teve como objetivos: (1) estudar e documentar as tendências dos planos de gestão e políticas institucionais de pesquisa em resposta às exigências federais e (2) determinar como os profissionais de informação podem melhor responder às necessidades emergentes de gerenciamento de dados de pesquisa em universidades.
O estudo identificou várias barreiras para o gerenciamento eficaz de dados:
a. Falta de recursos financeiros
As instituições não têm em seus planos de investimento e despesas os recursos adequados para financiar programas de preservação.
b. A falta de estruturas organizacionais
As estruturas acadêmicas são lentas para mudar. Eles se baseiam fortemente em noções de longo prazo aceitas como arquétipos funcionais.
c. Falta de Preparação Profissional
O Projeto DataRes identificou a falta de formação, certificação e outros tipos de preparação profissional como uma deficiência básica para fornecer aos membros da academia de forma favorável para a gestão de dados de pesquisa. Pior, em um nível mais fundamental, praticamente ninguém na academia percebe ter uma responsabilidade profissional ou mandato para funções de gerenciamento de dados de pesquisa. A falta de prioridade entre os pesquisadores foi um tema recorrente encontrado no Projeto DataRes, que se explica em razão de que os pesquisadores são recompensados ​​principalmente por novas pesquisas, não pela gestão dos resultados de pesquisa anteriores.
d. Falta de mandatos institucionais
Existem mandatos institucionais explícitos e conhecidos para a gestão eficaz de dados de pesquisa. A produção de dados no decurso das atividades de pesquisa sempre foi entendida como parte de sua tarefa, mas a ideia de que esses mesmos pesquisadores deveriam assumir a responsabilidade de compartilhar os conjuntos de dados acumulados para avançar nas agendas de pesquisa mais amplas é um conceito relativamente novo, que veio a ser desenvolvido a partir da experiência dos grupos que trabalharam no projeto genoma humano.
Esta falta de consenso resulta na falta de mandatos institucionais ou políticas relativas à gestão de dados. Sem mandatos institucionais, os dados da pesquisa poderão ser preservados de forma acessível, ou não ser preservados, porque a administração sistemática não chegou a ser uma prioridade institucional.
Os altos custos para manter a infraestrutura que garanta a continuidade digital de milhões de artigos de periódicos, gradualmente se torna uma tarefa que supera as instituições individuais, a maioria das universidades, as bibliotecas nacionais e todas as editoras de países emergentes, motivos pelos quais emergem ao menos três estratégias para enfrentar o problema.
Em um recente congresso em Barcelona sobre Preservação Digital³, o especialista Martin Halbert, diretor das bibliotecas da Universidade do Norte do Texas e presidente do sistema MetaArchive, um projeto que vale a pena analisar, afirmou que o problema atual é que nós não temos nenhuma perspectiva histórica sobre preservação digital, e falta-nos boas prática. Até agora, a preservação é baseada principalmente no critério de “não colocar todos os ovos na mesma cesta”, e, por exemplo, MetaArchive conserva seis cópias em distintos lugares de 15.000 teses, usando o software LOCKSS.
Halbert também disse que não é a favor do uso de serviços de armazenamento em nuvem e prefere ter os arquivos em locais diferentes, mas em computadores próprios porque desconfia das empresas que prestam este serviço.
A continuidade digital é o grande desafio que todos os países emergentes enfrentam para manter a presença na Web. Estes países ganharam um lugar importante através do programa SciELO, que vem crescendo há 15 anos. Mas será necessário incorporar às nossas responsabilidades a preparação em cada um dos nossos países de profissionais treinados e estabelecer políticas e infraestruturas tecnológicas necessárias.
Trechos do texto de Ernesto Spinak no Blog Scielo em Perspectiva.
16 de janeiro de 2014

Publicado por Priscila Jacobsen