Como encontrar artigos em acesso aberto

A publicação dos resultados de estudos acadêmicos em acesso aberto é cada vez mais frequente e estima-se que atualmente estão disponíveis milhões de documentos online. Por esta razão, é importante ter ferramentas eficientes para encontrar as versões livres dos artigos que precisamos (sem pagar assinaturas ou comprando artigos individuais e usando métodos legais). Como a necessidade vai criando a oferta, nos dois ou três últimos anos vem surgindo aplicativos gratuitos para atender aos requerimentos dos acadêmicos, bibliotecários, pesquisadores, e estudantes em geral. Qual é o mercado de oferta hoje em dia?

É aqui que entra em cena o meu nerd favorito, Aaron Tay, um bibliotecário na Singapur Management Library, que recentemente escreveu algumas notas1,2 em seu blog analisando diversos plugins para os navegadores e também os serviços de agregadores que permitem encontrar de forma quase instantânea textos completos em acesso aberto.

A tabela a seguir apresenta os diferentes serviços analisados por Aaron Tay em vários posts (os links estão relacionados no final do post) com alguns comentários e avaliações minhas (que me considero um pouco velho para ser um nerd!). Mais abaixo neste post mostraremos exemplos dos dois plugins que nos parecem mais eficientes – ou seja: são os que eu uso – porém seria um bom exercício que você mesmo faça seus testes.

    1. 1.

BASE

Este serviço criado pela Bielefeld University Library na Alemanha é, provavelmente, um dos maiores e mais avançados agregadores do mundo, superando em novembro de 2016 os 100 milhões de documentos . O serviço BASE assegura que pelo menos 40% dos textos identificados estão em acesso aberto, não sendo possível assegurá-lo ao restante por falta de metadados nos repositórios. Através do serviço de oadoi.org, tem acesso a mais de 5.000 repositórios. No entanto, o BASE não indexa o conteúdo destes textos completos. A interface de busca é muito avançada, possivelmente a mais amigável de toda a família de plugins analisados.
    1. 2.

CORE

O CORE afirma ter cerca de 70 milhões de documentos que, assim como o BASE, são recuperados através do protocolo OAI-PMH. Por esta razão, também têm o mesmo problema de vincular com certeza os textos completos devido ala falta de normalização dos metadados nos repositórios institucionais, em particular os “Green OA” (ver nota no final da tabela). Em contrapartida, o CORE indexa o conteúdo destes textos completos.
    1. 3.

Dissemin

Está em versão beta, têm indexados cerca de 100 milhões de documentos.
É uma versão simples, por enquanto limitada a buscar apenas pelo nome do autor. Entrega os resultados rapidamente indicando quais deles estão disponíveis em acesso aberto.
    1. 4.

Lazy Scholar button

Lançado em 2014, é um plugin que, até o momento, funciona apenas no navegador Google Chrome. É a extensão mais complexa (algo complicado também) e, entre vários serviços, pode verificar se sua instituição possui assinaturas ao texto completo, apresentar varias métricas de citação, obter comentários de sistemas como PubMed Commons, oferece funções que lhe permite criar citações, e recuperar documentos relacionados com sua consulta que podem ser de interesse, também em acesso aberto.
Sugestão: quando eu o instalei, por praticidade, marquei NÃO em quase todos os parâmetros. Vale a pena analisá-lo (ainda que depois não o utilize).
    1. 5.

OAIster

Propriedade de OCLC, esse é um catálogo coletivo que declara possuir mais de 50 milhões de registros de recursos em acesso aberto, provenientes da coleta por OAI-PMH de mais de 2.000 fontes que contribuem ao catálogo. Os registros também estão disponíveis na interface do WorldCat. Tem as mesmas limitações que foram indicadas para o BASE, CORE e coleções baseadas no protocolo OAI-PMH, limitações que são explicadas ao final desta tabela.
    1. 6.

Open Access button

É um plugin criado em 2013 por dois estudantes e deve ser instalado em um navegador que não seja Internet Explorer, mas é instalado facilmente no Google Chrome. Têm alguns milhares de usuários registrados. Em meus experimentos, no entanto, não tive muito êxito.
    1. 7.

Google Scholar button

Criado en 2015, é instalado diretamente e é, possivelmente, a opção preferida. Ver exemplo separado abaixo neste post.
    1. 8.

Unpaywall button

É o mais novo membro da família, e pode ser uma segunda opção.
Ver exemplo separado abaixo neste post.

Nota sobre as limitações do “harvester OAI-PMH”

O Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) é um protocolo desenvolvido para coletar descrições de metadados de registros eletrônicos depositados em arquivos de modo que o serviço possa criar índices de consulta. A implementação de OAI-PMH requer que os metadados sigam a norma Dublin Core. Os motores de indexação e agregadores de serviços baseados no protocolo OAI-PMH têm dificuldades com a cobertura dos repositórios institucionais, devido ao fato que estes repositórios são muito heterogêneos e usam uma grande diversidade de sistemas de administração de arquivos. Ademais, por carecer de padrões claros de metadados, não é simples para os robôs indexadores determinar se os registros assinalam ou não os textos completos gratuitos. Este problema adiciona-se às dificuldades de indexar os registros baseados em metadados Dublin Core, como descrevi anteriormente neste blog3 referente à indexação de repositórios pelo Google Scholar.

Complementando os comentários do artigo referido1, para compreender melhor, devemos dizer que na historia dos repositórios de acesso aberto, o protocolo OAI-PMH foi estabelecido para recompilar somente os metadados e os textos completos. A razão por detrás deste protocolo foi que se supunha que a maioria (se não todos) dos repositórios ofereceriam os textos em acesso aberto (como o modelo ArXiv) e, por este motivo, no protocolo OAI-PMH até agora não existe um campo que indique se o texto completo é de acesso aberto ou não.

O problema, então, surge ao indexar os milhares de repositórios institucionais devido ao fato que a função que cumprem para estas instituições vai mais além que o simples depósito de documentos completos em acesso livre. Entre outras finalidades está apoiar o “auto arquivamento” aos acadêmicos, preservar um registro das atividades da universidade e demostrar a relevância de suas atividades científicas, econômicas e sociais, para aumentar sua visibilidade e status. Por estes motivos, como diz Aaron Tay, é possível que os repositórios institucionais não tenham mais que um terço de seus documentos com textos completos acessíveis. Devido a estas limitações, os agregadores de documentos em acesso aberto ignoram estes problemas e indexam os repositórios em sua totalidade, dando a ideia equivocada de que tudo é de acesso livre ao texto completo.

Para fazer os testes, eu instalei os aplicativos em minha versão do Google Chrome, e os botões apareceram na barra de ferramentas do navegador como mostrado na figura a seguir:

(1) Lazy Scholar; (2) Google Scholar button; (3) Open Access button; (4) Unpaywall button;

Google Scholar button

É um plugin lançado em 2015 que pode ser instalado de forma simples e direta. Como funciona? Suponhamos que você está em uma página a qual não teve acesso através do Google Scholar e queira saber se existe uma versão de acesso livre deste documento. O que deve fazer, então, é marcar o título do artigo com o mouse e clicar no ícone na barra de ferramentas (o de número 2 na figura de nossa barra de ferramentas). O Google Scholar buscará em background e abrirá em uma janela secundária à direita apresentando todas as versões de acesso livre que têm indexadas:

Unpaywall button

Uma vez que a extensão é instalada, quando chega a uma página de um documento qualquer, aparecerá na margem direita de sua tela o ícone de um cadeado, que pode estar em diferentes cores, eles têm os seguintes significados:

  • Verde: o texto completo está em um repositório institucional ou servidor de preprints
  • Dourado: trata-se de um artigo de um periódico que tem licença de acesso aberto
  • Azul: está em um periódico que não tem licença de acesso aberto
  • Negro: não encontrou outras versões em seu índice.

No exemplo a seguir, o cadeado à direita indica que há uma versão acessível, e se clicar no ícone, levará ao texto requerido que tem a URL mostrada abaixo da figura:

URL: http://rspb.royalsocietypublishing.org/content/royprsb/284/1852/20170224.full.pdf

São de fato efetivas estas ferramentas para encontrar textos livres?

Em termos de eficiência, podemos dividir estas ferramentas em dois níveis:

  • No primeiro nível estão aquelas que se baseiam na busca direta pelo Google Scholar, como Lazy Scholar button, também o Google Scholar button e Unpaywall button.
  • Em segundo nível estariam todas as outras ferramentas analisadas neste post.

O motivo é que o Google Scholar é o maior índice de material académico disponível, apesar de ter limitações ao indexar os repositórios. Todas as outras iniciativas, no momento, são muito menores em termos de cobertura, incluindo os agregadores como o BASE e o CORE pelos motivos explicados acima. Por outro lado, o Google Scholar desenvolveu algoritmos muito eficientes que permitem distinguir as diferentes manifestações de um mesmo artigo (preprints, versões, postprints, etc.).

Além disso, o Google Scholar não apenas indexa repositórios, com também toda classe de sites, incluindo as páginas web das universidades. Estes documentos são invisíveis à maioria dos plugins analisados, que se restringem principalmente a repositórios, ao passo que o Google Scholar indexa todos os documentos que parecem ser acadêmicos, incluídos em sites com extensão: .edu.

Também é necessário ressaltar que os serviços do tipo Open Access button e aqueles que usam Oadoi.org e similares, não indexam artigos disponíveis no ResearchGate ou Academia.edu, devido às fortes suspeitas de que muitos destes documentos depositados pelos autores violam os acordos de direitos com os periódicos, porém são indexados pelo Google Scholar. Segundo um recente artigo4 do Scientometrics, estima-se que cerca de 40% dos PDF depositados no ResearchGate violam os acordos de copyright.

Minha opinião

A quantidade de documentos em texto completo de acesso livre que é possível recuperar com estas ferramentas tem como limite superior o total indexado pelo Google Scholar e como limite inferior os documentos de acesso “legal” que se recuperam com OAIster e OA button, etc.

Lamentavelmente, devido à extensa distribuição de documentos em milhares de lugares diferentes, e à falta de consistência das normas com que trabalham os agregadores de dados, nenhum método é 100% confiável e nem consistente para encontrar todos os textos completos em acesso aberto.

Dado que estas ferramentas são muito novas, com apenas dois ou três anos de desenvolvimento, minha decisão é que Google Scholar button e Unpaywall button são as mais eficazes.

Fonte: Texto de Ernesto Spinak para Blog Scielo em Perspectiva

21 de junho de 2017

Publicado por Priscila Jacobsen