15.03.16 - Notícia: Entidades pretendem melhorar qualidade de dados sobre biodiversidade

10 de março de 2016

Elton Alisson | Agência FAPESP

A quantidade de dados sobre a biodiversidade – como a ocorrência de espécies de animais e plantas em uma determinada região do planeta – vem aumentando exponencialmente nos últimos anos em razão da disponibilização cada vez maior na internet das coleções de museus e de observações em campo, por exemplo.

Grande parte desses dados, no entanto, não pode ser usada porque apresenta problemas de qualidade: as espécies não foram coletadas ou transcritas de forma correta ou faltam informações como as coordenadas geográficas do local onde foram feitas as observações.

A fim de melhorar a qualidade desses dados sobre biodiversidade para que possam ser utilizados em estudos sobre taxonomia (classificação), conservação e respostas às mudanças climáticas, entre outros, entidades científicas internacionais, como o Biodiversity Information Standards (TDWG), estão tentando estabelecer um conjunto de normas e diretrizes para o registro e a troca de dados sobre organismos em todo o mundo por meio de plataformas como o Sistema Global de Informação sobre a Biodiversidade (GBIF, na sigla em inglês).

“A preocupação com a qualidade de dados tem aumentado porque agora temos uma quantidade muito maior de informações, muitas das quais potencialmente com problemas”, disse Antonio Mauro Saraiva, professor da Escola Politécnica da Universidade de São Paulo (Poli-USP) e coordenador do Research Center on Biodiversity and Computing (BioComp), à Agência FAPESP.

“Por termos cada vez mais dados, também há mais pesquisadores buscando respostas para perguntas que podem estar erradas, uma vez que parte dos dados usados está inadequada”, avaliou o pesquisador que coordena um grupo de trabalho integrado por membros do TDWG e do GBIF voltado a melhorar a qualidade de dados sobre biodiversidade no mundo para que possam ser usados para diferentes propósitos.

O pesquisador foi um dos organizadores do evento “Biodiversity Data Quality Symposium: developing a commom framework to improve fitness for use of biodiversity data”, realizado no dia 8 de março, na FAPESP.

Durante o evento, representantes do TDWG e do GBIF apresentaram os mais recentes avanços obtidos pelo grupo de trabalho.

Um dos avanços foi estabelecer um conceito de qualidade de dados – uma vez que não há uma definição padronizada – adequado ao seus diferentes usos.

“O conceito de qualidade de dados varia de acordo com o usuário e com a finalidade do uso”, disse Arthur Chapman, coordenador do Australian Biodiversity Information Services.

“Se um dado é bom ou não, depende da finalidade para a qual será usado”, disse o pesquisador que coordena o grupo de trabalho conjunto sobre qualidade de dados do TDWG e do GBIF juntamente com Saraiva.

Para uso em pesquisas sobre modelagem da distribuição de uma determinada espécie de planta ou animal, por exemplo, alguns dos requisitos de qualidade dos dados são o registro do nome científico e das indicações da latitude e da longitude do local onde a espécie foi coletada, entre outros, exemplificou o pesquisador.

Com base nessas constatações – de que o conceito de qualidade de dado sobre biodiversidade varia de acordo com o usuário e a finalidade de uso –, o grupo de trabalho chegou à conclusão de que é possível aferir o padrão de qualidade e buscar melhorá-lo de acordo com a aplicação específica.

A fim de avaliar essa hipótese eles realizaram, em 2015, dois estudos de caso de qualidade de dado adequados ao uso, sendo um sobre modelagem de distribuição de espécies e outro sobre biodiversidade agrícola.

Os dois estudos de caso resultaram em relatórios disponibilizados on-line com um conjunto de recomendações e indicações de prioridades para melhorar a qualidade e o acesso aos dados nessas duas áreas.

Para este ano está prevista a realização de um terceiro estudo de caso sobre espécies exóticas invasoras.

“A aplicação do conceito de qualidade de dados de biodiversidade baseado no perfil de uso permite economizar tempo e diminuir a possibilidade de usar dados ruins”, disse Dmitry Schigel, pesquisador do programa de análise e uso de conteúdo do GBIF durante o evento.

De acordo com o pesquisador, o Brasil, que ainda não é membro pleno do GBIF, é um dos países com maior número de publicações na plataforma que permite o acesso livre a mais de 648 milhões de registros de onde foram colhidos ou observados mais de 1,6 milhão de espécies no mundo.

Há mais de 7,5 milhões de registros realizados por pesquisadores brasileiros no banco de dados global sobre biodiversidade, contou Schigel.

“Os pesquisadores do Brasil também são grandes usuários do GBIF. Eles já fizeram mais de 6,7 mil downloads de dados disponíveis no GBIF e já publicaram 76 artigos na plataforma desde que foi criada, em 2008”, afirmou.