Como descomplicar a Biodiversidade com ajuda da Estatística e do R (e se divertir com isso!)

Sim, o título é sério! E não, não estou ficando completamente doido ao falar isso. 😉

Certo, tenho que concordar que o título ali em cima pega bem pesado: primeiro, falo da estatística como algo que pode simplificar a vida de alguém que trabalha com Biologia. E depois ouso dizer que isso pode ser divertido, usando o R ainda por cima! Coisa de gente doida?! Veremos… Por enquanto, quero que você respire fundo, deixe de lado tudo o que já te assustou na Estatística e no R, e me acompanhe com calma, pois  espero conseguir te convencer disso tudo – pelo menos um pouquinho!

A estatística como ferramenta

Como você escolhe uma ferramenta? Bom, normalmente nós olhamos na caixa aquela que for mais adequada para o que precisamos — daí escolhemos e usamos. E aí, se você precisa fazer algo simples, como bater um prego, não vai pegar aquela super furadeira com trezentas opções de brocas que comprou do anúncio da televisão, não é? Mais ou menos o mesmo vale para os métodos estatísticos: você deve sempre usar, na medida do possível, o método mais simples e adequado para o seu problema.

Veja só: um dos maiores mitos que existem em torno da estatística aplicada à Biologia é que tudo se trata de complicar, usar os métodos mais sofisticados, apresentar aquelas fórmulas completamente cabulosas e testes complexos com nomes tão compridos que precisam ser resumidos em siglas do tipo “GLMMXYZ”… Mas isso é, de fato, um mito! Para nós, cientistas e profissionais que estudam biodiversidade, a estatística deve ser apenas uma ferramenta, nada mais. E, como ferramenta, ela deve ajudar o pesquisador: deve ser capaz de fazer com que ele entenda os seus dados, por mais complexos que eles sejam. Deve, então, descomplicar as coisas! 😉

Estatística sem (muita) matemática!

Tendo isso em mente, podemos dar mais um passo: será que precisamos entender um monte de matemática para dominar métodos estatísticos? A resposta, como você já deve estar adiantando, é não. Ufa!

O que acontece é que saber matemática ajuda sim a entendermos como os métodos estatísticos funcionam — mas ela não é essencial para se começar. O que acontece é que o nosso ponto de partida para entender e dominar estes métodos pode ser outro: as suas aplicações práticas. A melhor maneira de se começar a aprender estatística é justamente começar pelo seu uso. Para que eu preciso deste tal de “teste T”? Pra que ele serve? Quando devo usá-lo? Quando ele não é adequado? Como interpretar corretamente o seu resultado?

Sendo eu mesmo um Biólogo, e ensinando estatística para alunos de Biologia, eu rapidamente percebi que este ponto é fundamental. O aprendizado funciona muito melhor quando olhamos para um método do ponto de vista prático, com exemplos de verdade e pensando em suas aplicações reais. Se estudar estatística é uma dor de cabeça para você, pode ser que o problema seja começar pela matemática. Se for este o seu caso, então comece a pensar diferente, e siga o caminho mais prático.

E chega o tal do R…

Para muita gente, trabalhar com estatística no R é o supra sumo da dor de cabeça! Você já tem dificuldade em entender os métodos, e de quebra precisa aprender a programar?! É isso mesmo? Bom, na verdade não é não, ainda bem!

Veja bem, o R é sim um ambiente e linguagem de programação, e isso é uma das características importantes dele. Mas você não precisa saber programar para usá-lo, pois uma das essências do R é que ele é colaborativo: um monte de gente já programou (e continua a programar) a aplicação de diversos métodos estatísticos para o R. Então nós, usuários comuns e meros mortais, precisamos apenas entender o básico do programa e de seu funcionamento em linha de comando (no qual temos que escrever os comandos, no lugar das familiares “clicadas”). Sabendo isso, ele se torna apenas mais um programa — mas um que é muito maior, mais dinâmico e completo que todos os outros!

De novo, começando com aplicações

O segredo para se aprender o R com tranquilidade é, de novo, começar por aplicações. No lugar de tentar entender o que são tipos de objetos e outras coisas um pouco mais abstratas, é muito mais interessante tentar entender um passo-a-passo da aplicação de um teste simples, por exemplo. Aliás, uma das coisas legais é que você pode usar o próprio R para se aprender os métodos! Como a sua dinâmica é normalmente bem modular, com cada etapa sendo feita por um comando, então ele acaba tendo um potencial didático muito grande, que eu adoro explorar quando ensino estatística.

E depois do básico, um mundo inteiro se abre

Uma das coisas fenomenais de se usar o R é que o seu processo de desenvolvimento colaborativo faz com que diversos pesquisadores, em muitas áreas e de vários lugares do mundo, estão constantemente programando novas funções, implementando novos métodos. Isso faz com que o usuário, mesmo o usuário comum que não manja nada de programação, tenha à sua disposição um leque imenso de métodos em constante desenvolvimento, sem precisar aprender novos programas a cada vez que precisar de algo novo.

Isto acaba fazendo valer a pena, e muito, passar pelo esforço inicial de se aprender a usar o R. Por mais que eu diga (e digo com muita convicção) que ele não é tão difícil quanto parece, e sim apenas bem diferente, é claro que aprender a usá-lo demanda um pouco de empenho — principalmente para quem está começando. Mas é um esforço que vale muito, mas muito mesmo a pena. Aprender a trabalhar com o R acaba te tornando mais independente e dinâmico, e com o tempo você nota que ele é uma das ferramentas computacionais mais incríveis que qualquer pessoa que trabalhe com biodiversidade (ou qualquer outro tema na biologia, na verdade) poderia precisar.

Quer um exemplo? Lá vai!

Se você já lida um pouco com dados de biodiversidade, certamente já ouviu falar das curvas de acúmulo de espécie (curvas do coletor, curvas de rarefação etc) e dos estimadores de riqueza de espécies. E talvez você já tenha até calculado essas coisas em algum outro programa, não foi? Estes são métodos muito úteis quando sabemos como usá-los e quais as suas limitações. Mas também são apenas a pontinha de um mundo de possibilidades.

Uma das pesquisadoras mais importantes da área, a Anne Chao, recentemente publicou, com a sua equipe, vários artigos com métodos novos de estimativa de riqueza de espécies. São métodos super bacanas (e bem intuitivos de se entender, o que é ótimo) de extrapolação da curva de acúmulo de espécies. Permitem você responder perguntas como: se eu continuasse a coletar, e dobrasse o meu esforço amostral, quantas espécies encontraria? Estou falando aqui de métodos com artigos publicados nos últimos dois anos, coisa bem nova (o artigo mais recente sobre isso é deste ano de 2016 mesmo!). E, é claro, não é surpresa nenhuma: ela os implementou no R.

Este exemplo não é isolado: o R acabou se transformando em um laboratório de novos métodos, e isso é uma coisa muito boa para quem consegue usá-lo.

E a diversão, cadê?

Pois é, eu falei em diversão! Bom, pode parecer coisa de doido, mas uma das boas maneiras de aprendermos estes assuntos, é transformarmos o aprendizado em algo prazeroso, que dê satisfação. Isso normalmente não é difícil quando estudamos um assunto do qual gostamos muito, por exemplo. E é aqui que está o segredo. Quando começamos a olhar para a estatística e para o R como ferramentas úteis, e a aplicá-los a problemas reais, começamos a nos sentir satisfeitos quando as coisas dão certo. E aí começa um ciclo quase sem fim: você executa e aprende, tudo junto, e vai se empolgando. Uma vez empolgado, se sente mais seguro, mais animado, e segue adiante. E aí, o céu é o limite…

Por onde começar?

São tantas maneiras que é difícil escolher a melhor. Normalmente, alguém que tem pouco ou nenhum contato deveria começar com um curso ou disciplina, que ajude a dar os primeiros passos. O ideal é pensar em cursos práticos, que lidem com coisas que você estude e quer entender.

Outra alternativa é partir para material didático como tutoriais e apostilas, existe muita coisa disponível por aí. Eu mesmo disponibilizo algum material no meu blog, o Cantinho do R.

O mais importante é superar a estranheza inicial que o R causa, e deixar de lado aquele medo de números que nós da Biologia normalmente temos. Mergulhe de cabeça, e a recompensa vai ser fantástica!

***

Assista à entrevista gravada pelo Vinicius Rodrigues (hoje do IPÊ) com o Prof. Marcos Vital em 2015, na qual ele conta um pouco da história do R:

Participe do Workshop Online e Gratuito (5 a 11 de março) ➔

 

 

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.