Ciência e inferência. Parte III: O bom e velho reverendo

Título: Ciência e inferência. Parte III: O bom e velho reverendo

Fonte: Publicado originalmente no Bule Voador em 15 de março de 2013.

bayesEm 1763 foi encaminhado para publicação, por Richard Price, aquele que viria a ser conhecido como o famoso ‘Teorema de Bayes’ [1] (“An Essay towards solving a Problem in the Doctrine of Chances”) envolvendo as chamadas ‘probabilidades condicionais’ entre eventos dependentes uns dos outros. Os métodos derivados deste simples teorema adquiriram grande importância, tornando-se muito comuns entre biólogos evolutivos (tanto entre os geneticistas de populações como entre os especialistas em filogenia), como também sendo amplamente empregados por astrofísicos, especialistas em bioinformática, genômica e proteômica, além de serem muito utilizados na medicina diagnóstica, análise de risco e tomada de decisões estratégicas etc.

 Figura_007_Bayes

O autor do teorema, o matemático Thomas Bayes(que morrera dois anos antes da publicação de seu teorema), um obscuro clérigo presbiteriano, não deveria fazer ideia da importância que este pequeno teorema adquiriria. Muito menos teria antecipado, que tal teorema inspiraria uma nova abordagem filosófica de inferência científica, o ‘Bayesianismo’ (‘Epistemologia Bayesiana’) [4] que muitos dizem na realidade destoar bastante das intuições iniciais de Bayes. Alguns autores, na realidade, apontam que algumas das estratégias estatísticas mais bem sucedidas derivadas do teorema, como o ‘Bayes Hierárquico’, ao invés do viés indutivista dos Bayesianos, teria muito mais relação com o modelo hipotético-dedutivo [2]. Isso mostra que, apesar das aplicações serem inúmeras e seu emprego altamente disseminado, as interpretações para o teorema e seu papel como base da inferência científica são extremamente debatidos, dividindo os estatísticos, filósofos da estatística, filósofos da ciência e cientistas em dois campos, os dos ‘Frequencistas’ e os dos ‘Bayesianos’ [3].

Naquilo que alguns entendem como uma verdadeira ‘máquina de fazer salsichas inferencial’*–em que se põem as informações prévias em favor a uma dada hipótese em um lado , as novas evidências em outro e espera-se a saída, por um terceiro, da atualização do nosso grau de confiança/crença na hipótese – a abordagem Bayesiana, apesar de controversa, tem um forte apelo intuitivo. Ela, bem como algumas outras estratégias de inferência, parece capturar parte importante do racional por trás da  empreitada científica. Mas vai além disso. Parece remeter ao que fazemos quando agimos e decidimos a partir da avaliação da proporcionalidade das evidências em relação às hipóteses. Isto é, o Bayesianismo parece um bom modelo para forma como avaliamos as diversas hipóteses de acordo com a sua plausibilidade inicial – oriunda das considerações de nossos conhecimentos empíricos e teóricos prévios – e frente às novas evidências e como essas evidências aumentam ou diminuem a plausibilidade dela e de outras explicações alternativas.

bayes2

bayes4Os Bayesianos modernos utilizam o teorema como uma estratégia que possibilita a atualização da confiança (aumentando ou diminuindo) em uma dada hipótese. Assim, a partir da probabilidade inicial (a priori) desta determinada hipótese pode ser calculada a probabilidade posterior (a posteriori) desta mesma hipótese frente às novas evidências. A principal atração dessa versão de inferência apoiada no modelo Bayesiano é exatamente esta, ou seja, através do teorema, seria possível obter diretamente a probabilidade de uma hipótese dado certas evidências e mesmo comparar as probabilidades relativas de diferentes hipóteses em relação as mesmas evidências, transformando o processo de inferência em um cálculo probabilístico relativamente direto, mesmo que ainda existam vários problemas, principalmente, em se definir as probabilidades anteriores, ou seja, a priori, de qualquer hipótese.

Mas a esta altura o leitor poderia perguntar, ‘mas raios, não é exatamente isso o que se faz através dos testes de hipóteses estatísticos tradicionais? Aqueles em que se compara a hipótese de nulidade (H0) com uma hipótese alternativa (HA) e se obtêm um valor-p, teoricamente um medida do grau de confiança nesse resultado?’

 Respondendo de maneira muito direta: Não!

 Esta é, exatamente, a questão, e é onde entram as probabilidades condicionais e uma série de outras palavrinhas mágicas dos estatísticos como ‘verossimilhanças’ (likelihoods), ‘razões de verossimilhanças’, ‘probabilidades a priori e a posteriori’, ‘níveis de confiança’ e etc [Veja a referência [5]].

O que são probabilidades condicionais?

Probabilidades condicionais referem-se à probabilidade de um evento A sabendo que um outro evento B já ocorreu, sendo geralmente representadas por P(A|B), que é lido como a “probabilidade condicional de A dado B” ou ainda “probabilidade de A dependente da condição B”. Dentro da matemática, a P(A|B) é definida como:

Figura_005_Bayesb

dado P(B)>0

Desta forma a probabilidade de A muda após o evento B ter ocorrido, simplesmente porque o resultado de A é uma das possibilidades de B. Sendo preciso, portanto, calcular os eventos que são comuns a B e também a A, ou seja A ∩ B. Veja o exemplo da wiki com as cartas do baralho:

É importante notar que caso os acontecimentos sejam independentes, isto é, quando P(A∩ B)=P(A) x P(B):

Figura_006_Bayes

De forma que o que ocorre a B não tem qualquer efeito sobre a probabilidade de  A acontecer, já que P(A|B)=P(A) e P(B|A)=P(B).

O Teorema de Bayes

Através do teorema de Bayes, são relacionadas as probabilidade de A e B com as respectivas probabilidades condicionadas mútuas:

Figura_007_Bayes

Isso nos leva a chamada ‘falácia da probabilidade condicional’ (ou ‘confusão do inverso‘) que consiste em supor que P(A|B) é igual a P(B|A), quando isso só seria verdadeiro de acordo com o teorema de Bayes caso A e B tivessem a mesma probabilidade. Ignorar este pequeno detalhe leva a várias falácias altamente perniciosas com implicações sérias em questões legais e de saúde, como a ‘confusão do inverso’, a ‘falácia do promotor’ e a ‘falácia da linha de base’ Todas elas sendo formas da ‘falácia da probabilidade condicional’ que eu já havia comentado. De fato, uma das principais aplicações do teorema de Bayes em manuais de estatística envolve a determinação da real chance de um indivíduo estar infectado com uma dada doença após ter sido diagnosticado positivamente em um teste que não é 100% confiável, como nenhum é. A tendência natural de muitas pessoas é simplesmente ignorar a incidência geral da doença na população e aceitar o resultado do teste em seu valor de face, mas uma consideração do Teorema de Bayes e das probabilidades anteriores (a priori, ou ‘priors’) mostra como isso é errado.

bayes8

Voltando à questão dos testes de hipóteses frequencistas, compreendemos melhor o tipo de resultado que obtemos com eles ao analisarmos mais atentamente o que é realmente um valor-p e o que realmente é testado nos testes de hipóteses tradicionais, a hipótese de nulidade (H0). Geralmente, a hipótese de nulidade é bem desinteressante. Algo, por exemplo, como a ideia de que não existem diferenças ‘reais’ entre duas médias ou proporções e que, portanto, as diferenças seriam apenas decorrentes de flutuações ao acaso. Algo trivial, já que dificilmente obteríamos duas amostras com exatamente os mesmos valores e estatísticas. Assim, o valor-p nos dá a probabilidade de que, ao assumirmos que a hipótese de nulidade seja verdadeira (i.e. dado Ḥ0) encontremos valores iguais ou mais extremos aos obtidos. Este valores, por sua vez, geralmente são julgados com base em um valor arbitrário de referência, o alfa (α). Este valor normalmente por convenção ficaria entre 0,05 e 0,0001 e seria a base para rejeição ou aceitação de Ḥ0 . Note que em nenhum momento é testada a hipótese alternativa (HA) diretamente. Isto é, não obtemos a probabilidade daquela hipótese ser verdadeira dado aquelas evidências (E), isto é, P(HA|E), mas sim P(E|Ḥ0) que é a probabilidade daqueles dados ocorrerem partindo do princípio que a hipótese de nulidade está correta.** No entanto, métodos baseados em estatística Bayesiana e em verossimilhanças prometem quantificar diretamente o quão suportadas pelas evidências são as hipóteses que realmente queremos testar. Por isso o que o valor-p nos dá e os teses frequencistas nos dão está longe de ser equivalente ao que nós em geral queremos.***

Talvez o pior problema da escola de inferência Bayesiana seja a sua interpretação das probabilidades, chamada de subjetivista [3], em que as probabilidades bayesianas são interpretadas como graus de crença ou de confiança em uma dada hipótese. Vamos falar um pouco mais sobre isso no próximo artigo da série: “Ciência e inferência. Parte IV:  Probabilidades e probabilidades

____________________________________________________________

*Vale a pena o artigo de Desidério Murcho sobre o sonho de uma máquina de salsichas racional disponível no crítica na rede.

**Na realidade, ao empregarem-se testes de hipóteses tradicionais, existe a consciência implícita de que eles não nos dizem exatamente o que, em geral, queremos saber. São na verdade, os detalhes dos protocolos experimentais, especialmente dos diversos controles positivos e negativos, e evidências causais de outras natureza, é que acabam sendo os fatores que nos permitem, a partir da rejeição da hipótese de nulidade, depositarmos o mínimo de confiança na ideia que isso pende a balança para a hipótese alternativa. Mas esta falta de clareza pode ser bastante problemática e, portanto, não elimina as críticas dos Bayesianos à estratégia frequencista.

***Em alguns manuais de estatística, o processo de tentar rejeitar a hipótese de nulidade é comparado com a proposta Popperiana de falseamento de hipóteses, ideia que realmente estava presente na forma como Neyman e Pearson imaginavam sua abordagem. Porém, além de hoje em dia o que temos são uma versão hibrida das abordagens de Fisher e Neyman-Pearson para os testes estatísticos, é sempre bom lembrar que provavelmente Popper não tinha em mente, ao propor seu princípio, colocar a prova as mirradas hipóteses de nulidade. E muito menos a partir daí aceitar ou considerar isso uma forma de corroboração da hipótese alternativa.

————————————-

Este artigo é o terceiro da série de artigos ‘Ciência & Inferência’ que tem sido publicados no ‘Periódico Bule‘ do Bule Voador. Ele dá continuidade aos artigos “Ciência e inferência. Parte II: Popper e a tese do holismo” e “Ciência e inferência. Parte I: A dúvida de Hume e a solução de Popper.” e relaciona-se a outros artigos sobre metodologia científica e filosofia das ciências, como “A ciência como um jogo de pinball, “Ciência do Erro e o Erro na Ciência e “Método Científico?”.

____________________________________________

Referências:

[1]Joyce, James, “Bayes’ Theorem“, The Stanford Encyclopedia of Philosophy (Fall 2008 Edition), Edward N. Zalta (ed.)

[2]Gelman, Andrew, Shalizi, Cosma Rohilla Philosophy and the practice of Bayesian statistics. Submitted on 19 Jun 2010 (v1) (last revised 28 Jun 2011 (this version, v4))  arXiv:1006.3868v4.

[3]Hájek, Alan, “Interpretations of Probability“, The Stanford Encyclopedia of Philosophy (Summer 2012 Edition), Edward N. Zalta (ed.), forthcoming

[4]Talbott, William, “Bayesian Epistemology“, The Stanford Encyclopedia of Philosophy (Summer 2011 Edition), Edward N. Zalta (ed.)

[5]Pena, Sérgio Danilo ‘Bayes: ‘o cara’! Ciência Hoje • vol. 38 • No 228:22-29, 2006. [PDF]

[6]Hawthorne, James, “Inductive Logic“, The Stanford Encyclopedia of Philosophy (Winter 2011 Edition), Edward N. Zalta (ed.)

About rodveras

I'm a biologist and science writer who loves philosophy and sciences.
This entry was posted in Ciência, Filosofia, Filosofia da ciência, Uncategorized. Bookmark the permalink.

One Response to Ciência e inferência. Parte III: O bom e velho reverendo

  1. Pingback: EssaPor que deveríamos confiar nos cientistas? | calmaria&tempestade's Blog

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s