A estatística classicamente ensinada nos diversos cursos superiores pertence a uma divisão denominada de Estatística Frequentista, que difere em alguns pontos de outras duas escolas dentro da estatística moderna: Estatística Bayesiana e Algortimos de Aleatorização, trataremos destes dois últimos em outros posts.
Dentro da Estatística Frequentista faz-se muita confusão sobre o que significa o valor de p. Muitos livros textos de estatística costumam utilizar definições como: “Probabilidade de Erro Tipo 1, ou seja, Rejeitar H0 quando ela é verdadeira”.
Se você, caro Leitor do Pós-Graduando, tem dificuldade de entender essa definição, não se preocupe, ela não é uma definição intuitiva e nada clara de fato, é uma frase bem charmosa e enigmática, que passa longe de ser compreendida prontamente, felizmente há outra maneira muito mais simples de definir o p estatístico, talvez poderíamos chamá-la de uma definição heurística, no sentido de que embora menos “rigorosa”, é de muito mais fácil apreensão e consideravelmente mais intuitiva, e possui sentido lógico idêntico ao da enigmática frase anteriormente expressa.
Para isso vamos pegar um exemplo super simples, de um parágrafo apenas.
Digamos que você esteja conduzindo um estudo que visa comparar a eficiência de dois meios de cultivo para fungos, sua hipótese é que o meio de cultura A é mais eficiente que o B, conduzindo um desenho experimental adequado você verificou que o meio de cultivo A deu biomassa média de 4.2g, e para o meio de cultivo B o resultado foi 3.1g.
Temos 2 perguntas:
Primeira pergunta: Há diferenças entre os meios de cultura no que diz respeito à sua eficiência em promoção de ganho de biomassa seca em fungos?
SIM, claro que há diferenças, 4.2 é diferente de 3.1, então há diferenças.
AGORA ESPERE UM POUCO, a segunda pergunta é A pergunta: “Qual a chance ou probabilidade de o efeito ou diferença observado ser devido ao acaso?”
A resposta para esta pergunta é o p estatístico. O valor de p é uma probabilidade, portanto, varia entre 0 e 1. Digamos que no exemplo acima depois de feitas as análises estatísticas adequadas o pesquisador encontrou um valor de p=0.95. O que concluir? Significa que a chance dessa diferença entre as médias ser devida ao acaso (e não por algum efeito real de diferença nas eficiências dos meios de cultura) é de 95%.
Assim, se concluirmos que existe algum processo real estruturando essa diferença, temos 95% de chances de estarmos enganados, ou dito de outra maneira, se você disser que o meio de cultura A, que rendeu 4.2g, é mais eficiente que o outro meio de cultura para ganho de massa seca em fungos, você tem 95% de chances de estar tirando uma conclusão errada.
Adota-se frequentemente o valor crítico como sendo p=0.05, ou seja, não queremos ter mais que 5% de chance de tirarmos uma conclusão errada a respeito de um efeito observado em um experimento ou estudo. De onde veio esse valor 0.05? Pura convenção, não há regra absoluta de maneira alguma para isso.
Portanto, o valor de p (em todo e qualquer teste estatístico dentro da Estatística Frequentista) é sempre: a chance ou probabilidade de o efeito (ou diferença) observado ser devido ao acaso, por isso é perigoso interpretarmos apenas os dados “brutos” sem um tratamento estatístico adequado que propicie um valor de p para suas hipóteses.
Na boa, pode não ser a definição exata como o autor ressaltou, mas é a primeira vez que eu entendo de verdade o que é um p, parabéns ao autor e ao pós-graduando.
Obrigado Marcos, a ideia é essa, depois de apreender esse conceito mais intuitivo, aí sim você avança pra parte mais formal, Einstein dizia que se você não consegue explicar um conceito científico para sua avó, então, você ainda não o domina perfeitamente, prezamos por essa simplicidade nas definições, embora percamos em rigor matemático algumas vezes, abraço!
Genteee, que clareza, por um momento me pareceu até que estatística é fácil de entender! Pq q os professores de estatística não explicam assim? Adorei. O Dr. Heury dá cursos tb?
Oi Ana Paula, obrigado pelas palavras. Na Yalo Ministramos sim cursos para diversas áreas, o próximo previsto será em Agosto em São Luís-MA com o enfoque em bioestatística. Que bom que tenha gostado e aprendido agora a interpretar intuitivamente o p, abraço!
Definição heurística, adoreeiiii!rs Heury Ferr não sei se vc mudou sua opinião em relação a isso, mas vc meu caro é um professor nato, continue usando esse seu método heuristico único, dando sentido ao que para a maioria não faz o menor sentido.
P.S. sempre quis saber de onde veio essa historia do p=0,05, thank’s!!rs
Mary obrigado pelos comentários, é sempre muito desafiador tentar traduzir conceitos matemáticos abstratos em idéias simples, perde-se as vezes bastante em rigor, mas ganha-se muito em compreensão intuitiva, que a meu ver é o primeiro passo no aprendizado de conceitos aparentemente complexos : ) Fique de olho em nossa coluna aqui, muitas boas surpresas virão.
Grande Marcelo Alves, agradeço seus comentários, veja, há uma pequena confusão no seu argumento, não estamos dizendo que o p é a probabilidade da hipótese ser falsa, na estatística frequentista isso não existe de fato, apenas na estatística bayesiana (repare que você argumentou que testes estatísticos não resultam em prob da hipótese ser falsa, SIM RESULTAM, na estatistica bayesiana), estamos falando aqui de maneira não formal sobre a idéia de “reliability” do resultado encontrado, termo utilizado pela primeira vez por Brownlee 1960, essa é uma das melhores interpretações de p que um pesquisador (não um estatístico) pode fazer, vou reproduzir pra você na integra abaixo a interpretação da qual o texto fala, retirada da documentacao em pdf e do Help do Statistica (da Statsoft), que foi produzido e programado por grandes estatísticos no mundo atual, há diversos outros livros texto e artigos com definições idênticas, me aterei aqui apenas ao texto abaixo que é suficientemente claro:
What is “statistical significance” (p-level). The statistical significance of a
result is an estimated measure of the degree to which it is “true” (in the sense
of “representative of the population”). More technically, the value of the p-level (the term first used by Brownlee,
1960) represents a decreasing index of the reliability of a result. The higher
the p-level, the less we can believe
that the observed relation between variables in the sample is a reliable
indicator of the relation between the respective variables in the population.
Specifically, the p-level represents the probability of error that is involved
in accepting our observed result as valid, that is, as “representative of the
population.” For example, a p-level of
.05 (i.e.,1/20) indicates that there is a 5% probability that the relation
between the variables found in our sample is a “fluke.”
Oh Dr. Heury, parabéns pela paciência com esses ignorantes aí e pelo excelente texto valeu? Show tchê, top d+!
Para uma definição mais pormenorizada dessa interpretação vejam o texto abaixo:
What is “statistical significance” (p-level). The statistical significance of a
result is an estimated measure of the degree to which it is “true” (in the sense
of “representative of the population”). More technically, the value of the p-level (the term first used by Brownlee, 1960) represents a decreasing index of the reliability of a result. The higher the p-level, the less we can believe
that the observed relation between variables in the sample is a reliable
indicator of the relation between the respective variables in the population.
Specifically, the p-level represents the probability of error that is involved
in accepting our observed result as valid, that is, as “representative of the
population.” For example, a p-level of .05 (i.e.,1/20) indicates that there is a 5% probability that the relation between the variables found in our sample is a “fluke.”
Statsoft Search (2010) What is “statistical significance” (p-level). Publishing on Help Page – Elementary Concepts.
Brownlee, K. A. (1960). Statistical Theory and Methodology in
Science and Engineering. New York: John Wiley.
O colega Marcelo Alves se confundiu um pouco e se precipitou ao criticar o texto, o p é sim um índice decrescente da “reliability” do resultado, e se a correlação ou diferença não possui alta “reliability” ela é espúria, portanto, devida ao acaso, a melhor interpretação é: p alto indica que a confiabilidade sobre o meu resultado é baixa, logo ele não se deve ao efeito que busquei mensurar, mas sim ao acaso com grande chances (que é mesmo que dizer que a hipótese nula é verdadeira com elevada probabilidade, por elevada o autor salientou bem, p>0.05, convencioado), o autor do texto não falou em momento algum na probabilidade da hipótese ser falsa (e isso existe SIM MARCELO, no mundo bayesiano, não no frequentista, conforme salientou o autor), então não vejo nenhuuma falha lógica no texto, eu conhecia o texto de Brownlee mas não sabia que a Statsoft utilizava isso no Help do statistica, acabei encontrando aqui vasculhando o help do mesmo, parabéns ao autor pelo texto, e a statsoft por citacoes e definições nao formais num help utilizado por não especialistas, e ao pos-graduando pelo excelente espaco de discussao, abraço a todos!
… só pra complementar, além das fontes citadas pelo Dr. Heury Ferreira, encontrei a mesma definição independente aqui:
“the p-value represents the probability of error that is involved in accepting our observed result as valid”, exatamente como disse o texto, é uma boa interpretação para leigos, vou passar a usá-la em minhas aulas de estatística tb 🙂
Obrigado, fique atento a nossa sessão, mais coisas legais estão por vir : )
Que é isso companheiro, esse Heury Ferreira é um cara muito educado pela resposta que ele te deu, eu mandaria você ir estudar mais, que barbaridade tchê, como não tem teste estatistico com probabilidade da hipotese ser falsa, tu nunca estudou bayesiana não amigo? Eu fiz estágio já na STATSOFT do Brasil, e a primeira coisa q eles fazem na primeira semana foi nos ensinar o conceito de p como o autor do texto citou, ta de parabens o pos-graduando, e Marcelo Alves, desculpa qrido, mas vai estudar mais antes de sair criticando o que não entende tchê!
Cara, definição muitooo massa, fiz estágio na statsoft uma época, e lá nos ensinaram a pensar o p exatamente assim, quando os caras falaram: “o p que vcs aprenderam na faculdade, esqueçam”, eu quase saltei da cadeira, aí vi que eles chamam o p de uma mensuração do grau da “verdade” do efeito observado, exatamente isso que o autor falou no texto, po, não sabia que no Brasil tinha nego afiado nesses macetes assim, top texto, SHOW, e quem criticar isso aí TEM QUE ESTUDAR MUITO MAIS!