A estatística classicamente ensinada nos diversos cursos superiores pertence a uma divisão denominada de Estatística Frequentista, que difere em alguns pontos de outras duas escolas dentro da estatística moderna: Estatística Bayesiana e Algortimos de Aleatorização, trataremos destes dois últimos em outros posts.

Dentro da Estatística Frequentista faz-se muita confusão sobre o que significa o valor de p. Muitos livros textos de estatística costumam utilizar definições como: “Probabilidade de Erro Tipo 1, ou seja, Rejeitar H0 quando ela é verdadeira”.

Se você, caro Leitor do Pós-Graduando, tem dificuldade de entender essa definição, não se preocupe, ela não é uma definição intuitiva e nada clara de fato, é uma frase bem charmosa e enigmática, que passa longe de ser compreendida prontamente, felizmente há outra maneira muito mais simples de definir o p estatístico, talvez poderíamos chamá-la de uma definição heurística, no sentido de que embora menos “rigorosa”, é de muito mais fácil apreensão e consideravelmente mais intuitiva, e possui sentido lógico idêntico ao da enigmática frase anteriormente expressa.

Para isso vamos pegar um exemplo super simples, de um parágrafo apenas.

Digamos que você esteja conduzindo um estudo que visa comparar a eficiência de dois meios de cultivo para fungos, sua hipótese é que o meio de cultura A é mais eficiente que o B, conduzindo um desenho experimental adequado você verificou que o meio de cultivo A deu biomassa média de 4.2g, e para o meio de cultivo B o resultado foi 3.1g.

Temos 2 perguntas:

Primeira pergunta: Há diferenças entre os meios de cultura no que diz respeito à sua eficiência em promoção de ganho de biomassa seca em fungos?

SIM, claro que há diferenças, 4.2 é diferente de 3.1, então há diferenças.

AGORA ESPERE UM POUCO, a segunda pergunta é A pergunta: “Qual a chance ou probabilidade de o efeito ou diferença observado ser devido ao acaso?”

A resposta para esta pergunta é o p estatístico. O valor de p é uma probabilidade, portanto, varia entre 0 e 1. Digamos que no exemplo acima depois de feitas as análises estatísticas adequadas o pesquisador encontrou um valor de p=0.95. O que concluir? Significa que a chance dessa diferença entre as médias ser devida ao acaso (e não por algum efeito real de diferença nas eficiências dos meios de cultura) é de 95%.

Assim, se concluirmos que existe algum processo real estruturando essa diferença, temos 95% de chances de estarmos enganados, ou dito de outra maneira, se você disser que o meio de cultura A, que rendeu 4.2g, é mais eficiente que o outro meio de cultura para ganho de massa seca em fungos, você tem 95% de chances de estar tirando uma conclusão errada.

Adota-se frequentemente o valor crítico como sendo p=0.05, ou seja, não queremos ter mais que 5% de chance de tirarmos uma conclusão errada a respeito de um efeito observado em um experimento ou estudo. De onde veio esse valor 0.05? Pura convenção, não há regra absoluta de maneira alguma para isso.

Portanto, o valor de p (em todo e qualquer teste estatístico dentro da Estatística Frequentista) é sempre: a chance ou probabilidade de o efeito (ou diferença) observado ser devido ao acaso, por isso é perigoso interpretarmos apenas os dados “brutos” sem um tratamento estatístico adequado que propicie um valor de p para suas hipóteses.