Compreendendo o valor de p na análise estatística

Existe uma grande confusão sobre o significado do valor de p na análise estatística. Infelizmente, muitos professores e pesquisadores, apesar de possuírem sólidos conhecimentos em suas áreas, apresentam algum grau de dificuldade em estatística, o que contribui para a disseminação de algumas dúvidas e até mesmo de certos equívocos.

Importância da análise estatística
Em primeiro lugar é preciso destacar a importância da estatística para as ciências empíricas. Neste tipo de pesquisa, ao invés de estudar uma população inteira, o que acarretaria em um gasto muito grande de dinheiro e tempo, o pesquisador seleciona uma parte desta população, que é chamada de amostra, e as conclusões do estudo desta amostra são extrapoladas para a população inteira.

Praticamos o método da amostragem em nosso cotidiano o tempo inteiro. Você, por exemplo, não toma toda a sopa de uma panela para descobrir se o tempero está bom. Você tira uma colher de sopa (amostra) para provar e pressupõe que o gosto da sopa toda estará igual ao da sopa na colher.

Entretanto, em ciência, ao trabalhar com amostras você corre alguns riscos. E se o tamanho da amostra não foi adequado? E se o método de avaliação apresentar falhas? E se tiver outros fatores influenciando os resultados encontrados?

Para diminuir esses riscos, os pesquisadores das ciências empíricas utilizam a estatística com o intuito de ter maior segurança em suas conclusões. E o valor de p está exatamente relacionado a essa confiança nas conclusões obtidas.

Esse tal “valor de p”
Não vou aqui discutir o valor de p em função das hipóteses H₀ e H₁, nem sobre fórmulas ou testes estatísticos. De um ponto de vista mais prático, podemos afirmar que o valor de p representa a chance ou a probabilidade do efeito (ou da diferença) observada entre os tratamentos/categorias ser devido ao acaso, e não aos fatores que estão sendo estudados.

Imagine que um pesquisador testou a eficiência de dois tratamentos e observou que a média do tratamento “A” foi maior que a média do tratamento “B”, e que após realizar as análises estatísticas adequadas, o pesquisador encontrou um valor de p=0,3. O que isso significa?

Significa que a chance dessa diferença entre as médias ser devido ao acaso (e não um efeito dos tratamentos) é de 30%. Ou seja, se o pesquisador afirmar que as diferenças entre as médias ocorreram por causa dos tratamentos, ele tem 30% de chances de estar enganado.

Analisando sobre outro ponto de vista, o da probabilidade, se o pesquisador realizar o mesmo experimento 100 vezes, ele irá encontrar resultados semelhantes em 70 experimentos.

Como toda probabilidade, o valor de p irá variar entre 0 e 1. Na grande maioria das áreas, admite-se um valor crítico de p menor ou igual a 0,05, ou seja, assume-se como margem de segurança 5% de chances de erro, ou olhando por outro ângulo, 95% de chances de estar certo.

Não caia nessa
A dificuldade na compreensão do significado do valor de p leva muitos pesquisadores a cometer alguns equívocos na hora de discutir os resultados ou mesmo nas conclusões do trabalho.

Voltemos ao exemplo do pesquisador que estudou dois tratamentos e observou uma média maior para o tratamento “A” em comparação ao tratamento “B”, com p=0,3. Suponhamos que na área deste pesquisador o valor de p aceitável também seja menor ou igual a 0,05, ou seja, admite-se uma margem de erro de até 5%.

Um erro muito comum nessa situação é realizar a seguinte discussão dos resultados:

“Embora a diferença estatística não seja significativa (p>0,05) a média do tratamento “A” foi 20% superior à média do tratamento “B”.”

Ora, no exemplo em questão o pesquisador tem 30% de chances de que essa diferença de 20% entre as médias não seja um efeito dos tratamentos e sim de outro fator que não está sendo estudado, sendo que o risco aceitável para essa área de estudo é de apenas 5%. Em resumo, o pesquisador nesse caso está atribuindo aos tratamentos uma diferença que tem grandes chances de ser obra do acaso, de ser um falso-positivo.

Nesse caso vale a pena conferir se a variação dos dados não foi muito grande, se o tamanho da amostra foi adequado, se houve algum problema com a metodologia, se delineamento experimental foi adequado, ou se não houve outros fatores além dos tratamentos estudados que influenciaram nos resultados.

Para saber mais: Não houve diferença estatística significativa. E agora?

Por Pós-Graduando|2015-11-12T19:38:55-03:0024-01-2012|guia|40 Comentários

Sobre o Autor: Pós-Graduando

Criador e editor de conteúdo do blog, é portador de uma imaginação hiperativa e de uma necessidade patológica de estar sempre bem-humorado. Acredita que a Pós-Graduação, como tudo na vida, pode ser interessante, divertida e descomplicada.

40 Comentários

[email protected] 16.12.12 at 15:50- Responder

Cara gostei da explicação, mas vc sabe me o que fazer quando os dados não possui distribuição normal? O que eu sei é que devemos normaliza-las, mas como??
- Charles 10.12.13 at 22:13- Responder
  
  Não sei especificamente quais são seus dados, e tão pouco posso me aprofundar muito. Mas de acordo com o que eu tenho estudado você pode sim normalizar seus dados. Aí estão alguns métodos, com certeza se pesquisar eles você vai encontrar detalhes. O único que eu usei foi o de transformação logarítmica.
  
  Se você trabalha com variáveis discretas você pode realizar a transformação:
  Com raiz quadrada x’ = raiz quadadra de x + 0,5 por exemplo.
  Transformar em porcentagem
  Transformação angular
  
  Se são variáveis contínuas
  Transformação logarítmica ***
  Transformação em Box- Cox
  
  Sou péssimo em estatística,mas espero que isso ajude.
- Pavel Dodonov 26.07.14 at 13:53- Responder
  
  Sobre dados não-normais:
  Vc pode usar um teste não-paramétrico (Mann-Whitney, Kruskal-Wallis, correlação de Spearman, Friedman…), esses testes não assumem normalidade;
  Ou fazer um teste por permutação ou Monte-Carlo, esses testes também não têm premissas de normalidade mas os resultados deles não são tão generalizáveis;
  Ou usar um modelo generalizado (GLM – generalized linear model) e especificar a distribuição dos dados nele.
  Ou transformar os dados.
  Ou seja, muitas possibilidades! 🙂
Thaís Oliveira 02.02.13 at 22:53- Responder

Muito boa explicação. Esclareceu tudo, obrigada.
Cleiziane Bispo da Silva 14.03.13 at 16:52- Responder

gostei!
R. Veloso 20.05.13 at 09:23- Responder

Parabéns pela explicação!
Angela Lima 11.10.13 at 08:10- Responder

O valor de p é quantitativo? Isto é, podemos dizes que quanto menor, maior a magnitude da associação?
- Pavel Dodonov 26.07.14 at 13:55- Responder
  
  Eu diria que tecnicamente, mais ou menos rs
  Sim, ele é quantitativo; mas ele não mede o efeito da associação (ou o tamanho do efeito).
  Quanto menor o p, menor a probabilidade da relação que vc encontrou ter sido causada pelo acaso. Mas dependendo da variação dos dados, uma correlação menos intensa pode ser mais significativa (menor p) do que uma correlação mais intensa. Tanto que já ouvi em bancas perguntas sobre o tamanho do efeito, porque apenas o valor do p não fala o quanto uma variável influencia a outra, apenas se essa influência pode ser atribuída ao acaso ou não.
Augusto 30.03.14 at 23:04- Responder

Olá !

Gostei bastante do artigo, só fiquei em dúvida sobre o que quer dizer com “acaso” na definição do valor p ? O que seria algo ao acaso ???

abraço
- Pavel Dodonov 26.07.14 at 14:00- Responder
  
  Tem um exemplo que eu gosto muito…
  (Espero que a equipe do pós-graduando não se incomode com eu respondendo as perguntas aqui! Não resisto a perguntas de estatística, rs)
  Pensando em um jogo de cara-e-coroa…
  Se vc joga uma moeda 100 vezes e tira 53 caras e 47 coroas, não tem nada de estranho nisso, certo? O pequeno desvio dos 50% de cara e 50% de coroa é esperado pelo acaso.
  Já se vc joga uma moeda 100 vezes e tira 90 caras e 10 coroas, tem algo de estranho aí… A moeda deve estar enviesada, porque é bem difícil um resultado assim acontecer pelo acaso.
  E se jogar a moeda 100 vezes e tirar tipo 31 caras e 69 coroas? A moeda está enviesada? Qual a probabilidade dela estar enviesada?
  A idéia do acaso é mais ou menos essa… Variação aleatória no processo que vc está estudando. Podemo ser arremessos de moeda, ou tamanho de plantas, ou taxa de movimentação de animais… Processos que têm uma certa variabilidade aleatória.
  - Maria Helena Finazzi 27.11.19 at 12:42- Responder
    
    Estou fazendo um trabalho sobre pés planos, cavos e normais e estou perdida. Um amigo me fez essas tabelas, mas não sei como interpretar isso. Do p<0,05 até deu para entender, mas os outros não entendi. Como você diz que não resiste responder problemas de estatística, peço sua ajuda.
Rafael 05.07.14 at 09:48- Responder

Muito bom, obrigado pela explicação.
Pedro 14.07.14 at 11:53- Responder

Muito didático,assim como em outros textos. Obrigado e parabéns!
Sue 20.08.14 at 07:20- Responder

E o Odds Ratio (OR)? O que significa p=0,0105 – Odds Ratio (OR)= 1,39 (IC 95% 1,09 – 1,79).
GOSTARIA SE POSSÍVEL, DE UMA EXPLICAÇÃO DE UMA FORMA BEM DIDÁTICA. Obrigada.
- Gabriela 15.09.15 at 15:14- Responder
  
  Odds ratio é a medida de risco em estudos de caso-controle. O resultado de 1,39 quer dizer que existe 1,39 vezes mais risco se a pessoa está exposta ao fator em estudo do que se não está exposta (relação positiva de associação, com aumento de risco). O intervalo de confiança mede qual o risco está dentro de 95% das análises, ou seja, 95% dos casos apresentaram entre 1,09 e 1,79 vezes mais risco de desenvolver o desfecho. O p de 0,0105, menor que 0,05, costuma ser o suficiente para garantir a confiança.
  - Diogo 09.10.15 at 22:20- Responder
    
    Meu Deus que explicação perfeita.
  - Sabrina Trindade 07.08.20 at 16:19- Responder
    
    Estou com dificuldades
    p=<0,05
    IC 95%
    o que significa
    se meu resultado foi para, exemplo:
    postura inadequada p = 1,00, OR = 1,2 e IC = 0,27 – 5,06
    má qualidade nas relações interpessoais p = 0,08; OR = 3,5; IC = 0,88 – 13,92
    podes me auxiliar?
- Gutemberg 29.01.18 at 04:44- Responder
  
  Concordo. Ótima explicação, Gabriela! Meus parabéns.
Érica Miranda 27.08.14 at 08:31- Responder

Ótimo esclarecimento!
Jorge Garcia 26.09.14 at 23:44- Responder

Parabéns pela explicação.
Muito didático!
Mariana 03.04.15 at 09:50- Responder

FANTÁSTICA EXPLICAÇÃO! OBRIGADA!
Felipe 28.04.15 at 10:37- Responder

Gostei do post, bem explicativo. Você teria algum link mostrando como calcular o p-value em R ou Excel? Obrigado.
Matheus 25.05.15 at 20:34- Responder

Muito obrigado pela explicação! É sempre bom aprendermos no sentido prático.
Marcia 25.05.15 at 23:13- Responder

Gostei muito da sua explicacao sobre o valor de p. Muito didatica, obrigada!!!
Paulo Melo 04.07.15 at 11:28- Responder

Parabéns pelo site amigo. Realmente consegue auxiliar de forma muito positiva aquelas pessoas que deram um salto além da faculdade.

“Não somos donos da verdade, por isso devemos disseminar conhecimento no sentido de ajudarmos uns aos outros para a partir disso contribuir para uma sociedade melhor para todos”. Paulo Melo 🙂
Anthunes 01.10.15 at 21:17- Responder

Boa explicação! Me ajudou muito…Obrigado.
Prof Bifi 31.10.15 at 19:03- Responder

Excelente! Vou estudar mais essa parada. Gistei!
Mariana 09.11.15 at 12:13- Responder

Adorei a explicação, super didática e esclareceu bem.
Paulo 10.11.15 at 13:35- Responder

Ótima explicação, mas me surgiu uma duvida: Feito o teste p, com a média das duas populações (por exemplo dois conjuntos de resultados), eu poderia depois, ao invés de pegar a média, utilizar o maior valor da população para apresentar o meu resultado.
Andreia 09.03.16 at 00:05- Responder

Explicação excelente! Obrigada!
Tamy 14.05.16 at 14:30- Responder

Olá pessoal! estou fazendo um trabalho sobre relação de aleitamaneto materno com obesidade, e o artigo que sigo como modelo tem isso escrito: Foram fatores de proteção contra sobrepeso e obesidade o aleitamento materno exclusivo por seis meses ou mais (IC 95% [0,38;0,86];OR=0,57; p=0,02). o que significa esse OR?
- Pós-Graduando 14.05.16 at 22:05- Responder
  
  IC = Intervalo de Confiança
  OR = Odds Ratio (é uma estimativa do risco relativo, particularmente indicada para estudos de caso-controle).
  😉
lais 31.10.16 at 11:50- Responder

Qual seria a melhor forma de discutir um resultado em que eu tenha um valor de p , por exemplo, igual a 0,3 então!?
Isabel 28.11.16 at 16:10- Responder

Muito obrigada pelas dicas!
Natália 30.11.16 at 23:51- Responder

Como posso analisar os dados de uma pesquisa onde a comparação entre dois grupos è estatisticamente significante e o tamanho do efeito é pequeno ???
Jorge Farha 11.04.18 at 08:08- Responder

Você descomplicou o estatistiquês. Explicou o conceito e exemplificou. Ficou fácil de entender.
Parabéns.
Tamara 04.06.18 at 16:00- Responder

Parabéns!!! Excelente. Encontrei aqui o que estava procurando. Simples e prático!
Sonia 29.11.18 at 09:48- Responder

Excelente!

Obrigada!
hélcio 31.03.20 at 22:37- Responder

Peço que me auxilie na compreensão do seguinte : Tenho um relatório que menciona que um determinado volume é significativo (mas não informa sua participação na amostra), posso entender que o P está compreendido entre 0,001 e 0,01 ?
MAURÍCIO FÁBIO GOMES 03.06.20 at 22:30- Responder

Porque meus dados levaram a um RR = 2,3 (IC = 1,04 e 3,68) ou seja, maior que 1,00, porém o valor de p ficou maior que 0,05?