• Compreendendo o valor de p na análise estatística

Compreendendo o valor de p na análise estatística

Existe uma grande confusão sobre o significado do valor de p na análise estatística. Infelizmente, muitos professores e pesquisadores, apesar de possuírem sólidos conhecimentos em suas áreas, apresentam algum grau de dificuldade em estatística, o que contribui para a disseminação de algumas dúvidas e até mesmo de certos equívocos.

Importância da análise estatística
Em primeiro lugar é preciso destacar a importância da estatística para as ciências empíricas. Neste tipo de pesquisa, ao invés de estudar uma população inteira, o que acarretaria em um gasto muito grande de dinheiro e tempo, o pesquisador seleciona uma parte desta população, que é chamada de amostra, e as conclusões do estudo desta amostra são extrapoladas para a população inteira.

Praticamos o método da amostragem em nosso cotidiano o tempo inteiro. Você, por exemplo, não toma toda a sopa de uma panela para descobrir se o tempero está bom. Você tira uma colher de sopa (amostra) para provar e pressupõe que o gosto da sopa toda estará igual ao da sopa na colher.

Entretanto, em ciência, ao trabalhar com amostras você corre alguns riscos. E se o tamanho da amostra não foi adequado? E se o método de avaliação apresentar falhas? E se tiver outros fatores influenciando os resultados encontrados?

Para diminuir esses riscos, os pesquisadores das ciências empíricas utilizam a estatística com o intuito de ter maior segurança em suas conclusões. E o valor de p está exatamente relacionado a essa confiança nas conclusões obtidas.

Esse tal “valor de p”
Não vou aqui discutir o valor de p em função das hipóteses H0 e H1, nem sobre fórmulas ou testes estatísticos. De um ponto de vista mais prático, podemos afirmar que o valor de p representa a chance ou a probabilidade do efeito (ou da diferença) observada entre os tratamentos/categorias ser devido ao acaso, e não aos fatores que estão sendo estudados.

Imagine que um pesquisador testou a eficiência de dois tratamentos e observou que a média do tratamento “A” foi maior que a média do tratamento “B”, e que após realizar as análises estatísticas adequadas, o pesquisador encontrou um valor de p=0,3. O que isso significa?

Significa que a chance dessa diferença entre as médias ser devido ao acaso (e não um efeito dos tratamentos) é de 30%. Ou seja, se o pesquisador afirmar que as diferenças entre as médias ocorreram por causa dos tratamentos, ele tem 30% de chances de estar enganado.

Analisando sobre outro ponto de vista, o da probabilidade, se o pesquisador realizar o mesmo experimento 100 vezes, ele irá encontrar resultados semelhantes em 70 experimentos.

Como toda probabilidade, o valor de p irá variar entre 0 e 1. Na grande maioria das áreas, admite-se um valor crítico de p menor ou igual a 0,05, ou seja, assume-se como margem de segurança 5% de chances de erro, ou olhando por outro ângulo, 95% de chances de estar certo.

Não caia nessa
A dificuldade na compreensão do significado do valor de p leva muitos pesquisadores a cometer alguns equívocos na hora de discutir os resultados ou mesmo nas conclusões do trabalho.

Voltemos ao exemplo do pesquisador que estudou dois tratamentos e observou uma média maior para o tratamento “A” em comparação ao tratamento “B”, com p=0,3. Suponhamos que na área deste pesquisador o valor de p aceitável também seja menor ou igual a 0,05, ou seja, admite-se uma margem de erro de até 5%.

Um erro muito comum nessa situação é realizar a seguinte discussão dos resultados:

Embora a diferença estatística não seja significativa (p>0,05) a média do tratamento “A” foi 20% superior à média do tratamento “B”.”

Ora, no exemplo em questão o pesquisador tem 30% de chances de que essa diferença de 20% entre as médias não seja um efeito dos tratamentos e sim de outro fator que não está sendo estudado, sendo que o risco aceitável para essa área de estudo é de apenas 5%. Em resumo, o pesquisador nesse caso está atribuindo aos tratamentos uma diferença que tem grandes chances de ser obra do acaso, de ser um falso-positivo.

Nesse caso vale a pena conferir se a variação dos dados não foi muito grande, se o tamanho da amostra foi adequado, se houve algum problema com a metodologia, se delineamento experimental foi adequado, ou se não houve outros fatores além dos tratamentos estudados que influenciaram nos resultados.

Para saber mais: Não houve diferença estatística significativa. E agora?

By |2015-11-12T19:38:55+00:0024-01-2012|guia|35 Comments

About the Author:

Criador e editor de conteúdo do blog, é portador de uma imaginação hiperativa e de uma necessidade patológica de estar sempre bem-humorado. Acredita que a Pós-Graduação, como tudo na vida, pode ser interessante, divertida e descomplicada.

35 Comments

  1. [email protected] 16.12.12 at 15:50 - Reply

    Cara gostei da explicação, mas vc sabe me o que fazer quando os dados não possui distribuição normal? O que eu sei é que devemos normaliza-las, mas como??

    • Charles 10.12.13 at 22:13 - Reply

      Não sei especificamente quais são seus dados, e tão pouco posso me aprofundar muito. Mas de acordo com o que eu tenho estudado você pode sim normalizar seus dados. Aí estão alguns métodos, com certeza se pesquisar eles você vai encontrar detalhes. O único que eu usei foi o de transformação logarítmica.

      Se você trabalha com variáveis discretas você pode realizar a transformação:
      Com raiz quadrada x’ = raiz quadadra de x + 0,5 por exemplo.
      Transformar em porcentagem
      Transformação angular

      Se são variáveis contínuas
      Transformação logarítmica ***
      Transformação em Box- Cox

      Sou péssimo em estatística,mas espero que isso ajude.

    • Pavel Dodonov 26.07.14 at 13:53 - Reply

      Sobre dados não-normais:
      Vc pode usar um teste não-paramétrico (Mann-Whitney, Kruskal-Wallis, correlação de Spearman, Friedman…), esses testes não assumem normalidade;
      Ou fazer um teste por permutação ou Monte-Carlo, esses testes também não têm premissas de normalidade mas os resultados deles não são tão generalizáveis;
      Ou usar um modelo generalizado (GLM – generalized linear model) e especificar a distribuição dos dados nele.
      Ou transformar os dados.
      Ou seja, muitas possibilidades! 🙂

  2. Thaís Oliveira 02.02.13 at 22:53 - Reply

    Muito boa explicação. Esclareceu tudo, obrigada.

  3. gostei!

  4. R. Veloso 20.05.13 at 09:23 - Reply

    Parabéns pela explicação!

  5. Angela Lima 11.10.13 at 08:10 - Reply

    O valor de p é quantitativo? Isto é, podemos dizes que quanto menor, maior a magnitude da associação?

    • Pavel Dodonov 26.07.14 at 13:55 - Reply

      Eu diria que tecnicamente, mais ou menos rs
      Sim, ele é quantitativo; mas ele não mede o efeito da associação (ou o tamanho do efeito).
      Quanto menor o p, menor a probabilidade da relação que vc encontrou ter sido causada pelo acaso. Mas dependendo da variação dos dados, uma correlação menos intensa pode ser mais significativa (menor p) do que uma correlação mais intensa. Tanto que já ouvi em bancas perguntas sobre o tamanho do efeito, porque apenas o valor do p não fala o quanto uma variável influencia a outra, apenas se essa influência pode ser atribuída ao acaso ou não.

  6. Augusto 30.03.14 at 23:04 - Reply

    Olá !

    Gostei bastante do artigo, só fiquei em dúvida sobre o que quer dizer com “acaso” na definição do valor p ? O que seria algo ao acaso ???

    abraço

    • Pavel Dodonov 26.07.14 at 14:00 - Reply

      Tem um exemplo que eu gosto muito…
      (Espero que a equipe do pós-graduando não se incomode com eu respondendo as perguntas aqui! Não resisto a perguntas de estatística, rs)
      Pensando em um jogo de cara-e-coroa…
      Se vc joga uma moeda 100 vezes e tira 53 caras e 47 coroas, não tem nada de estranho nisso, certo? O pequeno desvio dos 50% de cara e 50% de coroa é esperado pelo acaso.
      Já se vc joga uma moeda 100 vezes e tira 90 caras e 10 coroas, tem algo de estranho aí… A moeda deve estar enviesada, porque é bem difícil um resultado assim acontecer pelo acaso.
      E se jogar a moeda 100 vezes e tirar tipo 31 caras e 69 coroas? A moeda está enviesada? Qual a probabilidade dela estar enviesada?
      A idéia do acaso é mais ou menos essa… Variação aleatória no processo que vc está estudando. Podemo ser arremessos de moeda, ou tamanho de plantas, ou taxa de movimentação de animais… Processos que têm uma certa variabilidade aleatória.

  7. Rafael 05.07.14 at 09:48 - Reply

    Muito bom, obrigado pela explicação.

  8. Pedro 14.07.14 at 11:53 - Reply

    Muito didático,assim como em outros textos. Obrigado e parabéns!

  9. Sue 20.08.14 at 07:20 - Reply

    E o Odds Ratio (OR)? O que significa p=0,0105 – Odds Ratio (OR)= 1,39 (IC 95% 1,09 – 1,79).
    GOSTARIA SE POSSÍVEL, DE UMA EXPLICAÇÃO DE UMA FORMA BEM DIDÁTICA. Obrigada.

    • Gabriela 15.09.15 at 15:14 - Reply

      Odds ratio é a medida de risco em estudos de caso-controle. O resultado de 1,39 quer dizer que existe 1,39 vezes mais risco se a pessoa está exposta ao fator em estudo do que se não está exposta (relação positiva de associação, com aumento de risco). O intervalo de confiança mede qual o risco está dentro de 95% das análises, ou seja, 95% dos casos apresentaram entre 1,09 e 1,79 vezes mais risco de desenvolver o desfecho. O p de 0,0105, menor que 0,05, costuma ser o suficiente para garantir a confiança.

      • Diogo 09.10.15 at 22:20 - Reply

        Meu Deus que explicação perfeita.

    • Gutemberg 29.01.18 at 04:44 - Reply

      Concordo. Ótima explicação, Gabriela! Meus parabéns.

  10. Érica Miranda 27.08.14 at 08:31 - Reply

    Ótimo esclarecimento!

  11. Jorge Garcia 26.09.14 at 23:44 - Reply

    Parabéns pela explicação.
    Muito didático!

  12. Mariana 03.04.15 at 09:50 - Reply

    FANTÁSTICA EXPLICAÇÃO! OBRIGADA!

  13. Felipe 28.04.15 at 10:37 - Reply

    Gostei do post, bem explicativo. Você teria algum link mostrando como calcular o p-value em R ou Excel? Obrigado.

  14. Matheus 25.05.15 at 20:34 - Reply

    Muito obrigado pela explicação! É sempre bom aprendermos no sentido prático.

  15. Marcia 25.05.15 at 23:13 - Reply

    Gostei muito da sua explicacao sobre o valor de p. Muito didatica, obrigada!!!

  16. Paulo Melo 04.07.15 at 11:28 - Reply

    Parabéns pelo site amigo. Realmente consegue auxiliar de forma muito positiva aquelas pessoas que deram um salto além da faculdade.

    “Não somos donos da verdade, por isso devemos disseminar conhecimento no sentido de ajudarmos uns aos outros para a partir disso contribuir para uma sociedade melhor para todos”. Paulo Melo 🙂

  17. Anthunes 01.10.15 at 21:17 - Reply

    Boa explicação! Me ajudou muito…Obrigado.

  18. Prof Bifi 31.10.15 at 19:03 - Reply

    Excelente! Vou estudar mais essa parada. Gistei!

  19. Mariana 09.11.15 at 12:13 - Reply

    Adorei a explicação, super didática e esclareceu bem.

  20. Paulo 10.11.15 at 13:35 - Reply

    Ótima explicação, mas me surgiu uma duvida: Feito o teste p, com a média das duas populações (por exemplo dois conjuntos de resultados), eu poderia depois, ao invés de pegar a média, utilizar o maior valor da população para apresentar o meu resultado.

  21. Andreia 09.03.16 at 00:05 - Reply

    Explicação excelente! Obrigada!

  22. Tamy 14.05.16 at 14:30 - Reply

    Olá pessoal! estou fazendo um trabalho sobre relação de aleitamaneto materno com obesidade, e o artigo que sigo como modelo tem isso escrito: Foram fatores de proteção contra sobrepeso e obesidade o aleitamento materno exclusivo por seis meses ou mais (IC 95% [0,38;0,86];OR=0,57; p=0,02). o que significa esse OR?

    • Pós-Graduando 14.05.16 at 22:05 - Reply

      IC = Intervalo de Confiança
      OR = Odds Ratio (é uma estimativa do risco relativo, particularmente indicada para estudos de caso-controle).
      😉

  23. lais 31.10.16 at 11:50 - Reply

    Qual seria a melhor forma de discutir um resultado em que eu tenha um valor de p , por exemplo, igual a 0,3 então!?

  24. Isabel 28.11.16 at 16:10 - Reply

    Muito obrigada pelas dicas!

  25. Natália 30.11.16 at 23:51 - Reply

    Como posso analisar os dados de uma pesquisa onde a comparação entre dois grupos è estatisticamente significante e o tamanho do efeito é pequeno ???

  26. Jorge Farha 11.04.18 at 08:08 - Reply

    Você descomplicou o estatistiquês. Explicou o conceito e exemplificou. Ficou fácil de entender.
    Parabéns.

  27. Tamara 04.06.18 at 16:00 - Reply

    Parabéns!!! Excelente. Encontrei aqui o que estava procurando. Simples e prático!

Leave A Comment