Existe uma grande confusão sobre o significado do valor de p na análise estatística. Infelizmente, muitos professores e pesquisadores, apesar de possuírem sólidos conhecimentos em suas áreas, apresentam algum grau de dificuldade em estatística, o que contribui para a disseminação de algumas dúvidas e até mesmo de certos equívocos.
Importância da análise estatística
Em primeiro lugar é preciso destacar a importância da estatística para as ciências empíricas. Neste tipo de pesquisa, ao invés de estudar uma população inteira, o que acarretaria em um gasto muito grande de dinheiro e tempo, o pesquisador seleciona uma parte desta população, que é chamada de amostra, e as conclusões do estudo desta amostra são extrapoladas para a população inteira.
Praticamos o método da amostragem em nosso cotidiano o tempo inteiro. Você, por exemplo, não toma toda a sopa de uma panela para descobrir se o tempero está bom. Você tira uma colher de sopa (amostra) para provar e pressupõe que o gosto da sopa toda estará igual ao da sopa na colher.
Entretanto, em ciência, ao trabalhar com amostras você corre alguns riscos. E se o tamanho da amostra não foi adequado? E se o método de avaliação apresentar falhas? E se tiver outros fatores influenciando os resultados encontrados?
Para diminuir esses riscos, os pesquisadores das ciências empíricas utilizam a estatística com o intuito de ter maior segurança em suas conclusões. E o valor de p está exatamente relacionado a essa confiança nas conclusões obtidas.
Esse tal “valor de p”
Não vou aqui discutir o valor de p em função das hipóteses H0 e H1, nem sobre fórmulas ou testes estatísticos. De um ponto de vista mais prático, podemos afirmar que o valor de p representa a chance ou a probabilidade do efeito (ou da diferença) observada entre os tratamentos/categorias ser devido ao acaso, e não aos fatores que estão sendo estudados.
Imagine que um pesquisador testou a eficiência de dois tratamentos e observou que a média do tratamento “A” foi maior que a média do tratamento “B”, e que após realizar as análises estatísticas adequadas, o pesquisador encontrou um valor de p=0,3. O que isso significa?
Significa que a chance dessa diferença entre as médias ser devido ao acaso (e não um efeito dos tratamentos) é de 30%. Ou seja, se o pesquisador afirmar que as diferenças entre as médias ocorreram por causa dos tratamentos, ele tem 30% de chances de estar enganado.
Analisando sobre outro ponto de vista, o da probabilidade, se o pesquisador realizar o mesmo experimento 100 vezes, ele irá encontrar resultados semelhantes em 70 experimentos.
Como toda probabilidade, o valor de p irá variar entre 0 e 1. Na grande maioria das áreas, admite-se um valor crítico de p menor ou igual a 0,05, ou seja, assume-se como margem de segurança 5% de chances de erro, ou olhando por outro ângulo, 95% de chances de estar certo.
Não caia nessa
A dificuldade na compreensão do significado do valor de p leva muitos pesquisadores a cometer alguns equívocos na hora de discutir os resultados ou mesmo nas conclusões do trabalho.
Voltemos ao exemplo do pesquisador que estudou dois tratamentos e observou uma média maior para o tratamento “A” em comparação ao tratamento “B”, com p=0,3. Suponhamos que na área deste pesquisador o valor de p aceitável também seja menor ou igual a 0,05, ou seja, admite-se uma margem de erro de até 5%.
Um erro muito comum nessa situação é realizar a seguinte discussão dos resultados:
“Embora a diferença estatística não seja significativa (p>0,05) a média do tratamento “A” foi 20% superior à média do tratamento “B”.”
Ora, no exemplo em questão o pesquisador tem 30% de chances de que essa diferença de 20% entre as médias não seja um efeito dos tratamentos e sim de outro fator que não está sendo estudado, sendo que o risco aceitável para essa área de estudo é de apenas 5%. Em resumo, o pesquisador nesse caso está atribuindo aos tratamentos uma diferença que tem grandes chances de ser obra do acaso, de ser um falso-positivo.
Nesse caso vale a pena conferir se a variação dos dados não foi muito grande, se o tamanho da amostra foi adequado, se houve algum problema com a metodologia, se delineamento experimental foi adequado, ou se não houve outros fatores além dos tratamentos estudados que influenciaram nos resultados.
Para saber mais: Não houve diferença estatística significativa. E agora?
Cara gostei da explicação, mas vc sabe me o que fazer quando os dados não possui distribuição normal? O que eu sei é que devemos normaliza-las, mas como??
Não sei especificamente quais são seus dados, e tão pouco posso me aprofundar muito. Mas de acordo com o que eu tenho estudado você pode sim normalizar seus dados. Aí estão alguns métodos, com certeza se pesquisar eles você vai encontrar detalhes. O único que eu usei foi o de transformação logarítmica.
Se você trabalha com variáveis discretas você pode realizar a transformação:
Com raiz quadrada x’ = raiz quadadra de x + 0,5 por exemplo.
Transformar em porcentagem
Transformação angular
Se são variáveis contínuas
Transformação logarítmica ***
Transformação em Box- Cox
Sou péssimo em estatística,mas espero que isso ajude.
Sobre dados não-normais:
Vc pode usar um teste não-paramétrico (Mann-Whitney, Kruskal-Wallis, correlação de Spearman, Friedman…), esses testes não assumem normalidade;
Ou fazer um teste por permutação ou Monte-Carlo, esses testes também não têm premissas de normalidade mas os resultados deles não são tão generalizáveis;
Ou usar um modelo generalizado (GLM – generalized linear model) e especificar a distribuição dos dados nele.
Ou transformar os dados.
Ou seja, muitas possibilidades! 🙂
Muito boa explicação. Esclareceu tudo, obrigada.
gostei!
Parabéns pela explicação!
O valor de p é quantitativo? Isto é, podemos dizes que quanto menor, maior a magnitude da associação?
Eu diria que tecnicamente, mais ou menos rs
Sim, ele é quantitativo; mas ele não mede o efeito da associação (ou o tamanho do efeito).
Quanto menor o p, menor a probabilidade da relação que vc encontrou ter sido causada pelo acaso. Mas dependendo da variação dos dados, uma correlação menos intensa pode ser mais significativa (menor p) do que uma correlação mais intensa. Tanto que já ouvi em bancas perguntas sobre o tamanho do efeito, porque apenas o valor do p não fala o quanto uma variável influencia a outra, apenas se essa influência pode ser atribuída ao acaso ou não.
Olá !
Gostei bastante do artigo, só fiquei em dúvida sobre o que quer dizer com “acaso” na definição do valor p ? O que seria algo ao acaso ???
abraço
Tem um exemplo que eu gosto muito…
(Espero que a equipe do pós-graduando não se incomode com eu respondendo as perguntas aqui! Não resisto a perguntas de estatística, rs)
Pensando em um jogo de cara-e-coroa…
Se vc joga uma moeda 100 vezes e tira 53 caras e 47 coroas, não tem nada de estranho nisso, certo? O pequeno desvio dos 50% de cara e 50% de coroa é esperado pelo acaso.
Já se vc joga uma moeda 100 vezes e tira 90 caras e 10 coroas, tem algo de estranho aí… A moeda deve estar enviesada, porque é bem difícil um resultado assim acontecer pelo acaso.
E se jogar a moeda 100 vezes e tirar tipo 31 caras e 69 coroas? A moeda está enviesada? Qual a probabilidade dela estar enviesada?
A idéia do acaso é mais ou menos essa… Variação aleatória no processo que vc está estudando. Podemo ser arremessos de moeda, ou tamanho de plantas, ou taxa de movimentação de animais… Processos que têm uma certa variabilidade aleatória.
Estou fazendo um trabalho sobre pés planos, cavos e normais e estou perdida. Um amigo me fez essas tabelas, mas não sei como interpretar isso. Do p<0,05 até deu para entender, mas os outros não entendi. Como você diz que não resiste responder problemas de estatística, peço sua ajuda.
Muito bom, obrigado pela explicação.
Muito didático,assim como em outros textos. Obrigado e parabéns!
E o Odds Ratio (OR)? O que significa p=0,0105 – Odds Ratio (OR)= 1,39 (IC 95% 1,09 – 1,79).
GOSTARIA SE POSSÍVEL, DE UMA EXPLICAÇÃO DE UMA FORMA BEM DIDÁTICA. Obrigada.
Odds ratio é a medida de risco em estudos de caso-controle. O resultado de 1,39 quer dizer que existe 1,39 vezes mais risco se a pessoa está exposta ao fator em estudo do que se não está exposta (relação positiva de associação, com aumento de risco). O intervalo de confiança mede qual o risco está dentro de 95% das análises, ou seja, 95% dos casos apresentaram entre 1,09 e 1,79 vezes mais risco de desenvolver o desfecho. O p de 0,0105, menor que 0,05, costuma ser o suficiente para garantir a confiança.
Meu Deus que explicação perfeita.
Estou com dificuldades
p=<0,05
IC 95%
o que significa
se meu resultado foi para, exemplo:
postura inadequada p = 1,00, OR = 1,2 e IC = 0,27 – 5,06
má qualidade nas relações interpessoais p = 0,08; OR = 3,5; IC = 0,88 – 13,92
podes me auxiliar?
Concordo. Ótima explicação, Gabriela! Meus parabéns.
Ótimo esclarecimento!
Parabéns pela explicação.
Muito didático!
FANTÁSTICA EXPLICAÇÃO! OBRIGADA!
Gostei do post, bem explicativo. Você teria algum link mostrando como calcular o p-value em R ou Excel? Obrigado.
Muito obrigado pela explicação! É sempre bom aprendermos no sentido prático.
Gostei muito da sua explicacao sobre o valor de p. Muito didatica, obrigada!!!
Parabéns pelo site amigo. Realmente consegue auxiliar de forma muito positiva aquelas pessoas que deram um salto além da faculdade.
“Não somos donos da verdade, por isso devemos disseminar conhecimento no sentido de ajudarmos uns aos outros para a partir disso contribuir para uma sociedade melhor para todos”. Paulo Melo 🙂
Boa explicação! Me ajudou muito…Obrigado.
Excelente! Vou estudar mais essa parada. Gistei!
Adorei a explicação, super didática e esclareceu bem.
Ótima explicação, mas me surgiu uma duvida: Feito o teste p, com a média das duas populações (por exemplo dois conjuntos de resultados), eu poderia depois, ao invés de pegar a média, utilizar o maior valor da população para apresentar o meu resultado.
Explicação excelente! Obrigada!
Olá pessoal! estou fazendo um trabalho sobre relação de aleitamaneto materno com obesidade, e o artigo que sigo como modelo tem isso escrito: Foram fatores de proteção contra sobrepeso e obesidade o aleitamento materno exclusivo por seis meses ou mais (IC 95% [0,38;0,86];OR=0,57; p=0,02). o que significa esse OR?
IC = Intervalo de Confiança
OR = Odds Ratio (é uma estimativa do risco relativo, particularmente indicada para estudos de caso-controle).
😉
Qual seria a melhor forma de discutir um resultado em que eu tenha um valor de p , por exemplo, igual a 0,3 então!?
Muito obrigada pelas dicas!
Como posso analisar os dados de uma pesquisa onde a comparação entre dois grupos è estatisticamente significante e o tamanho do efeito é pequeno ???
Você descomplicou o estatistiquês. Explicou o conceito e exemplificou. Ficou fácil de entender.
Parabéns.
Parabéns!!! Excelente. Encontrei aqui o que estava procurando. Simples e prático!
Excelente!
Obrigada!
Peço que me auxilie na compreensão do seguinte : Tenho um relatório que menciona que um determinado volume é significativo (mas não informa sua participação na amostra), posso entender que o P está compreendido entre 0,001 e 0,01 ?
Porque meus dados levaram a um RR = 2,3 (IC = 1,04 e 3,68) ou seja, maior que 1,00, porém o valor de p ficou maior que 0,05?