O Excel é uma ferramenta de maior acessibilidade em comparação aos softwares estatísticos, e possui diversas funções para cálculo de testes estatísticos. No entanto, para sua utilização é preciso que o pesquisador tenha certa familiaridade com estatística e com as fórmulas do Excel (em oposição ao SPSS, por exemplo, que apresenta menus práticos em que basta clicar para efetuar o teste).
Esse primeiro texto propõe-se a apresentar para pesquisadores que não conhecem tão bem as fórmulas do excel o passo-a-passo de como calcular e interpretar o resultado. Ressalta-se, no entanto, que mais importante que calcular um teste estatístico corretamente é saber se ele é apropriado ou não para responder seu objetivo de pesquisa – neste caso, é melhor procurar um profissional para auxiliá-lo nessa decisão.
As fórmulas desse texto consideram o Excel versão 2010.
Teste T para duas populações independentes
O teste T para duas populações independentes é comumente utilizado para testar se a média de duas populações é significativamente diferente, maior ou menor quanto a certa variável, utilizando amostraS para tomar esta decisão. Por exemplo, podemos ter interesse saber se a idade média de homens e mulheres consumidores de um certo produto é significativamente diferente.
Para aplicar o teste T, precisamos nos certificar se as variáveis de interesse seguem distribuição normal e se suas variâncias são homogêneas (o que não será abordado neste texto) e como resultados, comumente vamos querer duas informações: a estatística de teste e o p-valor.
Para calcular o teste, primeiramente deve-se ajustar os dados no seguinte formato:
Para o cálculo do p-valor do teste quiquadrado, usa-se a fórmula T.TEST (em português, TESTE.T), informando como parâmetros, nesta ordem: as observações da variável no 1º grupo; as observações da variável no 2º grupo; a informação de que o teste é unilateral (1) ou bilateral (2); e o tipo de teste, se pareado (1), de populações independentes com variâncias iguais (2), ou de populações independentes com variâncias iguais (3).
Esclarecendo, os testes unilaterais testam a hipótese de que uma população tem média maior ou menor (especificando qual hipótese) que a outra, enquanto os testes bilaterais avaliam se uma população tem média diferente (sem especificar se maior ou menor) Da outra. No presente caso queremos fazer um teste bilateral, então o argumento informado na fórmula é 2.
Já quanto ao tipo de teste, foi previamente declarado que nossas populações são independentes, e idealmente teremos que realizar um teste complementar para definir se as variâncias das populações são iguais ou não. No caso, usaremos o teste que não assume variâncias iguais, então o argumento informado na fórmula é 3.
Já para calcular a estatística de teste T, usa-se a fórmula T.INV.2T (em português, INV.T.BC). Caso tivéssemos realizado um teste unilateral, usaríamos a fórmula T.INV (em português, INV.T).
Informa-se como parâmetros o p-valor recém calculado e os graus de liberdade. Relembrando o conceito estatístico, o total de graus de liberdade do teste T é calculado da seguinte forma: (qtde respostas no grupo1 + qtde respostas no grupo2 – 2). Neste caso, temos 11 respostas em cada grupo, resultando em (11 + 11 – 2) = 20 graus de liberdade.
Obtendo os resultados, passamos para a interpretação. O pesquisador deve ter definido previamente o nível de confiança desejado de seus resultados. Caso tenha definido um nível de confiança de 95%, observar-se-á o p-valor calculado e, caso este seja inferior a 0,05, será rejeitada a hipótese nula de que as médias dos grupos são iguais. No caso apresentado, com p-valor 0,028, rejeitamos a hipótese nula e aceitamos a hipótese alternativa de que há sim, diferença na média desses grupos.
Teste Quiquadrado
O teste quiquadrado é comumente utilizado para avaliar associação entre duas variáveis categóricas. Por exemplo, numa mesma população, podemos ter interesse em avaliar se há associação entre o gênero (masculino / feminino) e o fato do indivíduo de trabalhar (sim / não). Temos interesse em obter duas informações: a estatística do teste quiquadrado e o p-valor, para tomar a decisão, com certo nível de confiança, sobre se há ou não associação entre essas variáveis na população, com base numa amostra.
Para calcular o teste, primeiramente deve-se ajustar os dados no seguinte formato:
Os dados apresentam o resultado observado na amostra. Para o teste, é necessário calcular o resultado esperado caso não houvesse associação. Ele é calculado para cada categoria de resposta possível (Masculino Sim, Masculino Não, Feminino Sim, Feminino Não), multiplicando o total de cada coluna ou linha correspondente, e dividindo pelo total geral, usando as fórmulas aritméticas do Excel, conforme exemplo:
Caso seja calculado corretamente, as somas das colunas e linhas dos valores observados será exatamente igual a do valor observado.
Para o cálculo do p-valor do teste quiquadrado, usa-se a fórmula CHISQ.TEST (em português, TESTE.QUIQUA), informando como parâmetros os valores observados, e depois os valores esperados.
Já para calcular a estatística de teste quiquadrado, usa-se a fórmula CHIST.INV.RT (em português, INV.QUIQUA.CD) informando como parâmetros o p-valor recém calculado e os graus de liberdade. Relembrando o conceito estatístico, o total de graus de liberdade do teste quiquadrado é calculado da seguinte forma: (qtde categorias da variável1 – 1) x (qtde categorias da variável2 – 1). Neste caso, temos 2 categorias para a variável Trabalha e 2 categorias para a variável Gênero, resultando em (2-1) x (2-1) = 1 grau de liberdade.
Obtendo os resultados, resta interpretá-los. O pesquisador deve ter definido previamente o nível de confiança desejado de seus resultados. Caso tenha definido um nível de confiança de 95%, observar-se-á o p-valor calculado e, caso este seja inferior a 0,05, será rejeitada a hipótese nula de que não há associação entre as variáveis. No caso apresentado, com p-valor 0,018, rejeitamos a hipótese nula e aceitamos a hipótese alternativa de que há sim, associação entre o gênero e o fato da pessoa trabalhar.
Encerramos por aqui apresentando estes dois testes estatísticos muito úteis. Deixem comentários sobre que testes gostariam de aprender e, para análises mais avançadas, nos procure.
Muito Obrigado bem explicito
Olá Prezado, parabéns! Diferentemente de outros textos que são totalmente direcionados para quem tem conhecimento avançado dos testes, os textos de vocês são fáceis de compreender, ajuda muito na interpretação dos resultados. O problema é que estatística é sempre difícil.
Gostaria de aprender um pouco mais sobre testes de comparação de médias, sei que ANOVA é um deles, entretanto não consigo entender exatamente sua importância e como interpretá-lo.
Se puderem explicar, agradeço!
Parabéns pela explicação. Muito obrigada.
Didaticamente, conseguiu aprofundar o tema com considerável amplitude, de forma simples, permitindo a compreensão até por parte de leigos no assunto. Grata
Excelente explicação!
Gostaria só de apontar um errinho bobo (mas que pode confundir). Na frase “a informação de que o teste é unilateral (1) ou bilateral (2); e o tipo de teste, se pareado (1), de populações independentes com variâncias iguais (2), ou de populações independentes com variâncias iguais (3).”
O item (2) e (3) estão indênticos.
Pesquisando no site do Excel, acredito que no ítem (3) teria que estar escrito “ou de populações independentes com variâncias diferentes (3)”.
Espero que seja construtivo! Grande abraço!
Perfeito, me ajudou!!
finalmente um abençoado que explicou o tema de forma didática: com exemplos. obrigado, amigo
Fantástico. Dificilmente um conteúdo tão rico e gratuito. Parabéns pelo incentivo à educação de boa qualidade e gratuita.
ACHEI ISSO TUDO MUITO CHATO, E NÃO SEI FAZER A LINHA QUE ACHEI UMA ÓTIMA EXPLICAÇÃO, ATÉ PORQUE EU NÃO CONSIGO NEM ME CONCENTRAR COM ESSE TIPO DE CONTEUDO.
Boa noite!
Tenho fornacao em TI. Estou cursando mestrado em economia, estou tendo dificuldades em entender estatística. Achei esse site é quero estudar e aprender.