As definições de estatística descritiva e estatística inferencial são fáceis de encontrar: digitando três palavras no Google a descrição dos conceitos aparecem no primeiro link.

A estatística descritiva envolve a organização, resumo e representação dos dados. As ferramentas utilizadas para isso são as bem conhecidas tabelas de frequência; gráficos; cálculo de medidas de tendência central como média, mediana e moda; e cálculo de medidas de variação como variância e desvio padrão.

Já na estatística inferencial estamos sempre interessados em utilizar as informações de uma amostra para chegar a conclusões sobre um grupo maior, ao qual não temos acesso. Nesse sentido, uma ferramenta muito utilizada na estatística inferencial é a probabilidade.

Apesar dessa divisão clara, ao longo de seu trabalho os pesquisadores precisam constantemente “resistir à tentação” de utilizar os resultados de estatística descritiva para chegar à conclusões sem critério a respeito de sua população.

Isso deve ser praticado ao longo da pesquisa e especialmente no momento da redação final de seu artigo ou monografia, de forma a deixar claro que estamos afirmando informações a respeito da nossa população apenas na medida que nossos dados permitem.

Vamos exemplificar essa situação:

Digamos que um pesquisador tem interesse em avaliar a média de idade das mulheres que consomem o produto X. Assim, ele selecionou uma amostra probabilística de mulheres consumidoras deste produto, obteve sua variável de interesse, e verificou que a média de idade na sua amostra era de 35,4 anos.

Nesse momento, o que o pesquisador sabe?

Apenas o que foi descrito no parágrafo acima.

Não pode tirar conclusões além dessas, e certamente não pode afirmar nada à respeito da população de interesse.

Ele pode, talvez, afirmar que a média da amostra sugere que a média da população de interesse seja próxima ao valor calculado, uma vez que a ciência da estatística nos comprova que a média de uma amostra é um bom estimador da média da população.

Porém não temos nenhuma medida do quão discrepantes nossos resultados podem ser em relação à população.

Então, o pesquisador prossegue, e calcula que o intervalo de confiança 95% para a média de idade das consumidoras é de

[31,2 ; 39,6]. O intervalo de confiança introduz o conceito de erro em nossas conclusões, e a partir daí estamos aplicando estatística inferencial, e podemos fazer afirmações a respeito do grupo maior.

Ao mesmo tempo, a estatística descritiva não deve ser menosprezada, uma vez que a exploração dos dados deve ser a primeira etapa em qualquer análise estatística, não importa o quão sofisticada seja a análise.

Como dito anteriormente, os conceitos são muitas vezes claros, mas cabe a quem está escrevendo o artigo revisar sua escrita e se prevenir para não tirar conclusões precipitadas.

O entendimento das afirmações corretas a serem feitas a partir das estatísticas vem do entendimento da disciplina. Com um estudo mais aprofundado ou a ajuda de um profissional, é possível expandir os resultados para a população sem cair em incorreções.