Os gráficos descritivos são uma ótima maneira de conhecer melhor seus dados de pesquisa. São facilmente compreendidos, mostram de forma clara tendências, variações e agrupamentos, e costumam ser uma das primeiras etapas da análise estatística (seja sozinho ou junto a uma assessoria estatística para acadêmicos).
Porém existem vários tipos de gráficos, cada um apropriado para um tipo de caso, e a escolha do formato inapropriado pode ocasionar interpretações que confundem ou induzem ao erro quem os vê.
Ressaltamos que apresentamos aqui boas práticas na elaboração de gráficos, e não uma lista definitiva do que é certo e errado.
Sendo assim, listamos alguns exemplos de gráficos que não apresentam as informações da forma mais apropriada:
Gráficos de linha, usado em uma situação em que não há uma relação de tempo envolvida
Responda rápido: Houve um aumento no número de televisões adquiridas?
Se você se sentiu tentado a responder “sim”, consegue ver o problema dessa abordagem. Os gráficos de linha são usados principalmente quando queremos mostrar uma tendência, crescente ou decrescente, na nossa variável ao longo de um certo período de tempo, o que não é o caso.
Usá-lo fora desse contexto não é totalmente errado, mas dá uma primeira impressão incorreta para quem vê. Um gráfico de barras, nesse caso, é mais apropriado.
Gráficos de pizza que “somam” mais que 100% da amostra
Responda rápido: É correto dizer que menos da metade dos pesquisados teve dor de cabeça?
Os gráficos de pizza são ideais para mostrar proporções, mas quando usados em situações em que as categorias se sobrepõe (como no exemplo, um paciente pode apresentar mais de um tipo de sintoma) ele induz o observador ao erro, quanto à participação da categoria na amostra.
Nesse caso, o uso de um gráfico de barras também solucionaria o problema.
Gráficos de linha cujo eixo vertical não começa em zero
Responda rápido: Foi grande a variação no faturamento em 2015?
Eventualmente, modificar o início do eixo vertical é uma boa alternativa, para acompanharmos melhor a variação de valores de grandeza alta.
Porém, é necessário ter consciência de que isso faz com que o crescimento e decrescimento de valores seja superestimado.
Pelo menos na etapa exploratória, o melhor é fixar o eixo no valor zero.
Resumindo:
– Gráficos de pizza: apropriado para mostrar proporções na amostra.
– Gráficos de linha: apropriado para mostrar mudanças em uma variável, ao longo do tempo.
– Em caso de dúvida, use um gráfico de barras.
Espero que o texto seja útil para os acadêmicos que estão começando a aprender a analisar seus dados. Na dúvida, contate um profissional para ajudá-lo.
Olá, tenho uma dúvida
Preciso fazer um gráfico sobre a variável número de folhas. Estudamos uma planta submetida a 4 doses de chumbo, e o gráfico será dispersão. Porém, em todos os tratamentos as plantas apresentaram número de folhas entre 150 e 260. Então eu devo começar o eixo vertical com zero? Pois eu tinha feito com 80.
Faz três anos, mas deixo meus 2 centavos no que penso sobre iniciar um eixo em 0.
Se faz sentido analisar a “distância” até o zero, opto por manter, como no exemplo do faturamento.
Acho que pode ser omitido em casos como densidade (g/m^3), concentração (mL/L), variação (USD em BRL), etc, onde o zero não tem muito signifcado. Nesses exemplos a evolução ao longo do tempo ou diferença entre duas amostras é mais significativa independente da localização do zero.
gostei muito das explicações. obrigada
No segundo exemplo, dos sintomas, acredito que o melhor seria trabalhar com conjuntos. Ficaria muito mais claro e daria uma dimensão mais apropriada das variáveis.
Muitos analistas de dados não recomendam o uso de gráfico de pizza. Nós temos uma dificuldade intrínseca em comparar áreas, e por isso nem sempre num gráfico de pizza fica claro qual grupo é maior que o outro. Isso é frequentemente “resolvido” com a adição dos valores no gráfico, como no exemplo dado aqui. Neste caso o gráfico passa a ser inútil, pois uma tabela mostraria as informações de forma mais simples (e ainda monocromática, isto pode ser valioso).
Eu também adicionaria á lista outras representações comuns, como gráficos com dois eixos-y não-relacionados, gráficos com eixo-y cortado e gráficos com representações 3D mas que possuem pares de valores (como aquelas barras cuboides).
Ainda assim, é um bom artigo, muitos pesquisadores têm dificuldade mesmo com as representações mais simples.
Qualquer gráfico com pouca informação (pizza, donut, barras, linhas, dispersão, …) pode ser substituído eficientemente por uma tabela. Contudo, apesar de termos alguma dificuldade em comparar áreas, acredito que somos ainda piores em dar significado a uma série números em tabelas: Por exemplo, em uma tabela que lista 10 números reais com precisão de 2 casas decimais identificar os 3 maiores números. Em contrapartida, a comparação de áreas pode ser resolvida tornando o gráfico em pizza ordenado (maior para menor fatia no sentido horário ou anti-horário), que na minha opinião costuma ser uma solução melhor que tabela na maioria dos casos.