Capítulo 10 Estatística Descritiva
A estatística descritiva permite resumir, organizar e interpretar dados de forma clara e objetiva. Para isso, utilizamos medidas de tendência central, medidas de dispersão e medidas relativas de variabilidade.
10.1 Medidas de Tendência Central (ou Posição)
10.1.1 Média
- Definição: Soma de todos os valores dividida pelo número de observações.
- Interpretação: Representa o valor médio ou típico do conjunto de dados.
- Como reportar:
A média dos batimentos cardíacos foi de 58,6 bpm, indicando o valor médio da amostra analisada.
10.1.2 Mediana
- Definição: Valor central de um conjunto ordenado de dados.
- Interpretação: Divide o conjunto de dados ao meio, sendo útil quando há valores extremos (outliers).
- Como reportar:
A mediana dos batimentos foi de 60,0 bpm, indicando que 50% dos indivíduos apresentaram valores abaixo ou iguais a esse valor.
10.1.3 Quartis
- Definição: Q1 (primeiro quartil) e Q3 (terceiro quartil) representam os valores que dividem os 25% e os 75% inferiores dos dados, respectivamente.
- Interpretação: Ajudam a entender a distribuição dos dados e identificar a dispersão em torno da mediana.
- Como reportar:
O primeiro e o terceiro quartis foram 54,0 bpm e 64,0 bpm, respectivamente, revelando que 50% dos batimentos ficaram entre esses dois valores.
10.1.4 Moda
- Definição: Valor mais frequente do conjunto de dados.
- Interpretação: Indica o valor mais comum, embora possa não existir ou haver mais de uma moda.
- Como reportar:
A moda foi 62 bpm, valor que ocorreu com maior frequência na amostra.
Observação importante:
- Média e desvio padrão são medidas que devem ser usadas juntas, especialmente para dados simétricos (distribuição simétrica) e sem valores extremos.
- Mediana e quartis formam outro conjunto de medidas, mais apropriado quando há assimetria ou presença de outliers.
Sugestão de vídeo: Canal Pesquise - Tendência Central
10.2 Medidas de Dispersão (ou Variabilidade)
10.2.1 Amplitude
- Definição: Diferença entre o maior e o menor valor.
- Interpretação: Indica o intervalo total em que os dados variam.
- Como reportar:
A amplitude foi de 36 bpm, com valores variando de 39 a 75 bpm.
10.2.2 Variância
- Definição: Média dos quadrados das diferenças entre os valores e a média.
- Interpretação: Mede a dispersão, mas sua unidade é o quadrado da unidade original.
- Como reportar:
A variância foi de 98,8 bpm², indicando a variabilidade dos batimentos em relação à média.
Observação:
A unidade da variância é expressa ao quadrado da unidade original dos dados (por exemplo, bpm² no caso de batimentos por minuto), o que pode dificultar sua interpretação direta.
Por isso, costuma-se utilizar o desvio padrão, que tem a mesma unidade dos dados originais e fornece uma noção mais intuitiva da dispersão dos valores em torno da média.
10.2.3 Desvio padrão (DP)
- Definição: Raiz quadrada da variância.
- Interpretação: Expressa, em média, o quanto os dados se afastam da média.
- Como reportar:
Como reportar:
O desvio padrão foi de 9,9 bpm, o que indica que, em média, os batimentos cardíacos dos indivíduos da amostra variam aproximadamente 9,9 unidades em relação à média.
10.2.4 Amplitude interquartil (IQR)
- Definição: Diferença entre o terceiro e o primeiro quartis (Q3 - Q1).
- Interpretação: Indica a dispersão dos 50% centrais dos dados.
- Como reportar:
A amplitude interquartil foi de 10,0 bpm, mostrando a concentração dos valores médios.
Sugestão de vídeo: Canal Pesquise - Variabilidade
10.3 Medida Relativa de Variabilidade
10.3.1 Coeficiente de Variação (CV)
- Definição: Quociente entre o desvio padrão e a média, multiplicado por 100.
- Interpretação: Expressa a variabilidade dos dados em relação à média, permitindo comparar conjuntos com unidades diferentes.
- Como reportar:
O coeficiente de variação foi de 16,9%, indicando que os dados são relativamente homogêneos.
Observação:
Um CV inferior a 25% geralmente indica homogeneidade; valores muito altos indicam alta variabilidade.
10.4 Funções no R
Com um vetor x
contendo os dados, utilize:
Medida | Código R |
---|---|
Média | mean(x) |
Mediana | median(x) |
Primeiro quartil (Q1) | quantile(x, 0.25) |
Terceiro quartil (Q3) | quantile(x, 0.75) |
Moda | sort(table(x)) |
Menor valor | min(x) |
Maior valor | max(x) |
Resumo geral | summary(x) |
Amplitude | range(x) |
Variância | var(x) |
Desvio padrão | sd(x) |
Amplitude interquartil | IQR(x) |
Coeficiente de variação | sd(x)/mean(x)*100 |
Calcular é importante, mas interpretar corretamente é essencial. Ao elaborar suas interpretações, descreva o que os números revelam sobre o fenômeno analisado.
10.5 Atividade 4
Considere o objeto Batimentos, que é uma amostra de batimentos cardíacos de 20 homens.
- Obtenha as seguintes medidas:
- Menor valor:
- Maior valor:
- Média:
- Mediana:
- Primeiro quartil:
- Terceiro quartil:
- Variância:
- Desvio padrão:
- Amplitude interquartil:
- Coeficiente de varição:
- Escreva sobre o conjunto media e desvio padrão:
A média dos dados foi de X (unidade), com um desvio padrão de Y (unidade), indicando que os valores estão, em geral, relativamente próximos/espalhados em torno da média. O desvio padrão reflete a quantidade de variabilidade ou dispersão dos dados em relação à média, e neste caso, a dispersão é baixa/média/alta, dependendo do valor de Y.
- Escreva sobre conjunto mediana e quartis:
A mediana foi Z (unidade), e o intervalo interquartil (IQR), que representa a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1), foi Q3 - Q1 (unidade). Isso indica que 50% dos dados estão concentrados nesse intervalo.
- Escreva sobre o coeficiente de variação:
O coeficiente de variação (CV) foi calculado como X%, o que reflete a dispersão relativa dos dados em relação à média. Valores mais baixos de CV indicam que os dados estão mais concentrados em torno da média, enquanto valores mais altos indicam uma maior dispersão.
- Acrescente mais uma amostra com valor de batimento igual a 120, recalcule as medidas acima. Qual conjunto você consideraria mais adequado para resumir sua amostra, na presença desse valor discrepante (outlier)? A média (DP) ou mediana (1o.Q ; 3o.Q)? Explique.