Introduction to Statistics
Learning Outcomes
- Recognize, descreva e calcule as medidas do centro dos dados: media, median, and mode.
Consulte o seguinte conjunto de dados.
4; 5; 6; 6; 6; 6; 7; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10
Este conjunto de dados pode ser representado pelo seguinte histograma. Cada intervalo tem largura um, e cada valor está localizado no meio de um intervalo.
O histograma exibe uma distribuição simétrica dos dados. Uma distribuição é simétrica se uma linha vertical puder ser desenhada em algum ponto do histograma de tal forma que a forma à esquerda e à direita da linha vertical sejam imagens espelhadas uma da outra. A média, a mediana e o modo são cada sete para estes dados. Em uma distribuição perfeitamente simétrica, a média e a mediana são a mesma coisa. Este exemplo tem uma modalidade (unimodal), e a modalidade é a mesma que a média e a mediana. Em uma distribuição simétrica que tem dois modos (bimodal), os dois modos seriam diferentes da média e da mediana.
O histograma para os dados: 4; 5; 6; 6; 6; 7; 7; 7; 7; 8 não é simétrico. O lado direito parece “cortado” em relação ao lado esquerdo. Uma distribuição deste tipo é chamada desviada para a esquerda porque é puxada para a esquerda.
A média é 6,3, a mediana é 6,5, e o modo é sete. Note que a média é menor que a mediana, e ambas são menores que a modalidade. A média e a mediana refletem ambas a inclinação, mas a média a reflete mais assim.
O histograma para os dados: 6; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10, também não é simétrico. É inclinado para a direita.
A média é 7,7, a mediana é 7,5, e a modalidade é sete. Das três estatísticas, a média é a maior, enquanto que a modalidade é a menor. Novamente, a média reflete a inclinação máxima.
Para resumir, geralmente se a distribuição dos dados é inclinada para a esquerda, a média é menor do que a mediana, que muitas vezes é menor do que a moda. Se a distribuição dos dados é inclinada para a direita, o modo é frequentemente menor que a mediana, que é menor que a média.
Skewness e simetria tornam-se importantes quando discutimos distribuições de probabilidade em capítulos posteriores.
Aqui está um vídeo que resume como a média, a mediana e o modo podem nos ajudar a descrever a assimetria de um conjunto de dados. Não se preocupe com os termos leptokurtic e platykurtic para este curso.
Exemplo
Estatistics são usados para comparar e às vezes identificar autores. As listas a seguir mostram uma amostra aleatória simples que compara a contagem de letras para três autores.
Terry: 7; 9; 3; 3; 3; 3; 4; 1; 3; 2; 2
Davis: 3; 3; 3; 4; 1; 4; 3; 2; 3; 3; 1
Maris: 2; 3; 4; 4; 4; 4; 6; 6; 6; 8; 3
- Faça um gráfico de pontos para os três autores e compare as formas.
- Calcular a média para cada um.
- Calcular a mediana para cada um.
- Descreva qualquer padrão que você observe entre a forma e as medidas do centro.
Olhar para a distribuição dos dados pode revelar muito sobre a relação entre a média, a mediana e a moda. Existem três tipos de distribuições. Uma distribuição distorcida direita (ou positiva) tem uma forma como a Figura 3. Uma distribuição enviesada para a esquerda (ou negativa) tem uma forma como a Figura 2 . Uma distribuição simétrica se parece com a Figura 1.