Wprowadzenie do statystyki
Wyniki nauczania
- Rozpoznać, opisać i obliczyć miary środka danych: średnią, medianę i tryb.
Rozważmy następujący zbiór danych.
4; 5; 6; 6; 6; 7; 7; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10
Ten zbiór danych można przedstawić za pomocą następującego histogramu. Każdy przedział ma szerokość jeden, a każda wartość znajduje się w środku przedziału.
Histogram przedstawia symetryczny rozkład danych. Rozkład jest symetryczny, jeśli w pewnym punkcie histogramu można narysować pionową linię w taki sposób, że kształty po lewej i prawej stronie pionowej linii są lustrzanymi odbiciami siebie nawzajem. Średnia, mediana i tryb są po siedem dla tych danych. W idealnie symetrycznym rozkładzie, średnia i mediana są takie same. Ten przykład ma jeden tryb (jednomodalny), a tryb jest taki sam jak średnia i mediana. W symetrycznym rozkładzie, który ma dwa tryby (bimodalny), dwa tryby byłyby różne od średniej i mediany.
Histogram dla danych: 4; 5; 6; 6; 6; 7; 7; 7; 7; 8 nie jest symetryczny. Prawa strona wydaje się „obcięta” w stosunku do lewej. Rozkład tego typu nazywamy skośnym w lewo, ponieważ jest on wyciągnięty w lewo.
Średnia wynosi 6,3, mediana 6,5, a tryb siedem. Zauważ, że średnia jest mniejsza niż mediana, a oba są mniejsze niż tryb. Średnia i mediana zarówno odzwierciedlają skośność, ale średnia odzwierciedla ją bardziej tak.
Histogram dla danych: 6; 7; 7; 7; 7; 7; 8; 8; 9; 10, również nie jest symetryczny. Jest przechylony w prawo.
Średnia wynosi 7,7, mediana 7,5, a tryb siedem. Z tych trzech statystyk, średnia jest największa, podczas gdy tryb jest najmniejszy. Ponownie, średnia odzwierciedla skośne najbardziej.
Podsumowując, ogólnie, jeśli dystrybucja danych jest skośne w lewo, średnia jest mniejsza niż mediana, która jest często mniejsza niż tryb. Jeśli rozkład danych jest skośny w prawo, średnia jest często mniejsza niż mediana, która jest mniejsza niż średnia.
Skośność i symetria stają się ważne, gdy omawiamy rozkłady prawdopodobieństwa w późniejszych rozdziałach.
Tutaj znajduje się film, który podsumowuje, jak średnia, mediana i tryb mogą pomóc nam opisać skośność zbioru danych. Nie martw się o terminy leptokurtic i platykurtic dla tego kursu.
Przykład
Statystyki są używane do porównywania, a czasem identyfikacji autorów. Poniższe listy pokazują prostą próbę losową, która porównuje liczbę liter dla trzech autorów.
Terry: 7; 9; 3; 3; 3; 4; 1; 3; 2; 2
Davis: 3; 3; 3; 4; 1; 4; 3; 2; 3; 1
Maris: 2; 3; 4; 4; 6; 6; 6; 8; 3
- Zrób wykres kropkowy dla tych trzech autorów i porównaj kształty.
- Oblicz średnią dla każdego z nich.
- Oblicz medianę dla każdego z nich.
- Opisać wszelkie zauważone prawidłowości między kształtem a miarami środka.
Patrząc na rozkład danych może ujawnić wiele o relacji między średnią, medianą i trybem. Istnieją trzy rodzaje rozkładów. Rozkład prawoskośny (lub dodatni) ma kształt jak na rysunku 3. Rozkład lewoskośny (lub ujemny) ma kształt jak na rysunku 2. Rozkład symetryczny wygląda jak rysunek 1.
.