Indledning til statistik

Læringsresultater

  • Kend, beskriv og beregn målene for dataenes centrum: middelværdi, median og modus.

Opnå følgende datasæt:
4; 5; 6; 6; 6; 6; 7; 7; 7; 7; 7; 7; 7; 7; 7; 7; 7; 8; 8; 8; 8; 9; 10
Dette datasæt kan repræsenteres ved følgende histogram. Hvert interval har en bredde på én, og hver værdi er placeret i midten af et interval.

Figur 1

Histogrammet viser en symmetrisk fordeling af data. En fordeling er symmetrisk, hvis der kan trækkes en lodret linje et sted i histogrammet, således at formen til venstre og til højre for den lodrette linje er spejlbilleder af hinanden. Middelværdien, medianen og modus er hver syv for disse data. I en perfekt symmetrisk fordeling er middelværdien og medianen den samme. Dette eksempel har én modus (unimodal), og modus er den samme som middelværdien og medianen. I en symmetrisk fordeling, der har to modes (bimodal), ville de to modes være forskellige fra middelværdien og medianen.

Histogrammet for dataene: 4; 5; 6; 6; 6; 6; 6; 7; 7; 7; 7; 7; 7; 8 er ikke symmetrisk. Højre side virker “hakket af” i forhold til venstre side. En fordeling af denne type kaldes skævt til venstre, fordi den er trukket ud til venstre.

Figur 2

Middelværdien er 6,3, medianen er 6,5, og modus er syv. Bemærk, at middelværdien er mindre end medianen, og at de begge er mindre end modus. Middelværdien og medianen afspejler begge skævheden, men middelværdien afspejler den i højere grad.
Histogrammet for dataene: 6; 7; 7; 7; 7; 7; 7; 8; 8; 8; 8; 9; 10, er heller ikke symmetrisk. Det er skævt til højre.

Figur 3

Middelværdien er 7,7, medianen er 7,5, og modus er syv. Af de tre statistikker er middelværdien den største, mens modus er den mindste. Igen afspejler gennemsnittet skævheden mest.

Som opsummering kan man sige, at hvis fordelingen af data generelt er skæv til venstre, er gennemsnittet mindre end medianen, som ofte er mindre end modus. Hvis fordelingen af data er skævt til højre, er modus ofte mindre end medianen, som er mindre end middelværdien.

Skewness og symmetri bliver vigtige, når vi diskuterer sandsynlighedsfordelinger i senere kapitler.

Her er en video, der opsummerer, hvordan middelværdien, medianen og modus kan hjælpe os med at beskrive skævheden i et datasæt. Du skal ikke bekymre dig om udtrykkene leptokurtisk og platykurtisk i dette kursus.

Eksempel

Statistik bruges til at sammenligne og nogle gange til at identificere forfattere. De følgende lister viser en simpel tilfældig stikprøve, der sammenligner bogstavtællingerne for tre forfattere.

Terry: 7; 9; 3; 3; 3; 3; 3; 4; 1; 3; 2; 2
Davis: 3; 3; 3; 3; 4; 1; 4; 3; 2; 3; 3; 1
Maris: 2; 3; 4; 4; 4; 4; 4; 6; 6; 6; 6; 8; 3

  1. Opret et punktplot for de tre forfattere og sammenlign formerne.
  2. Beregne gennemsnittet for hver enkelt.
  3. Beregne medianen for hver enkelt.
  4. Beskriv ethvert mønster, du bemærker mellem formen og målene for centrum.
Vis løsning


  1. Terrys fordeling har en højre (positiv) skævhed.

    Davis’ fordeling har en venstre (negativ) skævhed

    Maris’ fordeling er symmetrisk formet.
  2. Terrys gennemsnit er 3,7, Davis’ gennemsnit er 2,7, Maris’ gennemsnit er 4,6.
  3. Terrys median er tre, Davis’ median er tre. Maris’ median er fire.
  4. Det ser ud til, at medianen altid er tættest på det højeste punkt (modus), mens middelværdien har en tendens til at ligge længere ude på halen. I en symmetrisk fordeling er middelværdien og medianen begge centralt placeret tæt på det høje punkt i fordelingen.

Hvis man ser på fordelingen af data, kan man få meget at vide om forholdet mellem middelværdien, medianen og modus. Der findes tre typer af fordelinger. En højre (eller positiv) skæv fordeling har en form som i figur 3. En venstre (eller negativ) skæv fordeling har en form som i figur 2 . En symmetrisk fordeling ser ud som i figur 1.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.