Introduktion till statistik
Lärandemål
- Känn igen, beskriv och beräkna mått på datamaterialets centrum: medelvärde, median och modus.
Granska följande datamängd:
4; 5; 6; 6; 6; 6; 7; 7; 7; 7; 7; 7; 7; 7; 7; 7; 8; 8; 8; 8; 9; 10
Denna datamängd kan representeras av följande histogram. Varje intervall har bredd ett, och varje värde ligger i mitten av ett intervall.
Histogrammet visar en symmetrisk fördelning av data. En fördelning är symmetrisk om en vertikal linje kan dras vid någon punkt i histogrammet så att formen till vänster och höger om den vertikala linjen är spegelbilder av varandra. Medelvärdet, medianen och modus är vardera sju för dessa data. I en perfekt symmetrisk fördelning är medelvärdet och medianen lika stora. Detta exempel har ett modus (unimodal), och modus är detsamma som medelvärde och median. I en symmetrisk fördelning som har två modus (bimodal) skulle de två modus vara olika från medelvärdet och medianen.
Histogrammet för uppgifterna: 4; 5; 6; 6; 6; 6; 7; 7; 7; 7; 7; 7; 8 är inte symmetriskt. Den högra sidan verkar ”avklippt” jämfört med den vänstra sidan. En fördelning av denna typ kallas sned till vänster eftersom den dras ut åt vänster.
Medelvärdet är 6,3, medianen är 6,5 och modus är sju. Lägg märke till att medelvärdet är mindre än medianen, och att de båda är mindre än modus. Både medelvärdet och medianen återspeglar skevheten, men medelvärdet återspeglar den i högre grad.
Histogrammet för data: 6; 7; 7; 7; 7; 7; 8; 8; 8; 8; 9; 10, är inte heller symmetriskt. Det är skevt till höger.
Medelvärdet är 7,7, medianen är 7,5 och modus är sju. Av de tre statistiska uppgifterna är medelvärdet det största, medan modet är det minsta. Återigen återspeglar medelvärdet snedfördelningen mest.
För att sammanfatta, i allmänhet om fördelningen av data är snedfördelad åt vänster, är medelvärdet mindre än medianen, som ofta är mindre än modet. Om fördelningen av data är skev till höger är modet ofta mindre än medianen, som är mindre än medelvärdet.
Skewness och symmetri blir viktiga när vi diskuterar sannolikhetsfördelningar i senare kapitel.
Här finns en video som sammanfattar hur medelvärdet, medianen och modet kan hjälpa oss att beskriva skevheten i en datamängd. Oroa dig inte för termerna leptokurtisk och platykurtisk för den här kursen.
Exempel
Statistik används för att jämföra och ibland identifiera författare. Följande listor visar ett enkelt slumpmässigt urval som jämför bokstavsantalet för tre författare.
Terry: 7; 9; 3; 3; 3; 3; 4; 1; 3; 2; 2
Davis: 3; 3; 3; 3; 4; 1; 4; 3; 2; 3; 1
Maris: 2; 3; 4; 4; 4; 4; 4; 6; 6; 6; 8; 3
- Gör en prickdiagram för de tre författarna och jämför formerna.
- Beräkna medelvärdet för var och en.
- Beräkna medianen för var och en.
- Beskriv eventuella mönster som du märker mellan formen och måtten på centrum.
Om man tittar på fördelningen av data kan man få reda på en hel del om förhållandet mellan medelvärde, median och modus. Det finns tre typer av fördelningar. En höger (eller positiv) skev fördelning har en form som i figur 3. En vänster (eller negativ) skev fördelning har en form som figur 2 . En symmetrisk fördelning ser ut som i figur 1.