Introduction to Statistics
Learning Outcomes
- Tunnista, kuvaa ja laske aineiston keskipisteen mittarit: keskiarvo, mediaani ja moodi.
Harkitse seuraavaa aineistoa.
4; 5; 6; 6; 6; 6; 7; 7; 7; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10
Tämä aineisto voidaan esittää seuraavalla histogrammilla. Jokaisen intervallin leveys on yksi, ja jokainen arvo sijaitsee intervallin keskellä.
Histogrammi näyttää datan symmetrisen jakauman. Jakauma on symmetrinen, jos histogrammin johonkin kohtaan voidaan piirtää pystysuora viiva siten, että pystysuoran viivan vasemmalla ja oikealla puolella olevat muodot ovat toistensa peilikuvia. Näiden tietojen keskiarvo, mediaani ja moodi ovat kukin seitsemän. Täysin symmetrisessä jakaumassa keskiarvo ja mediaani ovat samat. Tässä esimerkissä on yksi moodi (unimodaalinen), ja moodi on sama kuin keskiarvo ja mediaani. Symmetrisessä jakaumassa, jossa on kaksi moodia (bimodaalinen), molemmat moodit olisivat eri kuin keskiarvo ja mediaani.
Datan histogrammi: 4; 5; 6; 6; 6; 6; 7; 7; 7; 7; 7; 8 ei ole symmetrinen. Oikeanpuoleinen puoli näyttää ”lohkaistulta” verrattuna vasemmanpuoleiseen. Tällaista jakaumaa kutsutaan vasemmalle vinoksi, koska se on vedetty vasemmalle.
Keskiarvo on 6,3, mediaani on 6,5 ja moodi on seitsemän. Huomaa, että keskiarvo on pienempi kuin mediaani, ja molemmat ovat pienempiä kuin moodi. Sekä keskiarvo että mediaani heijastavat vinoumaa, mutta keskiarvo heijastaa sitä enemmän.
Aineiston histogrammi: 6; 7; 7; 7; 7; 7; 8; 8; 8; 8; 9; 10, ei myöskään ole symmetrinen. Se on vinoutunut oikealle.
Keskiarvo on 7,7, mediaani on 7,5 ja moodi on seitsemän. Kolmesta tilastosta keskiarvo on suurin, kun taas moodi on pienin. Jälleen kerran keskiarvo heijastaa vinoutta eniten.
Yhteenvetona voidaan todeta, että yleensä jos aineiston jakauma on vasemmalle vinoutunut, keskiarvo on pienempi kuin mediaani, joka on usein pienempi kuin moodi. Jos datan jakauma on vino oikealle, moodi on usein pienempi kuin mediaani, joka on pienempi kuin keskiarvo.
Vinoudesta ja symmetriasta tulee tärkeitä, kun keskustelemme todennäköisyysjakaumista myöhemmissä luvuissa.
Tässä on video, jossa esitetään yhteenveto siitä, miten keskiarvo, mediaani ja moodi voivat auttaa meitä kuvaamaan datajoukon vinouden. Älä huolehdi termeistä leptokurttinen ja platykurttinen tällä kurssilla.
Esimerkki
Tilastoja käytetään vertailuun ja joskus tekijöiden tunnistamiseen. Seuraavissa luetteloissa esitetään yksinkertainen satunnaisotos, jossa verrataan kolmen kirjoittajan kirjainlukuja.
Terry: 7; 9; 3; 3; 3; 3; 4; 1; 3; 2; 2
Davis: 3; 3; 3; 4; 1; 4; 3; 2; 3; 1
Maris: 2; 3; 4; 4; 4; 4; 6; 6; 6; 6; 8; 3
- Tehdään pistekuvio kolmesta kirjoittajasta ja verrataan muotoja.
- Laskekaa jokaiselle keskiarvo.
- Laskekaa jokaiselle mediaani.
- Kuvaile havaitsemiasi kuvioita muodon ja keskipisteen mittojen välillä.
Katsomalla aineiston jakaumaa voidaan paljastaa paljon keskiarvon, mediaanin ja moodin välisestä suhteesta. Jakaumia on kolmenlaisia. Oikea (tai positiivinen) vino jakauma on muodoltaan kuvan 3 kaltainen. Vasemmanpuoleisen (tai negatiivisen) vinon jakauman muoto on kuvan 2 kaltainen. Symmetrinen jakauma on kuvan 1 kaltainen.