Introduction to Statistics

Learning Outcomes

  • Tunnista, kuvaa ja laske aineiston keskipisteen mittarit: keskiarvo, mediaani ja moodi.

Harkitse seuraavaa aineistoa.
4; 5; 6; 6; 6; 6; 7; 7; 7; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10
Tämä aineisto voidaan esittää seuraavalla histogrammilla. Jokaisen intervallin leveys on yksi, ja jokainen arvo sijaitsee intervallin keskellä.

Kuvio 1

Histogrammi näyttää datan symmetrisen jakauman. Jakauma on symmetrinen, jos histogrammin johonkin kohtaan voidaan piirtää pystysuora viiva siten, että pystysuoran viivan vasemmalla ja oikealla puolella olevat muodot ovat toistensa peilikuvia. Näiden tietojen keskiarvo, mediaani ja moodi ovat kukin seitsemän. Täysin symmetrisessä jakaumassa keskiarvo ja mediaani ovat samat. Tässä esimerkissä on yksi moodi (unimodaalinen), ja moodi on sama kuin keskiarvo ja mediaani. Symmetrisessä jakaumassa, jossa on kaksi moodia (bimodaalinen), molemmat moodit olisivat eri kuin keskiarvo ja mediaani.

Datan histogrammi: 4; 5; 6; 6; 6; 6; 7; 7; 7; 7; 7; 8 ei ole symmetrinen. Oikeanpuoleinen puoli näyttää ”lohkaistulta” verrattuna vasemmanpuoleiseen. Tällaista jakaumaa kutsutaan vasemmalle vinoksi, koska se on vedetty vasemmalle.

Kuvio 2

Keskiarvo on 6,3, mediaani on 6,5 ja moodi on seitsemän. Huomaa, että keskiarvo on pienempi kuin mediaani, ja molemmat ovat pienempiä kuin moodi. Sekä keskiarvo että mediaani heijastavat vinoumaa, mutta keskiarvo heijastaa sitä enemmän.
Aineiston histogrammi: 6; 7; 7; 7; 7; 7; 8; 8; 8; 8; 9; 10, ei myöskään ole symmetrinen. Se on vinoutunut oikealle.

Kuvio 3

Keskiarvo on 7,7, mediaani on 7,5 ja moodi on seitsemän. Kolmesta tilastosta keskiarvo on suurin, kun taas moodi on pienin. Jälleen kerran keskiarvo heijastaa vinoutta eniten.

Yhteenvetona voidaan todeta, että yleensä jos aineiston jakauma on vasemmalle vinoutunut, keskiarvo on pienempi kuin mediaani, joka on usein pienempi kuin moodi. Jos datan jakauma on vino oikealle, moodi on usein pienempi kuin mediaani, joka on pienempi kuin keskiarvo.

Vinoudesta ja symmetriasta tulee tärkeitä, kun keskustelemme todennäköisyysjakaumista myöhemmissä luvuissa.

Tässä on video, jossa esitetään yhteenveto siitä, miten keskiarvo, mediaani ja moodi voivat auttaa meitä kuvaamaan datajoukon vinouden. Älä huolehdi termeistä leptokurttinen ja platykurttinen tällä kurssilla.

Esimerkki

Tilastoja käytetään vertailuun ja joskus tekijöiden tunnistamiseen. Seuraavissa luetteloissa esitetään yksinkertainen satunnaisotos, jossa verrataan kolmen kirjoittajan kirjainlukuja.

Terry: 7; 9; 3; 3; 3; 3; 4; 1; 3; 2; 2
Davis: 3; 3; 3; 4; 1; 4; 3; 2; 3; 1
Maris: 2; 3; 4; 4; 4; 4; 6; 6; 6; 6; 8; 3

  1. Tehdään pistekuvio kolmesta kirjoittajasta ja verrataan muotoja.
  2. Laskekaa jokaiselle keskiarvo.
  3. Laskekaa jokaiselle mediaani.
  4. Kuvaile havaitsemiasi kuvioita muodon ja keskipisteen mittojen välillä.
Näytä ratkaisu


  1. Terryn jakaumalla on oikea (positiivinen) vinous.

    Davisin jakaumalla on vasemmanpuoleinen (negatiivinen) vinous

    Maris jakauma on symmetrisesti muotoiltu.
  2. Terryn keskiarvo on 3,7, Davisin keskiarvo on 2,7, Marisin keskiarvo on 4,6.
  3. Terryn mediaani on kolme, Davisin mediaani on kolme. Marisin mediaani on neljä.
  4. Näyttää siltä, että mediaani on aina lähimpänä korkeinta pistettä (moodia), kun taas keskiarvo on yleensä kauempana hännillä. Symmetrisessä jakaumassa keskiarvo ja mediaani ovat molemmat keskellä lähellä jakauman korkeinta pistettä.

Katsomalla aineiston jakaumaa voidaan paljastaa paljon keskiarvon, mediaanin ja moodin välisestä suhteesta. Jakaumia on kolmenlaisia. Oikea (tai positiivinen) vino jakauma on muodoltaan kuvan 3 kaltainen. Vasemmanpuoleisen (tai negatiivisen) vinon jakauman muoto on kuvan 2 kaltainen. Symmetrinen jakauma on kuvan 1 kaltainen.

Vastaa

Sähköpostiosoitettasi ei julkaista.