Introducere în statistică

Learning Outcomes

  • Recunoașteți, descrieți și calculați măsurile centrului datelor: media, mediana și modul.

Considerați următorul set de date.
4; 5; 5; 6; 6; 6; 6; 7; 7; 7; 7; 7; 7; 7; 7; 7; 7; 7; 8; 8; 8; 8; 9; 10
Acest set de date poate fi reprezentat prin următoarea histogramă. Fiecare interval are lățimea unu, iar fiecare valoare este situată în mijlocul unui interval.

Figura 1

Histograma prezintă o distribuție simetrică a datelor. O distribuție este simetrică dacă la un anumit punct al histogramei se poate trasa o linie verticală astfel încât forma din stânga și din dreapta liniei verticale să fie imagini în oglindă una față de cealaltă. Media, mediana și modul sunt fiecare șapte pentru aceste date. Într-o distribuție perfect simetrică, media și mediana sunt identice. Acest exemplu are un singur mod (unimodal), iar modul este același cu media și mediana. Într-o distribuție simetrică care are două moduri (bimodală), cele două moduri ar fi diferite de medie și mediană.

Histograma pentru aceste date: 4; 5; 6; 6; 6; 6; 6; 7; 7; 7; 7; 7; 8 nu este simetrică. Partea dreaptă pare „tăiată” în comparație cu partea stângă. O distribuție de acest tip se numește înclinată spre stânga, deoarece este trasă spre stânga.

Figura 2

Media este 6,3, mediana este 6,5, iar modul este șapte. Observați că media este mai mică decât mediana, iar ambele sunt mai mici decât modul. Atât media, cât și mediana reflectă înclinarea, dar media o reflectă mai mult.
Histograma pentru date: 6; 7; 7; 7; 7; 7; 7; 8; 8; 8; 8; 9; 10, de asemenea, nu este simetrică. Ea este înclinată spre dreapta.

Figura 3

Media este 7,7, mediana este 7,5, iar modul este șapte. Dintre cele trei statistici, media este cea mai mare, în timp ce modul este cel mai mic. Din nou, media reflectă cel mai mult înclinarea.

Pentru a rezuma, în general, dacă distribuția datelor este înclinată spre stânga, media este mai mică decât mediana, care este adesea mai mică decât modul. Dacă distribuția datelor este înclinată spre dreapta, modul este adesea mai mic decât mediana, care este mai mică decât media.

Skewness și simetria devin importante atunci când discutăm despre distribuțiile de probabilitate în capitolele ulterioare.

Iată un videoclip care rezumă modul în care media, mediana și modul ne pot ajuta să descriem skewness-ul unui set de date. Nu vă faceți griji cu privire la termenii leptokurtic și platykurtic pentru acest curs.

Exemplu

Statisticile sunt folosite pentru a compara și, uneori, pentru a identifica autorii. Următoarele liste prezintă un eșantion aleatoriu simplu care compară numărul de litere pentru trei autori.

Terry: 7; 9; 3; 3; 3; 3; 4; 1; 3; 2; 2
Davis: 3; 3; 3; 3; 4; 1; 4; 3; 3; 2; 3; 1
Maris: 2; 3; 4; 4; 4; 4; 4; 6; 6; 6; 8; 3

  1. Realizați un grafic cu puncte pentru cei trei autori și comparați formele.
  2. Calculați media pentru fiecare.
  3. Calculați mediana pentru fiecare.
  4. Descrieți orice model pe care îl observați între formă și măsurile de centru.
Arată soluția


  1. Distribuția lui Terry are o înclinație spre dreapta (pozitivă).

    Distribuția lui Davis are o înclinație spre stânga (negativă)

    Distribuția lui Maris are o formă simetrică.
  2. Media lui Terry este 3,7, media lui Davis este 2,7, media lui Maris este 4,6.
  3. Mediana lui Terry este trei, mediana lui Davis este trei. Mediana lui Maris este patru.
  4. Se pare că mediana este întotdeauna cea mai apropiată de punctul cel mai înalt (modul), în timp ce media tinde să fie mai departe pe coadă. Într-o distribuție simetrică, atât media, cât și mediana sunt situate central, aproape de punctul înalt al distribuției.

Observarea distribuției datelor poate dezvălui multe despre relația dintre medie, mediană și modă. Există trei tipuri de distribuții. O distribuție înclinată spre dreapta (sau pozitivă) are o formă precum cea din figura 3. O distribuție înclinată spre stânga (sau negativă) are o formă asemănătoare cu cea din figura 2 . O distribuție simetrică are aspectul din Figura 1.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.