Introducere în statistică
Learning Outcomes
- Recunoașteți, descrieți și calculați măsurile centrului datelor: media, mediana și modul.
Considerați următorul set de date.
4; 5; 5; 6; 6; 6; 6; 7; 7; 7; 7; 7; 7; 7; 7; 7; 7; 7; 8; 8; 8; 8; 9; 10
Acest set de date poate fi reprezentat prin următoarea histogramă. Fiecare interval are lățimea unu, iar fiecare valoare este situată în mijlocul unui interval.
Histograma prezintă o distribuție simetrică a datelor. O distribuție este simetrică dacă la un anumit punct al histogramei se poate trasa o linie verticală astfel încât forma din stânga și din dreapta liniei verticale să fie imagini în oglindă una față de cealaltă. Media, mediana și modul sunt fiecare șapte pentru aceste date. Într-o distribuție perfect simetrică, media și mediana sunt identice. Acest exemplu are un singur mod (unimodal), iar modul este același cu media și mediana. Într-o distribuție simetrică care are două moduri (bimodală), cele două moduri ar fi diferite de medie și mediană.
Histograma pentru aceste date: 4; 5; 6; 6; 6; 6; 6; 7; 7; 7; 7; 7; 8 nu este simetrică. Partea dreaptă pare „tăiată” în comparație cu partea stângă. O distribuție de acest tip se numește înclinată spre stânga, deoarece este trasă spre stânga.
Media este 6,3, mediana este 6,5, iar modul este șapte. Observați că media este mai mică decât mediana, iar ambele sunt mai mici decât modul. Atât media, cât și mediana reflectă înclinarea, dar media o reflectă mai mult.
Histograma pentru date: 6; 7; 7; 7; 7; 7; 7; 8; 8; 8; 8; 9; 10, de asemenea, nu este simetrică. Ea este înclinată spre dreapta.
Media este 7,7, mediana este 7,5, iar modul este șapte. Dintre cele trei statistici, media este cea mai mare, în timp ce modul este cel mai mic. Din nou, media reflectă cel mai mult înclinarea.
Pentru a rezuma, în general, dacă distribuția datelor este înclinată spre stânga, media este mai mică decât mediana, care este adesea mai mică decât modul. Dacă distribuția datelor este înclinată spre dreapta, modul este adesea mai mic decât mediana, care este mai mică decât media.
Skewness și simetria devin importante atunci când discutăm despre distribuțiile de probabilitate în capitolele ulterioare.
Iată un videoclip care rezumă modul în care media, mediana și modul ne pot ajuta să descriem skewness-ul unui set de date. Nu vă faceți griji cu privire la termenii leptokurtic și platykurtic pentru acest curs.
Exemplu
Statisticile sunt folosite pentru a compara și, uneori, pentru a identifica autorii. Următoarele liste prezintă un eșantion aleatoriu simplu care compară numărul de litere pentru trei autori.
Terry: 7; 9; 3; 3; 3; 3; 4; 1; 3; 2; 2
Davis: 3; 3; 3; 3; 4; 1; 4; 3; 3; 2; 3; 1
Maris: 2; 3; 4; 4; 4; 4; 4; 6; 6; 6; 8; 3
- Realizați un grafic cu puncte pentru cei trei autori și comparați formele.
- Calculați media pentru fiecare.
- Calculați mediana pentru fiecare.
- Descrieți orice model pe care îl observați între formă și măsurile de centru.
Observarea distribuției datelor poate dezvălui multe despre relația dintre medie, mediană și modă. Există trei tipuri de distribuții. O distribuție înclinată spre dreapta (sau pozitivă) are o formă precum cea din figura 3. O distribuție înclinată spre stânga (sau negativă) are o formă asemănătoare cu cea din figura 2 . O distribuție simetrică are aspectul din Figura 1.
.