Bevezetés a statisztikába
Learning Outcomes
- Megismeri, leírja és kiszámítja az adatok középpontjának mértékegységeit: az átlagot, a mediánt és a móduszt.
Vizsgálja meg a következő adatsort.
4; 5; 6; 6; 6; 6; 7; 7; 7; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10
Ezt az adatsort a következő hisztogrammal lehet ábrázolni. Minden intervallum szélessége egy, és minden érték az intervallum közepén helyezkedik el.
A hisztogram az adatok szimmetrikus eloszlását mutatja. Egy eloszlás akkor szimmetrikus, ha a hisztogram valamelyik pontján egy függőleges vonal húzható úgy, hogy a függőleges vonaltól balra és jobbra lévő alakzat egymás tükörképei legyenek. Az átlag, a medián és a módusz ezeknél az adatoknál egyenként hét. Tökéletesen szimmetrikus eloszlásban az átlag és a medián megegyezik. Ebben a példában egy módusz van (unimodális), és a módusz megegyezik az átlaggal és a mediánnal. Egy olyan szimmetrikus eloszlásban, amelynek két módusza van (bimodális), a két módus eltérne az átlagtól és a mediántól.
Az adatok hisztogramja: 4; 5; 6; 6; 6; 6; 6; 7; 7; 7; 7; 7; 8 nem szimmetrikus. A jobb oldal “levágottnak” tűnik a bal oldalhoz képest. Az ilyen típusú eloszlást balra ferdének nevezzük, mert balra húzódik.
Az átlag 6,3, a medián 6,5, a módusz pedig hét. Vegyük észre, hogy az átlag kisebb, mint a medián, és mindkettő kisebb, mint a módusz. Az átlag és a medián is tükrözi a ferdeséget, de az átlag jobban tükrözi azt.
Az adatok hisztogramja: 6; 7; 7; 7; 7; 7; 7; 8; 8; 8; 8; 9; 10, szintén nem szimmetrikus. Jobbra ferde.
Az átlag 7,7, a medián 7,5, a módusz pedig hét. A három statisztika közül az átlag a legnagyobb, míg a módusz a legkisebb. Ismét az átlag tükrözi leginkább a ferdeséget.
Összefoglalva, általában, ha az adatok eloszlása balra ferde, az átlag kisebb, mint a medián, amely gyakran kisebb, mint a módusz. Ha az adatok eloszlása jobbra ferde, a módusz gyakran kisebb, mint a medián, ami kisebb, mint az átlag.
A ferdeség és a szimmetria fontos lesz, amikor a valószínűségi eloszlásokat tárgyaljuk a későbbi fejezetekben.
Itt egy videó, amely összefoglalja, hogyan segíthet az átlag, a medián és a módusz leírni egy adathalmaz ferdeségét. A leptokurtikus és platykurtikus kifejezésekkel ezen a tanfolyamon ne foglalkozzunk.
Példa
A statisztikákat a szerzők összehasonlítására és néha azonosítására használjuk. Az alábbi listák egy egyszerű véletlenszerű mintát mutatnak, amely három szerző betűszámát hasonlítja össze.
Terry: 7; 9; 3; 3; 3; 3; 4; 1; 3; 2; 2
Davis: 3; 3; 3; 4; 1; 4; 3; 2; 3; 1
Maris: 2; 3; 4; 4; 4; 4; 6; 6; 6; 6; 8; 3
- Készítsen pontdiagramot a három szerzőre, és hasonlítsa össze az alakzatokat.
- Kalkulálja ki mindegyiknek az átlagát.
- Kalkulálja ki mindegyiknek a mediánját.
- Írd le az alak és a középponti mértékek között észlelt mintázatot.
Az adatok eloszlását vizsgálva sokat megtudhatunk az átlag, a medián és a módusz közötti kapcsolatról. Háromféle eloszlás létezik. A jobbra (vagy pozitívan) ferde eloszlás a 3. ábrához hasonló alakú. A bal (vagy negatív) ferde eloszlás a 2. ábrához hasonló alakú. A szimmetrikus eloszlás az 1. ábra szerint néz ki.