Úvod do statistiky
Výstupy z učení
- Rozpoznat, popsat a vypočítat míry středu dat: průměr, medián a modus.
Podívejte se na následující soubor dat:
4; 5; 6; 6; 6; 7; 7; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10
Tento soubor dat lze znázornit následujícím histogramem. Každý interval má šířku jedna a každá hodnota se nachází uprostřed intervalu.
Histogram zobrazuje symetrické rozložení dat. Rozdělení je symetrické, pokud lze v některém bodě histogramu vést svislou čáru tak, že tvar nalevo a napravo od svislé čáry jsou navzájem zrcadlovými obrazy. Střední hodnota, medián a modus jsou pro tato data každý sedm. V dokonale symetrickém rozdělení jsou střední hodnota a medián stejné. Tento příklad má jeden modus (unimodální) a modus je stejný jako průměr a medián. V symetrickém rozdělení, které má dva mody (bimodální), by se oba mody lišily od průměru a mediánu.
Histogram pro tato data: V případě, že je histogram symetrický, není symetrický: 4; 5; 6; 6; 6; 7; 7; 7; 7; 8. Pravá strana se zdá být „useknutá“ ve srovnání s levou stranou. Rozdělení tohoto typu se nazývá zkosené doleva, protože je vytažené doleva.
Průměr je 6,3, medián je 6,5 a modus je sedm. Všimněte si, že průměr je menší než medián a oba jsou menší než modus. Průměr i medián odrážejí zkreslení, ale průměr ho odráží více.
Histogram pro data: V tomto případě se jedná o nesymetrický histogram, který je také nesymetrický: 6; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10. Je zkosený doprava.
Průměr je 7,7, medián je 7,5 a modus je sedm. Z těchto tří statistik je průměr největší, zatímco modus je nejmenší. Opět platí, že průměr nejvíce odráží zkreslení.
Shrneme-li, obecně platí, že pokud je rozdělení dat zkreslené doleva, je průměr menší než medián, který je často menší než modus. Je-li rozdělení dat zešikmené doprava, je modus často menší než medián, který je menší než průměr.
Šikmost a symetrie se stanou důležitými, až budeme v dalších kapitolách probírat rozdělení pravděpodobnosti.
Tady je video, které shrnuje, jak nám průměr, medián a modus mohou pomoci popsat zešikmení souboru dat. S pojmy leptokurtická a platykurtická si pro tento kurz nedělejte starosti.
Příklad
Statistiky se používají k porovnávání a někdy i k identifikaci autorů. Následující seznamy ukazují jednoduchý náhodný vzorek, který porovnává počty písmen u tří autorů.
Terry: 7; 9; 3; 3; 3; 4; 1; 3; 2; 2
Davis: 3; 3; 3; 4; 1; 4; 3; 2; 3; 1
Maris: 2; 3; 4; 4; 4; 6; 6; 6; 8; 3
- Vytvořte bodový graf pro tyto tři autory a porovnejte jejich tvary.
- Vypočítejte průměr pro každého z nich.
- Vypočítejte medián pro každého z nich.
- Popsat všechny zákonitosti, kterých si všimnete mezi tvarem a mírami středu.
Pohledem na rozdělení dat lze zjistit mnoho o vztahu mezi průměrem, mediánem a modem. Existují tři typy rozdělení. Pravoúhlé (neboli kladně zkosené) rozdělení má tvar jako na obrázku 3. Levě (neboli záporně) zkosené rozdělení má tvar jako na obrázku 2 . Symetrické rozdělení vypadá jako obrázek 1.
.