Úvod do statistiky

Výstupy z učení

  • Rozpoznat, popsat a vypočítat míry středu dat: průměr, medián a modus.

Podívejte se na následující soubor dat:
4; 5; 6; 6; 6; 7; 7; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10
Tento soubor dat lze znázornit následujícím histogramem. Každý interval má šířku jedna a každá hodnota se nachází uprostřed intervalu.

Obrázek 1

Histogram zobrazuje symetrické rozložení dat. Rozdělení je symetrické, pokud lze v některém bodě histogramu vést svislou čáru tak, že tvar nalevo a napravo od svislé čáry jsou navzájem zrcadlovými obrazy. Střední hodnota, medián a modus jsou pro tato data každý sedm. V dokonale symetrickém rozdělení jsou střední hodnota a medián stejné. Tento příklad má jeden modus (unimodální) a modus je stejný jako průměr a medián. V symetrickém rozdělení, které má dva mody (bimodální), by se oba mody lišily od průměru a mediánu.

Histogram pro tato data: V případě, že je histogram symetrický, není symetrický: 4; 5; 6; 6; 6; 7; 7; 7; 7; 8. Pravá strana se zdá být „useknutá“ ve srovnání s levou stranou. Rozdělení tohoto typu se nazývá zkosené doleva, protože je vytažené doleva.

Obrázek 2

Průměr je 6,3, medián je 6,5 a modus je sedm. Všimněte si, že průměr je menší než medián a oba jsou menší než modus. Průměr i medián odrážejí zkreslení, ale průměr ho odráží více.
Histogram pro data: V tomto případě se jedná o nesymetrický histogram, který je také nesymetrický: 6; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10. Je zkosený doprava.

Obrázek 3

Průměr je 7,7, medián je 7,5 a modus je sedm. Z těchto tří statistik je průměr největší, zatímco modus je nejmenší. Opět platí, že průměr nejvíce odráží zkreslení.

Shrneme-li, obecně platí, že pokud je rozdělení dat zkreslené doleva, je průměr menší než medián, který je často menší než modus. Je-li rozdělení dat zešikmené doprava, je modus často menší než medián, který je menší než průměr.

Šikmost a symetrie se stanou důležitými, až budeme v dalších kapitolách probírat rozdělení pravděpodobnosti.

Tady je video, které shrnuje, jak nám průměr, medián a modus mohou pomoci popsat zešikmení souboru dat. S pojmy leptokurtická a platykurtická si pro tento kurz nedělejte starosti.

Příklad

Statistiky se používají k porovnávání a někdy i k identifikaci autorů. Následující seznamy ukazují jednoduchý náhodný vzorek, který porovnává počty písmen u tří autorů.

Terry: 7; 9; 3; 3; 3; 4; 1; 3; 2; 2
Davis: 3; 3; 3; 4; 1; 4; 3; 2; 3; 1
Maris: 2; 3; 4; 4; 4; 6; 6; 6; 8; 3

  1. Vytvořte bodový graf pro tyto tři autory a porovnejte jejich tvary.
  2. Vypočítejte průměr pro každého z nich.
  3. Vypočítejte medián pro každého z nich.
  4. Popsat všechny zákonitosti, kterých si všimnete mezi tvarem a mírami středu.
Zobrazit řešení


  1. Terryho rozdělení má pravé (kladné) zkosení.

    Davisovo rozdělení má levé (záporné) zkosení

    Marisovo rozdělení má symetrický tvar.
  2. Terryho průměr je 3,7, Davisův průměr je 2,7, Marisův průměr je 4,6.
  3. Terryho medián je tři, Davisův medián je tři. Marisův medián je čtyři.
  4. Ukazuje se, že medián je vždy nejblíže nejvyššímu bodu (modu), zatímco průměr má tendenci být dále na chvostu. V symetrickém rozdělení jsou průměr i medián umístěny uprostřed blízko nejvyššího bodu rozdělení.

Pohledem na rozdělení dat lze zjistit mnoho o vztahu mezi průměrem, mediánem a modem. Existují tři typy rozdělení. Pravoúhlé (neboli kladně zkosené) rozdělení má tvar jako na obrázku 3. Levě (neboli záporně) zkosené rozdělení má tvar jako na obrázku 2 . Symetrické rozdělení vypadá jako obrázek 1.

.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.