Introduction to Statistics
Learning Outcomes
- Erkennen, beschreiben und berechnen Sie die Maße für die Mitte von Daten: Mittelwert, Median und Modus.
Betrachten Sie den folgenden Datensatz.
4; 5; 6; 6; 6; 7; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10
Dieser Datensatz kann durch folgendes Histogramm dargestellt werden. Jedes Intervall hat die Breite eins, und jeder Wert befindet sich in der Mitte eines Intervalls.
Das Histogramm zeigt eine symmetrische Verteilung der Daten. Eine Verteilung ist symmetrisch, wenn an einem Punkt des Histogramms eine vertikale Linie gezogen werden kann, so dass die Form links und rechts der vertikalen Linie spiegelbildlich zueinander ist. Der Mittelwert, der Median und der Modus sind jeweils sieben für diese Daten. Bei einer perfekt symmetrischen Verteilung sind der Mittelwert und der Median identisch. In diesem Beispiel gibt es nur einen Modus (unimodal), und der Modus ist derselbe wie der Mittelwert und der Median. Bei einer symmetrischen Verteilung mit zwei Modi (bimodal) würden sich die beiden Modi von Mittelwert und Median unterscheiden.
Das Histogramm für die Daten: 4; 5; 6; 6; 6; 7; 7; 7; 7; 8 ist nicht symmetrisch. Die rechte Seite scheint im Vergleich zur linken Seite „abgehackt“ zu sein. Eine solche Verteilung wird als linksschief bezeichnet, weil sie nach links ausgezogen ist.
Der Mittelwert ist 6,3, der Median ist 6,5 und der Modus ist sieben. Beachten Sie, dass der Mittelwert kleiner ist als der Median und beide kleiner sind als der Modus. Sowohl der Mittelwert als auch der Median spiegeln die Schieflage wider, aber der Mittelwert spiegelt sie stärker wider.
Das Histogramm für die Daten: 6; 7; 7; 7; 7; 8; 8; 8; 9; 10, ist ebenfalls nicht symmetrisch. Es ist schief nach rechts.
Der Mittelwert ist 7,7, der Median ist 7,5 und der Modus ist sieben. Von den drei Statistiken ist der Mittelwert der größte, während der Modus der kleinste ist. Auch hier spiegelt der Mittelwert die Schieflage am stärksten wider.
Zusammenfassend lässt sich sagen, dass bei einer linksschiefen Verteilung der Daten der Mittelwert im Allgemeinen kleiner ist als der Median, der wiederum oft kleiner ist als der Modus. Wenn die Verteilung der Daten nach rechts schief ist, ist der Modus oft kleiner als der Median, der wiederum kleiner als der Mittelwert ist.
Schiefe und Symmetrie werden wichtig, wenn wir in späteren Kapiteln Wahrscheinlichkeitsverteilungen besprechen.
Hier ist ein Video, das zusammenfasst, wie Mittelwert, Median und Modus uns helfen können, die Schiefe eines Datensatzes zu beschreiben. Kümmern Sie sich in diesem Kurs nicht um die Begriffe leptokurtisch und platykurtisch.
Beispiel
Statistiken werden verwendet, um Autoren zu vergleichen und manchmal zu identifizieren. Die folgende Liste zeigt eine einfache Stichprobe, die die Anzahl der Buchstaben von drei Autoren vergleicht.
Terry: 7; 9; 3; 3; 3; 4; 1; 3; 2; 2
Davis: 3; 3; 3; 4; 1; 4; 3; 2; 3; 1
Maris: 2; 3; 4; 4; 4; 6; 6; 6; 8; 3
- Erstelle ein Punktdiagramm für die drei Autoren und vergleiche die Formen.
- Berechne für jeden den Mittelwert.
- Berechne für jeden den Median.
- Beschreibe jedes Muster, das du zwischen der Form und den Maßen der Mitte bemerkst.
Die Betrachtung der Verteilung von Daten kann viel über die Beziehung zwischen Mittelwert, Median und Modus verraten. Es gibt drei Arten von Verteilungen. Eine rechtsschiefe (oder positive) Verteilung hat eine Form wie in Abbildung 3. Eine linksschiefe (oder negative) Verteilung hat eine Form wie in Abbildung 2. Eine symmetrische Verteilung sieht wie in Abbildung 1 aus.