Introduzione alla statistica
Risultati dell’apprendimento
- Riconoscere, descrivere e calcolare le misure del centro dei dati: media, mediana e modo.
Considera la seguente serie di dati.
4; 5; 6; 6; 6; 7; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10
Questa serie di dati può essere rappresentata dal seguente istogramma. Ogni intervallo ha larghezza uno, e ogni valore si trova nel mezzo di un intervallo.
L’istogramma mostra una distribuzione simmetrica dei dati. Una distribuzione è simmetrica se una linea verticale può essere disegnata in qualche punto dell’istogramma in modo tale che la forma a sinistra e a destra della linea verticale siano immagini speculari l’una dell’altra. La media, la mediana e la modalità sono sette per questi dati. In una distribuzione perfettamente simmetrica, la media e la mediana sono uguali. Questo esempio ha una modalità (unimodale), e la modalità è la stessa della media e della mediana. In una distribuzione simmetrica che ha due modalità (bimodale), le due modalità sarebbero diverse dalla media e dalla mediana.
L’istogramma dei dati: 4; 5; 6; 6; 6; 6; 7; 7; 7; 7; 8 non è simmetrico. Il lato destro sembra “tagliato fuori” rispetto al lato sinistro. Una distribuzione di questo tipo è chiamata inclinata a sinistra perché è tirata verso sinistra.
La media è 6,3, la mediana è 6,5, e la modalità è sette. Notate che la media è inferiore alla mediana, ed entrambe sono inferiori alla modalità. La media e la mediana riflettono entrambe l’inclinazione, ma la media la riflette di più.
L’istogramma per i dati: 6; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10, non è simmetrico. È inclinato a destra.
La media è 7,7, la mediana è 7,5 e la modalità è sette. Delle tre statistiche, la media è la più grande, mentre la modalità è la più piccola. Di nuovo, la media riflette la distorsione più grande.
Per riassumere, generalmente se la distribuzione dei dati è distorta a sinistra, la media è inferiore alla mediana, che spesso è inferiore alla modalità. Se la distribuzione dei dati è inclinata verso destra, la modalità è spesso inferiore alla mediana, che è inferiore alla media.
L’asimmetria e la simmetria diventano importanti quando discutiamo le distribuzioni di probabilità nei capitoli successivi.
Ecco un video che riassume come la media, la mediana e la modalità possono aiutarci a descrivere l’asimmetria di un set di dati. Non preoccupatevi dei termini leptokurtic e platykurtic per questo corso.
Esempio
Le statistiche sono usate per confrontare e talvolta identificare gli autori. La seguente lista mostra un semplice campione casuale che confronta il numero di lettere di tre autori.
Terry: 7; 9; 3; 3; 3; 3; 4; 1; 3; 2; 2
Davis: 3; 3; 3; 3; 4; 1; 4; 3; 2; 3; 1
Maris: 2; 3; 4; 4; 4; 6; 6; 6; 8; 3
- Fate un dot plot per i tre autori e confrontate le forme.
- Calcolare la media per ciascuno.
- Calcolare la mediana per ciascuno.
- Descrivi qualsiasi schema che noti tra la forma e le misure del centro.
Guardare la distribuzione dei dati può rivelare molto sulla relazione tra la media, la mediana e la modalità. Ci sono tre tipi di distribuzioni. Una distribuzione inclinata a destra (o positiva) ha una forma simile alla figura 3. Una distribuzione asimmetrica sinistra (o negativa) ha una forma come quella della figura 2. Una distribuzione simmetrica ha una forma come la figura 1.
.