Introducción a la estadística
Resultados de aprendizaje
- Reconocer, describir y calcular las medidas del centro de los datos: media, mediana y moda.
Considera el siguiente conjunto de datos.
4; 5; 6; 6; 6; 7; 7; 7; 7; 7; 7; 8; 8; 9; 10
Este conjunto de datos se puede representar mediante el siguiente histograma. Cada intervalo tiene una anchura de uno, y cada valor está situado en el centro de un intervalo.
El histograma muestra una distribución simétrica de los datos. Una distribución es simétrica si se puede trazar una línea vertical en algún punto del histograma de manera que la forma a la izquierda y a la derecha de la línea vertical sean imágenes especulares entre sí. La media, la mediana y la moda son cada una siete para estos datos. En una distribución perfectamente simétrica, la media y la mediana son iguales. Este ejemplo tiene una moda (unimodal), y la moda es la misma que la media y la mediana. En una distribución simétrica que tiene dos modos (bimodal), los dos modos serían diferentes de la media y la mediana.
El histograma para los datos: 4; 5; 6; 6; 6; 7; 7; 7; 8 no es simétrico. El lado derecho parece «cortado» en comparación con el lado izquierdo. Una distribución de este tipo se denomina sesgada a la izquierda porque está arrancada hacia la izquierda.
La media es 6,3, la mediana es 6,5 y la moda es siete. Observa que la media es menor que la mediana, y ambas son menores que la moda. Tanto la media como la mediana reflejan el sesgo, pero la media lo refleja más.
El histograma de los datos: 6; 7; 7; 7; 7; 8; 8; 9; 10, tampoco es simétrico. Está sesgado hacia la derecha.
La media es 7,7, la mediana es 7,5 y la moda es siete. De las tres estadísticas, la media es la mayor, mientras que la moda es la menor. De nuevo, la media es la que más refleja el sesgo.
Para resumir, generalmente si la distribución de los datos está sesgada a la izquierda, la media es menor que la mediana, que a menudo es menor que la moda. Si la distribución de los datos está sesgada hacia la derecha, la moda suele ser menor que la mediana, que a su vez es menor que la media.
La asimetría y la simetría cobran importancia cuando analizamos las distribuciones de probabilidad en capítulos posteriores.
Aquí hay un vídeo que resume cómo la media, la mediana y la moda pueden ayudarnos a describir la asimetría de un conjunto de datos. No te preocupes por los términos leptocúrtico y platicúrtico para este curso.
Ejemplo
Las estadísticas se utilizan para comparar y a veces identificar autores. Las siguientes listas muestran una simple muestra aleatoria que compara los recuentos de letras de tres autores.
Terry: 7; 9; 3; 3; 3; 4; 1; 3; 2; 2
Davis: 3; 3; 3; 4; 1; 4; 3; 2; 3; 1
Maris: 2; 3; 4; 4; 4; 6; 6; 8; 3
- Haga un gráfico de puntos para los tres autores y compare las formas.
- Calcula la media de cada uno.
- Calcula la mediana de cada uno.
- Describa cualquier patrón que observe entre la forma y las medidas del centro.
Mirar la distribución de los datos puede revelar mucho sobre la relación entre la media, la mediana y la moda. Hay tres tipos de distribuciones. Una distribución sesgada a la derecha (o positiva) tiene una forma como la de la figura 3. Una distribución sesgada a la izquierda (o negativa) tiene una forma como la de la figura 2 . Una distribución simétrica tiene la forma de la figura 1.