Tema 5 (I).
Dentro del resumen numérico de una serie de estadística, podemos encontrarnos 3 tipos de medidas:
- Medidas de tendencia central, dan ideas de los valores alrededor de las cuales el resto de los datos tienen tendencia a agruparse (media, mediana y moda).
- Medidas de posición, dividen un conjuntos ordenado de datos en grupos con la misma de individuos (cuartiles, deciles y percentiles).
- Medidas de dispersión o variabilidad, dan información acerca de la heterogeneidad de nuestras, observaciones (rango, desviación media, varianza, desviación tipico, coeficiente de variación).
Medidas de tendencia central.
- Media aritmética o media (x), se calcula para variables cuantitativas y se trata del centro geométrico o de gravedad de nuestros dato. Su formula de puede observar en la siguiente imagen:
- Propiedades de la media:
- La suma de las desviaciones respecto de la media es igual a cero.
- La media no se altera por una transformación lineal de escala:
- Si a un conjuntos de datos cuya media es x, se le suma a cada datos una constante k, la media aumenta en k unidades.
- Si es un conjunto de datos cuya media es x, se multiplica cada datos por una constantes k, la media queda multiplicada por k.
- Es muy sensible a lo puntuaciones extremas.
Hay que tener en cuenta que hay otras medidas:
- Media geométrica (G).
- Media armónica (H).
- Media aritmética (X).
La mediana es la puntuación que ocupa la posición central de la distribución, para poder hallarla necesitamos que nuestros que nuestros datos estén ordenados, de forma creciente o decreciente. Si la media y la mediana son iguales, la distribución de la variable es simétrica y a diferencia de la media aritmética, la mediana es más robusta y menos sensibles a los valores extremos.
Si el número de observaciones es impar el valor de las observaciones sera justamente la observación que ocupa la posición (n+1)/2.
Si el número de observaciones es par, el valor de la mediana corresponde a la media entre los dos valores centrales, es decir, la media entre la observación n/2 y la observación (n/2)+1.
La moda es el valor con mayor frecuencia que mas veces se repite. La distribuciones que contienen una sola moda se llaman unimodales. Si hay más de una se dice que la muestra es biomodal (dos modas) o multimodal (más de dos). Para explicar mejor estos 3 conceptos vamos a ver un ejemplo:
Si la siguiente distribución de frecuencias 18, 19, 19, 19, 23. La distribución que contienen una sola moda se llaman unimodales.
Los que contienen dos modas se llaman bimodales: 18, 19, 19, 19, 22, 22, 22, 23, 27.
En la medida de posición podemos encontrarnos con 3 tipos:
- Cuantiles se calculan para variables cuantitativas y, al igual que la mediana, sólo tienen en cuenta la posición de los valores en la muestra. Se puede definir cuantil de orden "n" como un valor de la variable.
- Percentiles se dividen la muestra ordenada en 100 partes. Los percentiles son las 99 puntos o valores que dividen la distribución en cien partes iguales. Se representan por P(n).
- Deciles se dividen la muestra ordenada en 10 partes. los deciles son los nueve valores que dividen a la distribución en diez partes iguales. Cada partes incluyen el 10% de los valores de la distribución. Se representan por la letra D. Dentro de los deciles podemos encontrarnos los cuartiles.
- Los cuartiles dividen la muestra ordenada en 4 partes:
- Q1: primer cuartil indica el valor que ocupa una posición en la seria numérica de forma que el 25% de las observaciones son menores y que el 75% son mayores.
- Q2: segundo cuartil indica el valor que ocupa una posición en la seria numérica de forma que el 50% de las observaciones son menores y que el 50% son mayores. Por tanto, el Q2 coincide con el valor del D5, con al valor de la mediana P50.
- Q3: tercer cuartil indica el valor que ocupa una posición en la seria numérica de forma que el 75% de las observaciones son menores y que el 25% son mayores.
- Q4: cuarto cuartil indica el valor mayor que se alcanza en la seria numérica.
Para entender estos 4 conceptos nuevos podemos ver un ejemplo con la siguiente imagen: