martes, 19 de mayo de 2020

Tema 9: Introducción a la inferencia estadística. Intervalos de confianza y contraste de Hipótesis.


Tema 9 (I).

La estadística analítica o inferencial se ocupa de generalizar los datos obtenidos en la muestra a la población de la que procede. Al extenderse los resultados de la muestra a un colectivo mayor, asumimos que puede haber variables o elementos en la población que difieran de los que componen la muestra, y por eso, asumimos que al inferir o generalizar los hallazgos obtenidos en la muestra a la población, tenemos alguna probabilidad de cometer un error.

Inferencia estadística.

Tiene como objetivo "inferir", o sea , establecer conclusiones sobre una población a partir de los resultados obtenidos de una muestra , todo ello, con un determinado nivel de seguridad o intervalo de confianza.

La inferencia exige la aleatoriedad  en la selección de los sujetos que forman la muestra:
  • Población.
  • Muestra.
  • Muestra independiente.
  • Muestra dependiente.
Dos formas de inferencia estadística:
  • Estimación del valor a partir de un valor de la muestra.
    • Estadístico/ Estimador: Índice que representa una información de la muestra estudiada.
    • Las propiedades deseables de un estimador son las siguientes:
      • Insesgadez: Un estimador es insesgado cuando la esperanza matemática del este es igual al parámetro que desea estimar.
      • Eficiente: Un estimador es más eficiente o tiene la capacidad de estimar de forma precisa cuando su varianza es reducida.
      • Consistencia: Un estimador consistente es aquel que a medida que la medida que la muestra crece se aproxima cada vez más al valor real del parámetro.
      • Parámetro: Cada uno de los estadístico que tras inferirse, nos proporcionan información sobre la población.
  • Contraste de hipótesis, a partir de valores de la muestra, se concluye si hay diferencias entre ellos en la población. 
  • X: media aritmética.
  • S: desviación típica.
  • P: valor de la probabilidad, nivel de significación.
Las dos formas de inferencia estadística.

Estimación de parámetros poblacionales: que pueden ser puntual o por intervalos. En la estimación de parámetros se calcula cuál será el valor que se pueden encontrar en la población a partir de los datos obtenidos en la muestra que ha participado en el estudio.

Podemos hacer el contraste de hipótesis, se formula la hipótesis nula (H0), que postula que no hay diferencia entre los grupos que se comparan, y se contrasta con los datos obtenidos para determinar si esta es verdadera o falsa. Mediante el contraste de hipótesis podriamos saber si una intervención educativa, por ejemplo si se reduce las cifras arteriales.

Las pruebas paramétricas, en cambio, se basan en las leyes de distribución normal para analizar los elementos de una muestra. Dentro de las pruebas paramétricas podemos encontrarnos con:

  • T-Student, se utiliza para determinar si hay una diferencia significativa entre las medias de dos grupos, es decir, que se utiliza cuando deseamos comparar dos medias.
  • Anova, es un método para comparar dos o más medias, que es necesario porque cuando se quiere comparar más de dos medias es incorrecto utilizar repetidamente el contraste basado en la T-Student.
  • Fisher, es el test exacto utilizado cuando se quiere estudiar si existe asociación entre dos variables cualitativas.
  • Pearson, se utiliza para estudiar la relación o correlación entre dos variables aleatorias cuantitativas.
Las pruebas no paramétricas son aquellas que se encargan de analizar datos que no tienen una distribución particular y se basan una hipótesis. Dentro de las pruebas no paramétricas podemos encontrarnos con:
  • U-Mann-Whitney,se aplica a dos muestras independientes. Es más, es la versión no paramétrica de la prueba T-Student.
  • Kruskal-Wallis, es un método no paramétrico para probar si un grupo de datos proviene de la misma población. Es idéntico al Anova.

¿Cuál es la ventaja de usar una prueba no paramétrica?

Las pruebas no paramétricas son más robustas que las paramétricas. En otras palabras, son válidas en un rango más amplia de situaciones.

¿Cuál es la ventaja de usar prueba paramétrica?

La ventana de usar una prueba paramétrica en lugar de una no paramétrica consiste en que la primera tiene más potencia estadística que la segunda. En otras palabras, una prueba paramétrica tiene mayor capacidad para conducir un rechazo de H0.

Estimaciones.


  • Estimaciones puntual:
    • Utiliza el valor del estadístico calculado en la muestra como valor del parámetro que se desea estimar. Una estimación puntual de un parámetro poblacional es cuando se utiliza un único valor para estimar ese parámetro.
  • Estimación por intervalos.
    • Informa de la probabilidad de que el parámetro poblacional se encuentre entre unos valores determinado. Para realizar esta estimación es necesario construir un intervalo de confianza (IC). Un intervalo de confianza nos va a permitir calcular dos valores alrededor de una media muestral. Esta estimación depende de unos factores que a su vez depende del intervalo de confianza.
      • Tamaño de la muestra seleccionada.
      • Nivel de confianza.
      • Margen de error de nuestra estimación.
      • Lo estimado en la muestra.












No hay comentarios:

Publicar un comentario

Presentación.

Datos personales: ¡¡Hola a todos!! Para comenzar este blog, me gustaría hablaros un poco de mí. Me llamo Manuel Reina Gómez,  soy estu...