jueves, 28 de mayo de 2020

Tema 12: Concordancia y correlación.

Tema 12 (II).
Análisis de correlación.
Se utiliza con el propósito de disponer de un indicador cuantitativo que permite sintetizar el grado de la asociación entre variables.

El coeficiente de Correlación r de Pearson (r), (Rxy), es un coeficiente que mide el grado de la relación de dependencia que existe entre las variables (x,y), cuyos valores van desde -1 a 1.


Coeficiente de correlación de Pearson.
Por lo que ya podemos decir que si la "r" es menor que 0, tenemos una relación lineal inversa. Si la "r" es mayor que 0, la relación es lineal directa, y si "r" es igual a 0, podemos tener una variables independientes o por otro lado una relación que no sea lineal.
Para comprenderlo mejor vamos a observar la siguiente imagen:


Análisis de Correlación.
El coeficiente de Correlación por Rango de o rho de Spearman es una medida de asociación.

Procedimiento:
  • Se ordena los valores de una de las variables.
  • Para cada par de observaciones (rangos) calculamos su diferencia.
    • di=rango de ui - rango de vi.
  • Se eleva al cuadrado cada di y se suma todos los valores encontrados.
  • Se calcula para determinar la discrepancia entre los rangos.

Algunas de las formas de comprobar la normalidad de los datos son:
  • Método gráficos.
    • Histograma.
    • Prueba del lápiz grueso o gráfico QQ.
  • Métodos descriptivos.
  • Pruebas de normalidad.
    • Prueba de Kolmogorov-Smirnov.
    • Prueba de Shapiro-Wilk.
Normality check.
Debemos verificar la normalidad usando Kolmogorov (n>50) or Shapiro (n<50).
  • K-S <0,05 → distribución no normal.
  • K-S >0,05 → distribución normal.
Análisis de la relación entre dos variables cuantitativas: modelo de regresión.
La recta tiene una ecuación: y=a+bx, a esta ecuación la vamos a llamar Modelo de regresión. "X" e "Y" son las variables.
El término "b" es el coeficiente que va a acompañar a la "X", el cual vamos a llamar coeficiente de regresión. Indica la pendiente o inclinación de la recta.
El término "a" es el punto de intersección con el eje de coordenadas, que indica el valor de la variable respuesta cuando la "X" es cero. Es decir, cuando "X" es cero, el producto sería cero, y la "Y" sería igual a "a" (y=a).

Regresión lineal simple: correlación y determinación.

Análisis de relación entre dos variable cuantitativas: modelo de regresión.
Calculamos los valores de "a" y "b" que proporcionan las recta que mejor se ajusta.
Se parte de un criterio, y el más utilizado es el criterio de los mínimos cuadrados. Consiste en obtener un punto sobre la gráfica que se denomina (Yi), que es el punto observado, y posteriormente en coger un punto sobre la recta que hemos dibujado, denominado (Yi*).
Se calcula la diferencia entre ambos y nos interesa que la diferencia sea lo más pequeña posible, por eso se llama el criterio de los mínimos, y también se denomina cuadrado porque se calcula con un término al cuadrado.
Se trata de la recta que hace mínimo el cuadrado de la suma de las distancias verticales desde ella hasta cada uno de los puntos de la nube.

Criterios de los minimos cuadrados.










No hay comentarios:

Publicar un comentario

Presentación.

Datos personales: ¡¡Hola a todos!! Para comenzar este blog, me gustaría hablaros un poco de mí. Me llamo Manuel Reina Gómez,  soy estu...