Módulo 7
Módulo 7
Módulo 7
CONTENIDO
Una ecuación de regresión busca calcular los valores que tendrá la variable
dependiente en función de los valores de la variable independiente (X). En los
modelos de regresión simple vemos la relación entre dos variables cuantitativas.
Esta relación se puede expresar en la siguiente ecuación lineal:
Finalmente, la ecuación regresión es la línea recta que pasa en medio de los puntos del
diagrama de dispersión y que representa la relación entre ambas variables. La ecuación
será la siguiente:
Es decir, por cada unidad que aumente la variable independiente (x1), se espera que el valor
de Y aumente en 1.91. Así mismo el valor del R2 que aparece en la esquina superior derecha
del gráfico nos indica el porcentaje de la varianza de Y que es explicado por la ecuación.
Estos mismos resultados los podemos analizar en el panel de regresión lineal del SPSS de
la siguiente manera.
En el resumen del modelo vemos que el R2 es de 0,775 es decir, el modelo explica el 0,77
de la varianza de la variable dependiente. Mientras que el valor de “sig” menor a 0,05 nos
dice que es estadísticamente significativo.
Finalmente, el SPSS también arroja los resultados de los coeficientes del modelo de
regresión simple. La constante 1928,206 le corresponde al valor de b0 y el valor de 1,909 le
corresponde a la variable independiente. Es decir, por cada unidad que aumente la variable
independiente (Salario Inicial), se espera que el valor de Y aumente en 1,91 Ambos valores
son estadísticamente significativos (Sig. < 0,05).
41
De la misma manera que una ecuación simple, una ecuación de regresión lineal
múltiple busca calcular los valores que tendrá la variable dependiente en función
de un grupo de variables independientes.
Los valores que el modelo predice son los valores esperados de Y, suelen ser
distintos a los valores reales (los valores observados) de la variable. A la diferencia
entre valor esperado y el valor observado se le conoce como residuos.
Ejemplo: Una regresión busca estimar el salario de una persona basándose en su edad
(X1) y su experiencia laboral (X2).
Según dicha regresión se estima que una persona (i) de 30 años y con 5 años de
experiencia laboral deberá ganar S/.5000 soles (^y). Sin embargo, en los datos
encontramos un caso de una persona con 30 años de edad y 5 años de experiencia,
cuyo salario es de S/.7500. La diferencia entre el valor esperado (S/.7500) ambos
valores es el residuo y el valor observado (S/.5000) es el residuo de una estimación.
Para revisar los supuestos de una regresión, se analizarán todos los residuos de dicho
modelo.
Ecuación de regresión
Un primer paso será construir el modelo de regresión, una vez definidas las variables
de interés se deberán ingresar en el SPSS de la siguiente manera:
42
Multicolinealidad
Otra forma para evaluar la normalidad de los valores errores es mediante la prueba
de normalidad de Kolgomorov-Smirnov (n>30) o Shapiro Wilk (n<30), que podemos
solicitarla de la siguiente manera:
Para evaluar el resultado, el valor de la “SIG” de la prueba deberá ser mayor a 0,05
para indicar que existe una normalidad.
Homocedasticidad