Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Regresión y Correlación

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 37

SPSS

INTRODUCCIÓN

1. Diagrama 2. Modelo de 3. Ecuación


de dispersión Regresión de regresión
Modelo de Regresión

Predice o explica como es influida una variable dependiente


1 “Y”por una variable independiente X.
El objetivo es obtener estimaciones razonables de Y para distintos valores de X a partir de una muestra
de n pares de valores (x1,y1),…,(xn,yn).

Ejemplos:

Estimar el precio de una Predecir el gasto Prever el tiempo de


vivienda en función de su económico familiar de computación de un
superficie cierta zona en función del programa en función de la
número de familias velocidad del procesador
Modelo de Regresión

2. Ecuación de regresión poblacional

Si la variable dependiente (Y) está relacionada con la variable independiente (X), entonces la relación funcional
o ecuación de regresión entre Y y X tiene la siguiente forma:
Análisis de Regresión

II. Funciones del análisis de regresión:

 Determinar si las variables independientes y la variable


dependiente presentan fuerzas de relación.
 Determinar la estructura o la ecuación matemática que
relaciona las variables independientes con las dependientes.
 Pronosticar o predecir los valores de la variable dependiente
en función de la variable independiente.
 Controlar otras variables independientes al evaluar las
contribuciones de una variable especifica o un conjunto de
variables.
DIAGRAMA DE DISPERCIÓN
Modelo de Regresión

Ecuación de Regresión Estimada

: Intercepto con el eje y cuando x=0. Es el valor de Y que se obtiene cuando x = 0.

: Pendiente de la recta. Mide el cambio que se producirá en la variable.

La relación entre X e Y puede ser:


Requisitos

1. La muestra de datos apareados (x, y) es una muestra aleatoria de datos cuantitativos.


2. El examen visual del diagrama de dispersión indica que los puntos se aproximan al patrón de una
línea recta.
3. Se debe eliminar cualquier valor extremo, si se sabe que es un error.
Es importante tomar en cuenta los efectos de cualquier valor extremo que no sea un error conocido.

Nota: Los requisitos 2 y 3 representan una verificación simplificada de los siguientes requisitos formales
del análisis de regresión:
• Para cada valor fijo de x, los valores correspondientes de y tienen una distribución en forma de
campana.
• Para los distintos valores fijos de x, las distribuciones de los valores correspondientes de “y” tienen la
misma varianza.
• Para los distintos valores fijos de x, las distribuciones de los valores correspondientes de y tienen
medias que se ubican en la misma línea recta.
Requisitos
SUPUESTOS DEL MODELO
Primer Supuesto
Normalidad de los errores (Kolmogorov – Smirnov o Shapiro
Wilk )
H0 : Los errores se distribuyen normalmente
H1 : Los errores no se distribuyen normalmente
KOLMOGOROV- SMIRNOV SHAPIRO - WILK
(Corrección de significación de
lilliefors)
 Para muestras grandes (n≥50) Cuando la muestra es
pequeña (n<50)

Importante: REGLA DE DECISION


Cuando p (SIG) >0.05 Aceptamos la Hipótesis Nula
Cuando p (SIG) <0.05 Rechazamos la Hipótesis Nula de manera significativa
Cuando p(SIG) <0.01 Rechazamos la Hipótesis Nula de manera altamente
significativa
SUPUESTOS
SUPUESTOS
DEL MODELO
Segundo Supuesto:
Autocorrelación de los errores (Durbín - Watson: DW)

Es que los residuos sucesivos deberán ser independientes. Esto significa que los residuos no tienen
un patrón, que no están muy correlacionados, y que no hay corridas largas de residuos positivos o
negativos. Cuando los residuos sucesivos están correlacionados, a esta condición se le conoce como
autcorrelación.
SUPUESTOS
Tercer Supuesto:
Validez el modelo de regresión lineal simple. Use un alfa=0.05.
H0: β1=0 (No existe relación lineal entre X e Y).
H1: β1≠0 (Existe relación lineal entre X e Y)
Estadístico de prueba:
SUPUESTOS
Cuarto Supuesto:
Determine e interprete el coeficiente de correlación “r” (BONDAD DE AJUSTE)
y determinación “r2”.

El coeficiente de correlación (r) consiste en determinar el grado de relación entre dos variables.
El coeficiente de correlación es un número comprendido entre: -1≤ r ≤ 1

Se define:
Supuestos
Caso: costo de mantenimiento de máquinas
Caso: costo de mantenimiento de máquinas

EJERCICIOS DE APLICACIÓN:

Se tienen información de los costos de mantenimiento de 06


maquinas llenadoras de gaseosas de distintas edades de la
Empresa Enrique Cassinelli e Hijos S.A. La Gerencia desea hacer
estimaciones o pronósticos acerca del costo de mantenimiento
en función del tiempo operativo de la máquina. La información
que se tienen es la siguiente:
Caso: costo de mantenimiento de máquinas
Maquina 1 2 3 4 5 6

Tiempo operativo en
1 1 2 2 3 3
Años (X)
Costo de
30 40 70 80 100 100
mantenimiento $ (Y)
1. Determinar la ecuación de regresión. Interpretar sus
coeficientes
2. Pronosticar el costo de mantenimiento para una máquina
que tienen 4 años operativos.
Caso: costo de mantenimiento de máquinas
Por lo tanto la ecuación de regresión es:
Y = 5 + 32.5 X
 Interpretación:
β0 = 5: Cuando la máquina no tienen ningún año de
funcionamiento su costo de mantenimiento SE ESTIMA
que es de 5 dólares.
β1 = 32.5: Por cada año de funcionamiento de la
maquina su costo de mantenimiento aumenta en 32.5
dólares.
Caso: costo de mantenimiento de máquinas
2. Pronóstico cuando la máquina tienen 4 años de
funcionamiento:

Y=5+32.5*4=135, que significa, que el costo de


mantenimiento para la maquina si tiene 4 años de
funcionamiento es de 135$.
PREPARACIÓN DE PEDIDOS
PREPARACIÓN DE PEDIDOS

Para determinar el modelo de regresión lineal que explique el tiempo


que se demora en alistar un pedido en función de la cantidad de
productos que solicita el cliente. Se toma una muestra con los
siguientes resultados:
Tiempo
20 38 12 55 80 35 15 40 55 100 10 45
(minutos)
Número de
3 7 2 8 7 4 3 5 5 9 2 6
productos
PREPARACIÓN DE PEDIDOS

Para determinar el modelo de regresión lineal que explique el tiempo


que se demora en alistar un pedido en función de la cantidad de
productos que solicita el cliente. Se toma una muestra con los
siguientes resultados:
Tiempo
20 38 12 55 80 35 15 40 55 100 10 45
(minutos)
Número de
3 7 2 8 7 4 3 5 5 9 2 6
productos

Variable dependiente: Y: Tiempo


Variable independiente: X: Número de productos
PREPARACIÓN DE PEDIDOS

Tiempo
20 38 12 55 80 35 15 40 55 100 10 45
(minutos)
Número de
3 7 2 8 7 4 3 5 5 9 2 6
productos

• Realice un ajuste de regresión del tiempo y el número de productos e


interprete los coeficientes calculados.
• Verifique los supuestos del modelo, asumiendo un 5% de
significancia.
• Determine e interprete el coeficiente de correlación y determinación.
PREPARACIÓN DE PEDIDOS

• Realice un ajuste de regresión del tiempo y el número de productos e


interprete los coeficientes calculados.

La ecuación del modelo es:



y  10.732  10.390 X
PREPARACIÓN DE PEDIDOS

• Realice un ajuste de regresión del tiempo y el número de productos e


interprete los coeficientes calculados.
La ecuación del modelo es:
   
y   0   1 X  y  10.732  10.390 X
Interpretación
 de los coeficientes:
 0 : El tiempo que se demora en alistar un pedido, cuando la cantidad
de productos solicitados por el cliente es cero, es de -10.732 minutos
(tener en cuenta que la interpretación carece de sentido)
PREPARACIÓN DE PEDIDOS

• Realice un ajuste de regresión del tiempo y el número de productos e


interprete los coeficientes calculados.
La ecuación del modelo es:
   
y   0   1 X  y  10.732  10.390 X
Interpretación

de los coeficientes:
1 : Por cada producto adicional que se registra en el pedido, el tiempo
que se demora en alistar un pedido, aumenta en 10.390 minutos.
PREPARACIÓN DE PEDIDOS

• Verifique los supuestos del modelo, asumiendo un 5% de


significancia.
Primer Supuesto:
Normalidad de Errores
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente
PREPARACIÓN DE PEDIDOS
• Verifique los supuestos del modelo, asumiendo un 5% de
significancia.
n  50,Shapiro  Wilk
Primer Supuesto:
Normalidad de Errores n  50, Kolmogorov  Smirnov
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente
PREPARACIÓN DE PEDIDOS
Primer Supuesto:
Normalidad de Errores
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente

Como el p-valor de significancia de la prueba de normalidad Shapiro-Wilk


para muestras pequeñas (menor que 50), es mayor que 0.05
(p=0.595>0.05), se concluye que los errores presentan distribución normal.
PREPARACIÓN DE PEDIDOS
Segundo Supuesto:
Autocorrelación de los Errores (Durbín-Watson)

Como el valor de Durbín-Watson=2.092, está en el intervalo [1;3], por lo


tanto, se cumple el supuesto. Es decir, los errores no están
autocorrelacionados.
PREPARACIÓN DE PEDIDOS
Tercer Supuesto:
Validez el modelo de regresión lineal simple. Use un alfa=0.05.
H0: β=0 (No existe dependencia lineal del tiempo de demora respecto
al número de productos).
H1: β≠0 (Existe dependencia lineal del tiempo de demora respecto al
número de productos)
PREPARACIÓN DE PEDIDOS
Tercer Supuesto:
Valide el modelo de regresión lineal simple. Use un alfa=0.05.

Decisión: Como Sig.(0.000) < α (0.05) → Se Rechaza H0


Conclusión: Como sig.(p=0.000<0.05), se rechaza la hipótesis nula, por tanto, existe
relación lineal entre el número de productos del pedido y el tiempo que demoran en
alistar el pedido, es así que se concluye que el modelo es válido.
PREPARACIÓN DE PEDIDOS
• Determine e interprete el coeficiente de correlación y determinación.

r = 0.887; existe una correlación alta positiva entre el número de productos del
pedido y el tiempo que demoran en alistar el pedido.
r 2  0.787 ; El 78.7% de la variabilidad del tiempo que demoran en alistar el pedido, se
encuentra explicada por número de productos del pedido.
PREPARACIÓN DE PEDIDOS
Casos
CASO Nº 01: N° de Edad Precio Venta
El propietario de TOYOTA, quiere auto (en años) (miles de $)

estudiar la relación entre la edad de 1 9 8.1


los autos y su precio de venta. Para 2 7 6
lo cual damos una lista de 12 autos 3 11 3.6
usados, tomados aleatoriamente y 4 12 4
vendidos el año pasado. 5 8 5
a. Realice el diagrama de dispersión 6 7 10
y analice. 7 8 7.6
b. Determine el grado de relación 8 11 8
entre las variables e interprete. 9 10 8
c. Estime la ecuación de regresión e 10 12 6
interprete cada uno de los 11 6 8.6
parámetros. 12 6 8
 

También podría gustarte