Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

AMVRegresion Segmentada Polinomial

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 17

Estadística Multivariada Regresión

Segmentada y Polinomial

Profesor : Manuel Ricardo Contento Rubio


manuel.contento@utadeo.edu.co
Oficina: modulo 6 / 501
Introducción
 data(savings). Ubicado en la librería faraway.
 El dataframe savings tiene 50 filas y 5 columnas. Los datos se promedian
durante el período 1960-1970.
 Variables.
 sr: Tasa de ahorro. Ahorro personal dividido por el ingreso disponible
 pop15: Porcentaje de la población menor de 15 años
 pop75: Porcentaje de la población mayor de 75 años
 dpi: Ingreso disponible per cápita en dólares
 ddpi: Porcentaje de crecimiento de dpi

> head(savings,3)
sr pop15 pop75 dpi ddpi
Australia 11.43 29.35 2.87 2329.68 2.87
Austria 12.07 23.32 4.41 1507.99 3.93
Belgium 13.17 23.80 4.43 2108.47 3.82
> tail(savings,3)
sr pop15 pop75 dpi ddpi
Uruguay 9.24 28.13 2.72 766.54 1.88
Libya 8.89 43.69 2.07 123.58 16.71
Malaysia 4.71 47.20 0.66 242.69 5.08
Introducción
 Objetivo: Estudiar la relación entre sr y ddpi.
Ajustando un modelo: E(y)=a+bx
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 7.8830 1.0110 7.797 4.46e-10 ***
ddpi 0.4758 0.2146 2.217 0.0314 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 4.311 on 48 degrees of freedom


Multiple R-squared: 0.0929, Adjusted R-squared: 0.074
F-statistic: 4.916 on 1 and 48 DF, p-value: 0.03139
Estructura de la relación

directa inversa
Ajustando un modelo a trozos (segmentado)
MODELO PARA GRUPO 1 (ddpi < 7.5)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.4987 1.2732 5.104 7.19e-06 ***
ddpi 0.9001 0.3697 2.435 0.0191 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.997 on 43 degrees of freedom


Multiple R-squared: 0.1211, Adjusted R-squared: 0.1007
F-statistic: 5.927 on 1 and 43 DF, p-value: 0.01913

MODELO PARA GRUPO 2 (ddpi > 7.5)


Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 22.9025 6.8434 3.347 0.0442 *
ddpi -0.9164 0.6377 -1.437 0.2462
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 4.819 on 3 degrees of freedom


Multiple R-squared: 0.4077, Adjusted R-squared: 0.2103
F-statistic: 2.065 on 1 and 3 DF, p-value: 0.2462
Ajustando un modelo a trozos (segmentado)
¿Cuáles son los modelos de regresión estimados?
Grafique los modelos sobre el diagrama de dispersión.
¿Son significativos los coeficientes de regresión?
¿Que indica el r2 de cada modelo?
Gráfica. Regresión segmentada
Ajustando un modelo cuadrático
RESULTADOS
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.13038 1.43472 3.576 0.000821 ***
I(ddpi) 1.75752 0.53772 3.268 0.002026 **
I(ddpi^2) -0.09299 0.03612 -2.574 0.013262 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 4.079 on 47 degrees of freedom


Multiple R-squared: 0.205, Adjusted R-squared: 0.1711
F-statistic: 6.059 on 2 and 47 DF, p-value: 0.004559

¿Cuál es el modelo de regresión estimado?


Grafique el modelo estimado sobre el diagrama de dispersión.
¿Son significativos los coeficientes de regresión?
¿Que indica el r2?
Gráfica del modelo cuadrático estimado
Grafica del modelo cuadrático estimado
Ajustando un modelo cúbico
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.145e+00 2.199e+00 2.340 0.0237 *
I(ddpi) 1.746e+00 1.380e+00 1.265 0.2123
I(ddpi^2) -9.097e-02 2.256e-01 -0.403 0.6886
I(ddpi^3) -8.497e-05 9.374e-03 -0.009 0.9928
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 4.123 on 46 degrees of freedom


Multiple R-squared: 0.205, Adjusted R-squared: 0.1531
F-statistic: 3.953 on 3 and 46 DF, p-value: 0.01369

 ¿Cuál es el modelo de regresión estimado?


 ¿Son significativos los coeficientes de regresión?
 ¿Que indica el r2?
 Se justifica usar el modelo cúbico para describir la relación entre estas
variables?
Actividad 1.
Obtenga un modelo polinómico pero ahora partiendo de un
modelo grande (orden 4) y trabajando hacia atrás (quitando
coeficientes).
Llega a los mismos resultados?
Ajuste el código para lograr la grafica del modelo cúbico.
Elabore una grafica en donde muestre el modelo lineal,
cuadrático y cubico, ¿qué diferencia observa en las graficas de
estos modelos?
Use la data cornnit ubicada en la librería faraway, para
estudiar la relación entre la variable yield como respuesta y
nitrogen como su predictor. Aplique regresión lineal,
regresión segmentada (a trozos) y polinómica. Compare los
modelo obtenidos.
Actividad 2.
Se realizó una prueba de frenado de un automóvil, midiendo la distancia de parada
de acuerdo a la rapidez del vehículo al momento de aplicar los frenos, obteniéndose
los siguientes resultados:
Rapidez (km/h) 35 50 65 80 95 110
Distancia Frenado (m) 17.4 24.6 43.4 60.9 90.8 118.1

1. Ajuste un modelo lineal. Especifique la ecuación estimada e indique si la relación


es significativa? Interprete el r2 obtenido.
2. Ajuste un modelo segmentado. Grupo1: x<75 . Grupo2: x>75. Especifique las
ecuaciones estimadas para cada grupo e indique si la relación es significativa?
Interprete el r2 para cada uno de los segmentos estimados.
3. Ajuste un modelo cuadrático. Especifique la ecuación estimada e indique si los
coeficientes son significativo? Interprete el r2 del modelo.
4. Estime la distancia de frenado usando cada uno de los tres modelos, para autos
que viajan a 60km/h y 100km/h.
5. Elabore una grafica en donde presente el modelo lineal, segmentado y cuadrático.
Actividad 3.
 Examinar y ejecutar el script DataGalapagos.R que se encuentra en
AVATA.
 Que información contiene esta base de datos.
 Que aplicación tienen la función pairs(gala) de R.
 Describa el modelo que estudia la relación entre Species en función de
Area. (modelo1)
 Explique el modelo de regresión sin intercepto aplicado a las anteriores
variables. (modelo 2)
 Analice el IC para el intercepto del modelo 1.
 Se cumplen los supuestos en el modelo 1.
 Identifique si hay algún valor extremos que pueda afectar la relación de las
variables al considerar el modelo 1
 Analice el modelo 3. ¿Qué problema se pretende resolver en este caso?
 Aplique un modelo segmentado, cuadrático y cubico. Que puede deducir?
Código en R
##Modelo lineal
plot(ddpi,sr, main="Relación entre sr y ddpi")
g <- lm(sr ~ ddpi, savings)
summary(g)
abline(g, col=2)

##Estructura del modelo.


plot(ddpi,sr, main="Relación entre sr y ddpi")
abline(v=7.5,lty=5);abline(h=0, v=0, col="gray")

#Ajustando un modelo por partes.


plot(ddpi,sr, main="Relación entre sr y ddpi")
g1 <- lm(sr ~ ddpi, savings, subset=(ddpi < 7.5))
summary(g1)
g2 <- lm(sr ~ ddpi, savings, subset=(ddpi > 7.5))
summary(g2)
abline(v=7.5,lty=5);abline(v=0, h=0, col="gray")
segments(0,g1$coef[1]+g1$coef[2]*0, 7.5,g1$coef[1]+g1$coef[2]*7.5, col=2)
segments(7.5,g2$coef[1]+g2$coef[2]*7.5, 16.7,g2$coef[1]+g2$coef[2]*16.7, col=2)
Código en R
#Ajustando un modelo Polinómico (Cuadrático)
g3 <- lm (sr ~ I(ddpi) + I(ddpi^2))
summary(g3)
g3$coefficients
g3$coefficients[1]
g3$coefficients[2]
g3$coefficients[3]
#Trazando la curva
plot(ddpi,sr, main="Relación entre sr y ddpi")
x<-ddpi
curve(g3$coefficients[1] + g3$coefficients[2]*x + g3$coefficients[3]*x^2, add=T,
col="blue")

#Ajustando un modelo Polinómico (Cúbico)


g4 <- lm (sr ~ I(ddpi) + I(ddpi^2) + I(ddpi^3))
summary(g4)

También podría gustarte