Taller 4 Regresión Logística
Taller 4 Regresión Logística
Taller 4 Regresión Logística
Regresión Logística
En un estudio para investigar la incidencia de dengue en una determinada ciudad de la costa
mexicana, un total de 196 individuos, escogidos aleatoriamente en dos de los sectores de la
ciudad, respondió a las siguientes preguntas:
(i) (edad) Edad (en años),
(ii) (nivel) nivel socioeconómico (1 nivel alto/ 2 nivel medio/ 3 nivel bajo),
(iii) (sector) sector en el que vive y
(iv) (enfermedad) si el entrevistado contrajo o no la enfermedad recientemente (1 si/
0 no).
Los datos se encuentran en el archivo dengue.csv.
1. Considere un modelo logístico lineal para explicar la probabilidad de que un
individuo contraiga la enfermedad a partir de las tres variables explicativas.
Describa las componentes aleatoria y sistemática del modelo propuesto.
1
Los coeficientes que acompañan a las variables predictores son los siguientes:
^ ^
e−2.29 3+0.0269∗30+0.253∗nivel alto +1.24 3∗sector 2
Probabilidad enfermedad =
( ) ^ ^
1+e−2.29 +0.0269∗30 +0.253∗nivel alto+1.24 3∗sector 2
2
5. Seleccione el “mejor” modelo para describir el fenómeno bajo estudio. Use
como guía la medida de calidad del ajuste AIC. Verifique que todas las
variables en el modelo elegido sean estadísticamente significativas.
INTERPRETE los parámetros del modelo escogido.
^0 + ^
Logit ( enfermedad )= B B1 edad+ ^
B2 sector
P robabilidad ( enfermedad )
e(−3.341135+(0.02681∗edad )+ (1.18169∗sector ))
¿
1+ e(−3.341135+( 0.02681∗edad )+(1.18169∗sector )) g
3
el logaritmo de odds presenta una relación positiva con el sector donde vive la
persona (coeficiente parcial = 1.18169) y la relación es significativa (p-valor =
0,00045),