Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
0% encontró este documento útil (0 votos)
191 vistas4 páginas

Regresión Logística Binaria

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1/ 4

Regresin logstica binaria se usa cuando la variable dependiente es una

variable binaria, es decir, de solo dos categoras, tambin conocidas como


dummy o dicotmica. Por ejemplo: 1-S, 0-No o por ejemplo 1-Soltero, 0-No
Soltero

Las R-cuadrados de Cox & Snell y de Nagelkerke son conocidas como


"pseudo-R-cuadradas" porque son "imitaciones " de las R-cuadrado de la
regresin lineal ya que van de 0 a 1 y cuanto ms altas, mejor es el modelo.
Pero su valor NO indica el % de la varianza de la Variable dependiente como
s haca en la R-cuadrado de la regresin lineal. Suelen presentarse a la
hora de publicar artculos y presentar los resultados ya que son indicativas
para ver qu modelos son mejores a la hora de explicar la variable
dependiente. Por ejemplo, un modelo con R2 de Cox & Snell con 0.02 es
peor predictor que otro modelo con R2 de Cox & Snell 0.13. En fin,
respondiendo a tu pregunta, no hay unos valores aceptables para decir que
el modelo se acepta o no, si miramos las R2 en la regresin logstica. Para
decir que el modelo es aceptable se mira el % de casos clasificados
correctamente, y posteriormente el nmero de variables independientes
que son significativas. La R2 de Cox & Snell y la de Nagelkerke salas para
comparar modelos y decir que uno es mejor que otro para explicar la
variable dependiente. Espero que te haya servido, cualquier duda adicional,
encantado de responderla. saludos

LA VARIABLE CATEGRICA
Si tenemos una variable categrica la tenemos que seleccionar en este
men,
Qu es lo que ocurre cuando uno crea una variable categrica?
cuando uno tiene variables categricas el programa va crear variables
dicotmicas variables ficticias las cuales se van a generar en las categoras
que tiene esa variable, en tal case va realizar 3 variables ficticias si vs el
resto talves vs el resto no vs el resto

Qu es la regresin logstica y cmo analizarla en 6


pasos
La regresin logstica es un grupo de tcnicas estadsticas que tienen como objetivo comprobar
hiptesis o relaciones causales cuando la variable dependiente es nominal. Es algo compleja,
aunque trataremos de hacer un tutorial sencillo para que se entienda y sobre todo para que la
podis usar en investigaciones, proyectos, tesis o consultoras ya que tiene mucha utilidad para
comprender las causas de los fenmenos y los comportamientos.

Hay varios tipos de regresin logstica, las 2 principales son:


Regresin logstica binaria se usa cuando la variable dependiente es una variable
binaria, es decir, de solo dos categoras, tambin conocidas como dummy o dicotmica. Por
ejemplo: 1-S, 0-No o por ejemplo 1-Soltero, 0-No Soltero
Regresin logstica multinomial se usa cuando la variable dependiente es una variable
nominal de ms de 2 categoras, de ah su nombre multi-nomial. Por ejemplo: 1-Soltero, 2-Casado,
3-Divorciado, 4-Viudo 5-Otros o por ejemplo 1- Comedia, 2-Accin, 3-Suspense, 4-Drama, 5Policiaco, 6-Otros.

Hoy nos centramos en explicar qu es la regresin logstica binaria y cmo analizarla en 6 pasos.

La regresin logstica binaria es la tcnica estadstica que tiene como objetivo comprobar hiptesis
o relaciones causales cuando la variable dependiente (resultado) es una variable binaria
(dicotmica, dummy), es decir, que tiene solo dos categoras.
Aunque su lectura se asemeja a la regresin lineal mltiple, la cual se usa cuando la variable
dependiente es ordinal o escalar, la regresin logstica est basada en principios diferentes como
los odd ratio y las probabilidades. Esto es algo complejo y largo de explicar, pero en pocas
palabras se basa en la idea que las variables independientes tratan de predecir la probabilidad que
ocurra algo sobre la probabilidad que no-ocurra. Por ejemplo, si queremos explicar por qu la gente
vota o no-vota en las elecciones, y nuestras variables independientes o predictoras son el nivel de
ingresos, la escala ideolgica (izquierda-derecha) y nivel educativo, los estadsticos obtenidos a
travs de la regresin logstica binaria sealarn si las variables independientes son buenas
predictoras o explicadoras del evento de votar.
En lugar de 4 pasos como en la regresin lineal mltiple, en este caso analizamos la regresin
logstica binaria en 6 pasos:
Sobre la bondad del modelo
1.
Significacin de chi-cuadrado del modelo en la prueba mnibus: Si la significacin es
menor de 0,05 indica que el modelo ayuda a explicar el evento, es decir, las variables
independientes explican la variable dependiente.
2.
R-cuadrado de Cox y Snell, y R-cuadrado de Nagelkerke: Indica la parte de la varianza de
la variable dependiente explicada por el modelo. Hay dos R-cuadrados en la regresin logstica, y
ambas son vlidas. Se acostumbra a decir que la parte de la variable dependiente explicada por el
modelo oscila entre la R-cuadrado de Cox y Snell y la R-cuadrado de Nagelkerke. Cuanto ms alto
es la R-cuadrado ms explicativo es el modelo, es decir, las variables independientes explican la
variable dependiente.
3.
Porcentaje global correctamente clasificado: Este porcentaje indica el nmero de casos
que el modelo es capaz de predecir correctamente. Me explico. En base a la ecuacin de regresin
y los datos observados, se realiza una prediccin del valor de la variable dependiente (valor

pronosticado). Esta prediccin se compara con el valor observado. Si acierta, el caso es


correctamente clasificado. Si no acierta, el caso no es correctamente clasificado. Cuantos ms
casos clasifica correctamente (es decir coincide el valor pronosticado con el valor observado) mejor
es el modelo, ms explicativo, por tanto, las variable independientes son buenas predictoras del
evento o variable dependiente. Si es modelo clasifica correctamente ms del 50% de los casos, el
modelo se acepta. Si no, punto y final y a volver a empezar, y seleccionaramos nuevas variables
independientes. Los siguientes pasos son para evaluar la relacin de cada variable independiente
con la variable dependiente
4.
Significacin de b: si es menor de 0,05 esa variable independiente explica la variable
dependiente
5.
Signo de b: indica la direccin de la relacin. Por ejemplo, a ms nivel educativo mayor
probabilidad que suceda el evento.
6.
Exp(b) exponencial de b: indica la fortaleza de la relacin. Cuanto ms alejada de 1 est
ms fuerte es la relacin. Para comparar los exponenciales de b entre s, aquellos que son
menores a 1 deben transformarse en su inverso o recproco, es decir, debemos dividir 1 entre el
exponencial de b (pero solo cuando sean menores a 1).
Veamos un ejemplo para aclarar todo:
Quiero identificar las causas que expliquen por qu la gente vota en Colombia. Para ello empleo
una regresin logstica binaria ya que la variable dependiente es binaria, solo tiene dos categoras
(1-S, 0-No) y la pregunta de investigacin es causal. Las posibles causas son: edad, nivel
educativo (1-sin estudios, 2-primarios, 3-secundarios, 4-universitarios), importancia de Dios en la
vida (1-nada. 10-mucho), e ideologa (1-extrema izquierda.10-extrema derecha).
En SPSS se realiza Analizar > Regresiones > Regresin logstica binaria
Hay mucha informacin en el resultado arrojado por SPSS, solo debemos analizar a partir del
Bloque 1

Sobre la bondad del modelo.


El modelo (conjunto de variables independientes) es significativo, explica entre el 0,131 y el 0,179
de la variable dependiente, y clasifica correctamente el 73,9% de los casos, por tanto se acepta el
modelo. En general, es un modelo aceptable.
Veamos la relacin de las variables independientes con la variable dependiente

La edad explica el evento de votar (significacin menor de 0,05). A ms edad ms probabilidad que
ocurra el evento de votar sobre la posibilidad que no ocurra (signo + en la B).
El nivel educativo tambin explica la variable dependiente. A ms nivel educativo ms probabilidad
que se vote.
A mayor importancia de Dios, ms probabilidad que se vote.
Cuanto ms de ideologa de derechas, ms probabilidad que ocurra el evento de votar.
De todas las variable seleccionadas, aquella que tiene una mayor fortaleza para explicar el evento
de votar es el nivel educativo (su exponencial de b -Exp(b)-) ms se aleja de 1.
Podemos decir en base a los datos analizados que el perfil de las personas que votan en Colombia
son de estudios altos, que le dan importancia a Dios, mayores en edad y de tendencia de
derechas.
La regresin logstica binaria es una tcnica estadstica muy til para sacar perfiles y sobre todo
para identificar las causas de los fenmenos, algo importantsimo si queremos incidir o intervenir
sobre la realidad social.

También podría gustarte