Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Ejemplo MRLS

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

MODELO DE REGRESIÓN LINEAL SIMPLE

MINÉRIA DE DATOS
Prfª. Carmen Lafuente Ibáñez
La regresión lineal simple es una técnica cuantitativa de dependencia que se utiliza para
investigar la relación estadística que existe entre una variable dependiente y una variable
independiente.

Etapas o fases:

1. Especificación: Variables y tipo de función que las relaciona


2. Estimación e interpretación de los coeficientes.
3. Verificación del modelo.
4. Predicción

Ejemplo:

Al oficial de una pista de carreras le gustaría desarrollar un modelo para predecir la cantidad de
dinero apostada (en millones de dólares) basándose en la asistencia. Se seleccionó una muestra
aleatoria de 15 días, y los resultados obtenidos se presentan a continuación:

Día Asistencia Cantidad Día Asistencia Cantidad


(miles) apostada (miles) apostada
(millones de (millones de
dólares) dólares)
1 14.5 0.70 9 16.3 0.71
2 21.2 0.83 10 32.1 1.04
3 11.6 0.62 11 27.6 0.97
4 31.7 1.10 12 34.8 1.13
5 46.8 1.27 13 29.3 0.91
6 31.4 1.02 14 19.2 0.38
7 40.0 1.15 15 16.3 0.63
8 21.0 0.80
Fuente de datos: Estadística básica en administración. México, Prentice Hall. Pp 772

1. Determine las variables dependiente e independiente del modelo.


2. Suponiendo que existe una relación lineal, estime los parámetros del modelo utilizando
MCO.
3. Interprete estadística y económicamente los parámetros estimados.
4. Estime por intervalos de confianza la pendiente del modelo. Considere un nivel de
confianza del 95%.
5. Obtenga la elasticidad de la cantidad apostada para una asistencia de 20.000 personas.
6. Verifique el modelo con base a la significatividad individual de los parámetros.
7. Realice una predicción de la cantidad apostada si, para un día determinado, se prevé
una asistencia de 35000 personas.

Profª Dra. Carmen Lafuente 2


Solución:
1) Variable dependiente: Cantidad apostada (APUESTAS). Variable independiente: Asistencia
(ASISTENCIA).
2) Solicitan la estimación del modelo APUESTAS   0   1 ASISTENCIA  U .

La mayoría de los programas informáticos proporcionan la información que se muestra a


continuación

CON SPSS

̂ 0 ˆ0  0 0,314  0
Desviación típica   3,808
Estimación de β0
error típˆ0 0,083 p-valor

Modelo Coeficientes no Coeficientes t Sig.


estandarizados tipificados
B Error típ. Beta
(Constante) ,314 ,083 3,808 ,002
ASISTENCIA
1
(miles de ,022 ,003 ,898 7,364 ,000
personas)

Estimación de β1
ˆ1  0 0,022  0 p-valor
  7,364
Desviación típica ˆ1 error típˆ1 0,003

a. Variable dependiente: APUESTAS(millones de dólares)

Leyenda: B= Parámetros estimados. Error típ= desviación típica de los estimadores.t= valor empírico (o
calculado) del estadístico de contraste en las hipótesis de significatividad individual (H0:βi=0).sig=p-valor

CON RSTUDIO

Call:
lm(formula = cantidad ~ asistencia)

Residuals:
Min 1Q Median 3Q Max
-0.35096 -0.03515 0.02999 0.05621 0.09782

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.314363 0.082563 3.808 0.00218 **
asistencia 0.021698 0.002946 7.364 5.47e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Profª Dra. Carmen Lafuente 3


Residual standard error: 0.1118 on 13 degrees of freedom
Multiple R-squared: 0.8066, Adjusted R-squared: 0.7918
F-statistic: 54.23 on 1 and 13 DF, p-value: 5.471e-06

Leyenda: Estimate= parámetros estimados. Std. Error= desviación típica de los estimadores. T-value=
valor empírico (o calculado) del estadístico de contraste en las hipótesis de significatividad individual
(H0:βi=0). Pr(>/t/)= p-value

A partir de los resultados de la tabla, el modelo estimado vendría dado por la siguiente
expresión:

APUEˆ STAS  0,314  0,022 ASISTENCIA


(3,808) (7,364)  valor de t

3) La función que se ha ajustado a la nube de puntos (conjunto de observaciones) es una línea


recta.

ˆ0  tér min o independiente  0,314 . Es el valor que toma la variable dependiente cuando
la independiente es igual a 0. En este caso indica que si no asiste nadie (ASISTENCIA=0) la
cantidad apostada ascendería a 314.000 dólares. Este valor tendrá significado si se admiten
apuestas de forma telemática.

ˆ1  pendiente (coeficient e de regresión de la var iable APUESTAS )  0,022 .


Coeficiente de regresión de la variable ASISTENCIA. Indica la influencia que esta variable ejerce
sobre la variable dependiente APUESTAS. En la estimación realizada, este valor indica que un
incremento de 1.000 personas supone un incremento de 22.000 dólares en las apuestas. El signo
positivo del coeficiente de regresión tiene significado económico, puesto que es lógico que
aumente la cantidad apostada al aumentar la asistencia.

4) Estimación por intervalos de la pendiente (β0). Para su cálculo, disponemos de toda la


información en la tabla , sólo falta el valor de λ que lo extraemos de las tablas de la T-student
con 13 grados de libertad y que es igual a 2,16

IC (  1 )  [ ˆ1  dt ( ˆ1 )]  [0,022  2,16 * 0,003]  [0,022  0,00648 ]  [0,01552 0,02848 ]
Como sabemos, el IC es una técnica de estimación que acota el verdadero valor del parámetro
entre dos valores, con un nivel de confianza prefijado. En este caso nos indica que con una
confianza del 95%, el verdadero valor de β1 se encuentra entre 15.520 y 28.480 dólares.

5) La elasticidad mide la sensibilidad, variación porcentual de la variable dependiente, al variar


en un uno por ciento la variable independiente. Solicitan la elasticidad para una asistencia de
20.000 personas. La ecuación que nos permite calcular la elasticidad es
ASISTENCIA ˆ
E APUESTAS; ASISTENCIA  1
APUEˆ STAS

Profª Dra. Carmen Lafuente 4


ASISTENCIA= 20 (recordar que se ha trabajado en miles de personas)

APUEˆ STAS  0,314  0,022 * 20  0,754 (Se ha sustituido el valor de la variable


independiente en el modelo ajustado)

ASISTENCIA ˆ 20
E APUESTAS; ASISTENCIA  1  0,022  0,58
ˆ
APUESTAS 0.754
Según los resultados, la cantidad apostada, en el punto solicitado es poco sensible a la asistencia
(En términos absolutos una elasticidad inferior al 1%, inelástica, indica poca sensibilidad de la
variable dependiente ante variaciones de la variable independiente. Una elasticidad superior al
1%, elástica, indica que la variable dependiente es muy sensible a las variaciones de la variable
independiente)
Concretamente, el resultado obtenido indica que si la asistencia aumenta en un 1%, la cantidad
apostada aumenta en un 0,58%

NOTA: NO CONFUNDIR LA ELASTICIDAD CON LA PENDIENTE. AMBAS MIDEN LA VARIACIÓN DE LA VARIABLE


DEPENDIENTE ANTE CAMBIOS DE LA INDEPENDIETE PERO LA PRIMERA, LA ELASTICIDAD, LO MIDE EN
TÉRMINOS PORCENTUALES. LA PENDIENTE INFORMA DE LOS CAMBIOS DE LA VARIABLE DEPENDIENTE EN
TÉRMINOS ABSOLUTOS (EN LA UNIDAD DE MEDIDA EN QUE VENGA EXPRESADA LA VARIABLE)

6) Para determinar si los parámetros son significativos basta con llevar a cabo el siguiente
contraste de hipótesis:
Término independiente
H 0 : 0  0
H1 : 0  0
Según los resultados que proporcionan cualquiera de los programas utilizados, el valor calculado
(VC) del estadístico de contraste es de 3,808

ˆ0  0 0,314  0
VC :   3,808
error típˆ0 0,083

Valor teórico: =1,96

Como el valor calculado 3,808 es mayor que 1,96 (observar en la gráfica como el valor calculado
pertenece a la RC) rechazamos la hipótesis nula, esto es podemos “aceptar” que β0 es distinto
de cero y por tanto significativo.

También podemos llegar a la misma conclusión comparando el p-valor con el nivel de


significación.En este caso el p-valor del estadístico de prueba es de 0,002 inferior al nivel de
significación prefijado, 0,05.

Profª Dra. Carmen Lafuente 5


Pendiente

H 0 : 1  0
H 1 : 1  0

Si razonamos de forma análoga al caso anterior, observamos que el valor calculado del
estadístico de contraste para este parámetro es de 7, 364, muy superior al valor teórico de 1,96.
Estamos en condiciones de rechazar la hipótesis nula, lo que indica que la pendiente es
significativa y por tanto la variable ASISTENCIA explica el comportamiento de la variable
APUESTAS.
Lógicamente en este caso el p-valor, de 0,00 es inferior al nivel de significación prefijado del 5%

7) Para predecir la cantidad apostada para una asistencia de 30000 personas, basta con sustituir
este valor (recordando que trabajamos en miles de personas) en el modelo de regresión
estimado:

APUEˆ STAS  0,314  0,022 ASISTENCIA  0,314  0,022  30  0,974

Es decir, una asistencia de 30000 personas supondría una cantidad apostada de 974.000
dólares.

Profª Dra. Carmen Lafuente 6

También podría gustarte