Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Econometria RLM

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 44

INTRODUCCIÓN

ECONOMETRIA
INTRODUCCIÓN

I. Relación de variables
La relación entre dos o más variables, es la
forma en que ellas se comportan entre sí.

La relación puede ser lineal y no lineal. Si


es lineal, puede ser directamente
proporcional o inversamente proporcional.

Para que se pueda realizar el modelo de


regresión lineal, sea simple o múltiple, se
necesita que exista una posible relación
entre las variables a analizar.
I. Relación lineal y no lineal

Grafico X/Y
Gráfico de dispersión conjunta de dos variables
(X e Y).
Variable Y

Variable X
I. Relación lineal y no lineal

Relación entre variables


cuantitativas

Dos variables están relacionadas cuando varían


conjuntamente. Es decir:

Al variar la variable X, varía la variable Y


I. Relación lineal y no lineal

Relación entre variables


cuantitativas en grafico X/Y
Gráfico de dispersión conjunta de dos variables
(X e Y).
Variable Y

Variable X
I. Relación lineal y no lineal

Relación entre variables


cuantitativas en grafico X/Y
I. Relación lineal y no lineal

Relación entre variables


cuantitativas en grafico X/Y
30000000
20000000
ingreso del trabajo
10000000

20
0

0 20 40 60

15
o10. horas de trabajo, empleo principal
escolaridad
10 5
0

0 20 40 60 80 100
edad
I. Relación lineal y no lineal

Relación lineal entre variables

Efecto de una variable en otra es constante


II. COVARIANZA Y CORRELACIÓN

Varianza y Covarianza
Varianza: Medida de dispersión de una variable.
𝑁 𝑛

∑ ( 𝑥𝑖 − 𝑥 )
2
∑ ( 𝑥𝑖 − 𝑥 )2
𝑖=1 𝑖=1
𝑉 𝑎𝑟 ( 𝑥 )= 𝑉 𝑎𝑟 ( 𝑥 )=
𝑁 𝑛 −1

Covarianza: Medida de dispersión conjunta de dos


variables.
𝑁 𝑛

∑ ( 𝑥𝑖− 𝑥) ( 𝑦𝑖 − 𝑦 ) ∑ ( 𝑥𝑖− 𝑥) ( 𝑦𝑖 − 𝑦
𝑖 =1
𝑜𝑣 ( 𝑥 , 𝑦 ) = 𝑖 =1 𝐶 𝑜𝑣 ( 𝑥 , 𝑦 ) =
𝑁 𝑛 −1

Parámetro Estimadores
II. COVARIANZA Y CORRELACIÓN

Covarianza
𝑛

∑ ( 𝑥𝑖− 𝑥) ( 𝑦𝑖 − 𝑦 )
𝑖 =1
𝐶 𝑜𝑣 ( 𝑥 , 𝑦 ) =
𝑛 −1

𝑦 𝑦 𝑦

𝑥 𝑥 𝑥

Problema: Depende de nivel medida de la


variable, por tanto no es fácil de interpretar
II. COVARIANZA Y CORRELACIÓN

Correlación de Pearson
Medida de relación lineal entre dos variables
cuantitativas.
=

r=1 Correlación negativa perfecta


r=0Nula correlación*
r=1Correlación positiva perfecta
II. COVARIANZA Y CORRELACIÓN

Correlación de Pearson
r=-1 Correlación negativa perfecta
r Correlación negativa de alta intensidad
r Correlación negativa de mediana intensidad
r Correlación negativa de baja intensidad
r Correlación negativa de muy baja intensidad
r=0 Nula correlación*
r Correlación positiva de muy baja intensidad
r Correlación positiva de baja intensidad
r Correlación positiva de mediana intensidad
r Correlación positiva de alta intensidad
r=1 Correlación positiva perfecta

Si trabajamos con muestras:


Test de hipótesis: H0r=0, H1r≠0
II. COVARIANZA Y CORRELACIÓN

Correlación de Pearson
r=1 700
r=0,78
700 600
600 500

Sueldo
500 400
Sueldo

400 300
300 200
200
100
100
0
0
3 6 9 12 15 18 21 24 27 30
1 2 3 4 5 6 7 8 9 10

Escolaridad Experiencia laboral

r=0,02
15
10
5
0
Y

-5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
-10
-15

X
II. COVARIANZA Y CORRELACIÓN

Correlación de Pearson
II. COVARIANZA Y CORRELACIÓN

Correlación de Pearson con


variable de control
Analizar si correlación entre dos variables se explica por una
tercera.
PROCEDIMIENTO:
– Estimar correlación y test de hipótesis asociado para cada
categoría de la tercera variable.
CONCLUSION
– Correlación robusta: hay correlación en todas las
categorías de la tercera variable.
– Correlación espuria: no hay correlación en ninguna de las
categorías de la tercera variable.
– Correlación condicionada: hay asociación en alguna(s) de
las categorías de la tercera variable.
II. COVARIANZA Y CORRELACIÓN

Correlaciones espurias

http://www.tylervigen.com/spurious-correlations
https://twitter.com/clarroulet/status/730931861384507392
II. COVARIANZA Y CORRELACIÓN

Correlación de Pearson con


variable de control
Ejemplo: Datos CASEN 2013

Correlación Valor P Test de


ingresos hipótesis
escolaridad
Toda la muestra 0,2744 0.000
Hombres 0,2935 0.000
Mujeres 0,2564 0.000
II. COVARIANZA Y CORRELACIÓN

Correlación de Pearson con


variable de control
Ejemplo: Datos CASEN 2013

Correlación edad Valor P Test de


escolaridad hipótesis
Toda la muestra -0.4431 0.000
Hombres -0.3985 0.000
Mujeres -0.4801 0.000
III. REGRESIÓN LINEAL SIMPLE

Regresión Lineal Simple (RLS)


Técnica de análisis estadístico utilizada para estimar el
efectos de una variable (independientes /predictores)
en otra variable cuantitativa (dependiente/ predicha/
respuesta).

(Permite probar la hipótesis de que el efecto de la variable


independiente en la dependiente es distinta de 0.)

Técnica de análisis estadístico utilizada para predecir


una variable dependiente, a partir de otra
independiente.
III. REGRESIÓN LINEAL SIMPLE

Objetivos de investigación
• Determinar como incide A (independiente) en B
(dependiente).

• Predecir B (dependiente) a partir de A


(independiente).
III. REGRESIÓN LINEAL SIMPLE

El modelo: la recta
XY
Y

X
III. REGRESIÓN LINEAL SIMPLE

El modelo: la recta
Y=a+Xb
Intercepto pendiente

Eje y

y2
b
y1
a

x1 x2 Eje x
III. REGRESIÓN LINEAL SIMPLE
El modelo: la recta
Y=a+Xb
1200 Intercepto pendiente
Ingresos (Miles de pesos)

1000

800

600

400

200

0
0 2 4 6 8 10 12 14 16 18 20 22 24
Años de Escolaridad
Al aumentar en 1 los años de escolaridad, aumenta en b el ingreso
III. REGRESIÓN LINEAL SIMPLE

El modelo: la recta
Constante
Coeficiente del
Modelo: Indica el
efecto de X en Y
Y =a+ X b +e

Variable
Dependiente Variable Error: Variables no
Independiente observadas que
influyen en Y
III. REGRESIÓN LINEAL SIMPLE

El modelo: la recta
Constante
Coeficiente del
Modelo: Indica el
efecto de X en Y
Y =a+ X b +e

Variable
Dependiente Variable Error: Variables no
CUANTITATIVA Independiente observadas que
CUANTITATIVA influyen en Y
O
DUMMY
III. REGRESIÓN LINEAL SIMPLE

Estimación del modelo


Estimador
de la Estimador del
Constante Coeficiente del
Modelo: Indica el
=+X efecto de X en Y

Variable
Dependiente Variable
Predicha Independiente
III. REGRESIÓN LINEAL SIMPLE
Estimación del modelo:
Residuo
Variable
dependiente

Variable
dependiente
predicha

Residuo
III. REGRESIÓN LINEAL SIMPLE
Estimación del modelo:
Residuo
Variable
dependiente

Variable
dependiente
predicha

Residuo
III. REGRESIÓN LINEAL SIMPLE

Ejercicio práctico
IV. REGRESIÓN LINEAL MÚLTIPLE

Regresión Lineal Múltiple (RLM)


Técnica de análisis estadístico utilizada para estimar el
efecto de varias variables (independientes
/predictores) en una variable cuantitativa
(dependiente/ predicha/ respuesta).

(Permite probar la hipótesis de que el efecto de las variables


independientes en la dependiente son distintas de 0.)

Técnica de análisis estadístico utilizada para predecir una


variable dependiente, a partir de otras
independientes.
IV. REGRESIÓN LINEAL MÚLTIPLE

Objetivos de investigación
• Determinar como incide X1, X2, X3,…
(independiente) en Y (dependiente).

• Predecir Y (dependiente) a partir de X1, X2, X3,


… (independiente).
IV. REGRESIÓN LINEAL MÚLTIPLE

El modelo

rs
a
ye
IV. REGRESIÓN LINEAL MÚLTIPLE

El modelo: Variables

Y = a+ X1 b1+…+ Xk bk +e
Variable
Dependiente
CUANTITATIVA Variables independiente
CUANTITATIVAS
O DUMMY
IV. REGRESIÓN LINEAL MÚLTIPLE

El modelo: parámetros

Y = a+ X1 b1+…+ Xk bk +e
Constante

Efecto de X en Y
(controlando por las demás X)
IV. REGRESIÓN LINEAL MÚLTIPLE
Estimación del modelo
Estimador Estimador del Coeficiente
de la del Modelo: Indica el
Constante efecto de X en Y

Y = a+ X1 b1+…+ Xk bk

Variable
Dependiente Variables
Predicha Independientes
III. REGRESIÓN LINEAL MÚLTIPLE
Estimación del modelo:
Residuo
Variable
dependiente

Variable
dependiente
predicha

Residuo
III. REGRESIÓN LINEAL MÚLTIPLE
Supuestos del modelo
1. Relación lineal entre las variables
2. Errores independientes con E(e)=0
3. Homocedasticidad de los errores: Varianza de los
errores es constante
4. Ausencia de outliers
5. Independencia de X y errores
6. Ausencia de multicolinealidad: Variables
independientes deben ser independientes entre
sí.
III. REGRESIÓN LINEAL MÚLTIPLE
Ajuste del modelo: Coeficiente de
determinación (R2)
• Suma total de cuadrados:

• Suma de cuadrados explicada:

2 𝑆𝑆 𝐸
• Suma de cuadrados residual: 𝑅=
𝑆𝑆 𝑇

Interpretación: El modelo
explica el R2*100% de la
varianza de la variable
dependiente
III. REGRESIÓN LINEAL MÚLTIPLE
ANOVA y Estadístico T y F
• Media cuadrática:
– Residual (MSR)=SCR/n-(k+1)n-(k+1) gl
– Explicada (MSE): SCE/[(k +1) – 1]k gl
• Estadístico

• H0:
• F>F crítico se rechaza H0; P<a se rechaza H0 y se
acepta la H1.
III. REGRESIÓN LINEAL MÚLTIPLE
Prueba de hipótesis (Estadístico T y
F)
Sirve para contrastar individualmente la
significancia de las variables independientes,
conforme a la siguiente estructura de la prueba:
H0: bi = 0
H1: bi ≠ 0

• F>F crítico se rechaza H0; P<a se rechaza H0


El valor P < 0,05 para que la variable sea
significativa. Puede que sea mayor y si sirva.
III. REGRESIÓN LINEAL MÚLTIPLE
Interpretación de coeficientes
Y=a + +…+ + e
Al aumentar en uno , mantendiendo las demás variables
constantes, Y aumenta en unidades.

Para cada , se hace un Test T, que pone a prueba las


hipótesis:
• =0
• ≠0
Si Valor P<a: se rechaza
III. REGRESIÓN LINEAL MÚLTIPLE
Interpretación de coeficientes
Y=a + +…+ + e
Al aumentar en uno , mantendiendo las demás variables
constantes, Y aumenta en unidades.

Para cada , se hace un Test T, que pone a prueba las


hipótesis:
• =0
• ≠0
Si Valor P<a: se rechaza
III. REGRESIÓN LINEAL MÚLTIPLE

Ejemplo: ¿Cuál es el efecto de la escolaridad y el estado


de actividad en los ingresos per capita?
Source SS df MS Number of obs = 171606
F( 3,171602) = 5283.07
Model 1.4933e+15 3 4.9775e+14 Prob > F = 0.0000
Residual 1.6168e+16171602 9.4217e+10 R-squared = 0.0846
Adj R-squared = 0.0845
Total 1.7661e+16171605 1.0292e+11 Root MSE = 3.1e+05
Ajuste del modelo
ypchtot Coef. Std. Err. t P>|t| [95% Conf. Interval]

esc 19856.12 180.6887 109.89 0.000 19501.97 20210.26

activ
desocupados -133848.9 3857.108 -34.70 0.000 -141408.7 -126289.1
inactivos -44823.11 1562.065 -28.69 0.000 -47884.72 -41761.49

_cons 74834.33 2272.804 32.93 0.000 70379.68 79288.97

Estimación de Test T (=0)


parámetros del
modelo
III. REGRESIÓN LINEAL MÚLTIPLE
Ejemplo
Revisar la table de datos del taller anterior.

Considere los datos que es describen en el excel, en


relación a un ejercicio de Regresión Lineal Múltiple.

También podría gustarte