Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
0% encontró este documento útil (0 votos)
7 vistas10 páginas

Clase 1 - Tema 2

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1/ 10

Regresión Lineal Múltiple y Correlación • “” son las variables regresoras o

Ahora se estudia la existencia de relación explicadoras.


entre una variable dependiente y varias
• “” error aleatorio o perturbación aleatoria.
variables independientes. Es decir:
• “” son parámetros del modelo.
• Se tiene una variable de interés “”
(variable respuesta o predicha)
• Se tiene un conjunto de variables Un dato o punto muestral está formado
explicadoras o regresoras o por:
independientes . • Un valor de la variable aleatoria Y.

En el modelo de regresión lineal múltiple la • “” valores de las variables , asociadas


función de regresión que relaciona la con .
variable dependiente con las variables
independientes tiene la forma:

𝑌 = 𝛽0 + 𝛽1 𝑋 1+ 𝛽 2 𝑋 2 +…+ 𝛽 𝑘 𝑋 𝑘 +𝜀 En general para una muestra de datos


podemos ver los valores de las variables
Donde: como en la tabla siguiente:
• “”: Es la variable respuesta, predictora
o predicha.
Datos .... Tomando todos los datos se puede escribir
la forma matricial:

( )( )( ) ( )
1 .... 𝑦1 1 𝑥 11 𝑥12 . . . . 𝑥1 𝑘 𝛽0 𝜀1
𝑦2 1 𝑥21 𝑥 22 . . . . 𝑥 2 𝑘 𝛽1 𝜀2
2 .... . = . . + .
. . . .
. . . . .... . . . . .
. . . . . 𝑦𝑛 1 𝑥𝑛1 𝑥𝑛2 . . . . 𝑥𝑛k 𝛽𝑘 𝜀𝑛
. . . . .
En forma compacta se escribe como:
n ....
𝑌 = 𝑋 𝛽 +𝜀
Donde
Aquí por ejemplo: • Cada variable representa una de las
matrices anteriores en el orden
correspondiente
• La matriz y la matriz son conocidas.
En general, para ““ se tiene: • La matriz de parámetros y la matriz de
errores aleatorios son desconocidas.
Se llama modelo matricial de regresión lineal múltiple a la expresión:
𝑌 = 𝑋 𝛽 +𝜀
Modelo de dos variables:
y
ŷ b0  b1x1  b 2 x 2

x1
le
ri ab
v a
la
ra
pa x2
e
ent
di v ari a ble x 2
n para la
Pe i ent e
Pend

x1 Llamado hiperplano de regresión


Modelo de dos variables:

y Observación
yi muestral ŷ b0  b1x1  b 2 x 2

<
yi

<
e = (y – y)

x2i
x2
x1i
La ecuación de mejor ajuste,

<
y, es hallada minimizando la
x1 suma de cuadrados del error,
e2
Supuestos del Modelo
Igual que en la regresión lineal simple,
para que el modelo obtenido sea El valor de para un conjunto de valores
adecuado, debe cumplir las condiciones: de X, es diferente del valor de para
otro conjunto de valores de X.
• El término del error es una variable
• El término es una variable aleatoria
aleatoria cuya media o valor esperado
distribuida normalmente y refleja la
es cero.
desviación entre el valor de “” y su
𝐸 ( 𝜺 )=0
estimación.
De donde se concluye que:
Como consecuencia la variable “”
𝐸 ( 𝑦 )= 𝑋 𝛽 también está distribuida normalmente.

• La varianza del error se denota por , es


la misma para todos los valores de la El número de observaciones debe superar
variable independiente. al de parámetros para poder estimarlos,
pues debemos resolver un sistema de
ecuaciones que de otro modo tendría más
• Los valores de son independientes. incógnitas que ecuaciones.
( )
Estimación de la Ecuación de Regresión Múltiple 𝑛 𝑛 𝑘 2

Para estimar los coeficientes del modelo 𝐿=∑ ( 𝑦 𝑖 − ^𝑦 𝑖 ) 2=∑ 𝑦 𝑖 − 𝛽 0 − ∑ 𝛽 𝑗 𝑥𝑖𝑗


𝑖=1 𝑖=1 𝑗=1
de regresión múltiple, se puede aplicar
mínimos cuadrados. La función se minimiza respecto a las
variables:
Supóngase que se disponen de
observaciones, y que se cumplen todos 𝛽 0 , 𝛽1 , … , 𝛽 𝑘
los supuestos del modelo. Entonces:
Tal como se hizo en la regresión lineal
𝑦 𝑖= 𝛽 0 + 𝛽 1 𝑥 𝑖 1 + 𝛽 2 𝑥 𝑖 2 +…+ 𝛽 𝑘 𝑥𝑖𝑘 + 𝜀 𝑖 simple, aquí se debe resolver el sistema
de ecuaciones:
Si son los errores de estimación, entonces
se debe minimizar la expresión: 𝜕𝐿 𝜕𝐿 𝜕𝐿 𝜕𝐿
=0 =0 =0 hasta =0
𝜕 𝛽0 𝜕 𝛽1 𝜕 𝛽2 𝜕 𝛽𝑘
𝑛
𝐿=∑ 𝑒𝑖2
𝑖=1 Lo cual, cuando se tienen dos o más
variables independientes, es un proceso
largo y tedioso.
Que es lo mismo que la expresión:
El modelo matricial resumido tomó la forma: Derivando respecto a :
𝑌 = 𝑋 𝛽 +𝜀 𝜕𝐿 𝑡 𝑡
=− 2 𝑋 𝑌 +2 𝑋 𝑋 𝛽
Donde: 𝜕𝛽
Y es una matriz de
𝜕𝐿
X es una matriz de El mínimo se obtiene cuando: =0
𝜕𝛽
es una matriz de
𝑡 𝑡
es una matriz de −2 𝑋 𝑌 +2 𝑋 𝑋 𝛽=0

La función a minimizar es: Despejando :


𝑡 𝑡
𝑛
2 𝑋 𝑋 𝛽=2 𝑋 𝑌
𝐿=∑ 𝑒𝑖2=𝜀𝑡𝑖 𝜀𝑖 =( 𝑌 − 𝑋 𝛽 ) ( 𝑌 − 𝑋 𝛽 )
𝑡

𝑖=1

Haciendo la multiplicación en la derecha Se obtiene la matriz de parámetros del


se puede comprobar que toma la forma: modelo.
−1
𝛽= ( 𝑋 𝑋 )
𝑡 𝑡
𝑡 𝑡 𝑡 𝑡 𝑡 𝑋 𝑌
𝐿=𝑌 𝑌 −2 𝛽 𝑋 𝑌 + 𝛽 𝑋 𝑋 𝛽
Matriz de Varianza-Covarianza  Las covarianzas de parejas de variables
En regresión lineal simple se utilizó la están fuera de la diagonal principal.
covarianza para determinar el coeficiente
de correlación.
La matriz tiene la forma:
En regresión lineal múltiple, cada variable

[ ]
en estudio tiene una varianza y cada
𝑉 𝑎𝑟 ( 𝛽0 ) 𝐶𝑜𝑣 ( 𝛽 0 𝛽1 ) … 𝐶𝑜𝑣 ( 𝛽 0 𝛽𝑘 )
combinación de parejas que se formen
𝐶𝑜𝑣 ( 𝛽1 𝛽 0) 𝑉 𝑎𝑟 ( 𝛽 1) … 𝐶𝑜𝑣 ( 𝛽 1 𝛽𝑘 )
tiene una covarianza. . . . .
𝑉𝑎𝑟 ( 𝛽)=
. . . .
Todos estos valores se representan por . . . .
medio de una matriz llamada matriz de 𝐶𝑜𝑣 ( 𝛽 𝑘 𝛽0 ) 𝐶𝑜𝑣 ( 𝛽𝑘 𝛽 1) … 𝑉 𝑎𝑟 ( 𝛽 𝑘)
varianzas-covarianzas.

 Es una matriz cuadrada simétrica, cuyo La expresión para obtener la matriz de


orden (número de filas y columnas) varianzas-covarianzas es:
corresponde a la cantidad de variables
aleatorias que se tenga. [ 𝑉𝐶 ] ( 𝛽 )= 𝜎 2 ( 𝑋 𝑇 𝑋 )
−1

 En la diagonal principal están las


𝑡
varianzas de cada una de las variables 2 𝜀 𝜀 K = Número de
𝜎 =
aleatorias. 𝑛 −𝑘 variables indep.
Ejemplo
El gerente de una empresa desea estimar
el ingreso semanal, en miles de pesos, en
función de los gastos en publicidad,
analizando los datos históricos de 8
semanas.

Ingres. Semanal Public. En TV Public. En radio


96 5 1.5
90 2 2
95 4 1.5
92 2.5 2.5
95 3 3.3
94 3.5 2.3
94 2.5 4.2
94 3 2.5

Obtener el modelo de regresión lineal


múltiple de los ingresos dependiendo de la
publicidad.

También podría gustarte