Regresión Lineal
Regresión Lineal
Regresión Lineal
En estadstica la regresin lineal o ajuste lineal es un modelo matemtico usado para aproximar la
relacin de dependencia entre una variable dependienteY, las variables independientes Xi y un
trmino aleatorio . Este modelo puede ser expresado como:
{\displaystyle Y_{t}=\beta _{0}+\beta _{1}X_{1}+\beta _{2}X_{2}+\cdots +\beta
_{p}X_{p}+\varepsilon }
donde:
{\displaystyle Y_{t}}: variable dependiente, explicada o regresando.
{\displaystyle X_{1},X_{2},\cdots ,X_{p}}: variables explicativas, independientes o regresores.
{\displaystyle \beta _{0},\beta _{1},\beta _{2},\cdots ,\beta _{p}}: parmetros, miden la influencia
que las variables explicativas tienen sobre el regrediendo.
donde {\displaystyle \beta _{0}} es la interseccin o trmino "constante", las {\displaystyle \beta
_{i}\ (i>0)} son los parmetros respectivos a cada variable independiente, y {\displaystyle p} es el
nmero de parmetros independientes a tener en cuenta en la regresin. La regresin lineal
puede ser contrastada con la regresin no lineal.
Historia[editar]
La primera forma de regresin lineal documentada fue el mtodo de los mnimos cuadrados que
fue publicada por Legendre en 1805, Gauss public un trabajo en donde desarrollaba de manera
ms profunda el mtodo de los mnimos cuadrados,1 y en dnde se inclua una versin
del teorema de Gauss-Mrkov.
El trmino regresin se utiliz por primera vez en el estudio de variables antropomtricas: al
comparar la estatura de padres e hijos, donde result que los hijos cuyos padres tenan una
estatura muy superior al valor medio, tendan a igualarse a ste, mientras que aquellos cuyos
padres eran muy bajos tendan a reducir su diferencia respecto a la estatura media; es decir,
"regresaban" al promedio.2 La constatacin emprica de esta propiedad se vio reforzada ms tarde
con la justificacin terica de ese fenmeno.
El trmino lineal se emplea para distinguirlo del resto de tcnicas de regresin, que emplean
modelos basados en cualquier clase de funcin matemtica. Los modelos lineales son una
explicacin simplificada de la realidad, mucho ms giles y con un soporte terico mucho ms
extenso por parte de la matemtica y la estadstica.
1.ejemplo
El coeficiente de correlacin provee una medida de como dos variables aleatorias
estn asociadas en una "muestra". Es tambin una medida de la intensidad de la
relacin lineal entre X e Y.
Regresin entre dos variables
Este tipo se presenta cuando dos o ms variables independientes influyen sobre
una variable dependiente. Ejemplo: Y = f(x, w, z).
Por ejemplo: Podra ser una regresin de tipo mltiple:
Una Empresa de desarrollo de software establece relacionar sus Ventas en
funcin del numero de pedidos de los tipos de software que desarrolla (Sistemas,
Educativos y Automatizaciones Empresariales), para atender 10 proyectos en el
presente ao.
En la Tabla representa Y (Ventas miles de S/.) e X (N pedidos de sistemas), W (N
de pedidos de Aplicaciones Educativas) y Z (N de pedidos de Automatizaciones
empresariales).
2. Ejemplos tericos
1. El profesor Isaac Asimov fue uno de los escritores ms prolficos de
todos los tiempos. Para cuando muri (1992) haba escrito casi 500 libros a lo
largo de una carrera de 40 aos. De hecho, a medida que avanzaba en su
profesin se volvi ms productivo en trminos de la cantidad de libros escritos en
un lapso dado. Estos datos son los tiempos que requera para escribir sus libros,
en incrementos de 100:
Nmero de libros 100 200 300 400 490
Tiempo (en meses) 237 350 419 465 507
Regresin Cuadrtica
La regresin cuadrtica es el proceso por el cul encontramos los parmetros de una parbola que
mejor se ajusten a una serie de datos que poseemos, ya sean mediciones hechas o de otro tipo.
Bueno, pero por que habramos de querer ajustar nuestros datos precisamente a una parbola y
no a otra funcin? (ver escogiendo la funcin de ajuste).
De nuevo hacemos una definicin de la funcin de error, y encontramos los valores de los
parmetros que la minimizan, tomando derivadas parciales de la funcin por cada parmetro que
haya:
Ejemplo 1:
Considere el conjunto de datos. Determine la regresin cuadrtica
para el conjunto.
(-3, 7.5), (-2, 3), (-1, 0.5), (0, 1), (1, 3), (2, 6), (3, 14)
Introduzca las coordenadas en x y las coordenadas en y en su
calculadora y realice una regresin cuadrtica. La ecuacin de la
parbola que mejor se aproxima al punto es
y = a.bx
a = antilog A y b = antilog B.
220 75
240 82
260 40
280 20
Final del formulario
Entonces, para la recta y=x+300
SSE = Suma de los valores de errores residuales
= - 14 - 17 - 18 - 5 + 22 + 0 + 0
= -32
P Muy bien. Ahora sabemos como se calcula el valor de SSE para una recta ya dada. Como
hallamos la recta de mejor ajuste; es decir, la recta para que SSE es lo menor?
R Presentaremos aqu la formula que la determina. Justificarla necesita clculo; puede consultar el
capitulo de funciones de varias variables en Clculo Aplicado para una explicacin detallada.
Recta de regresin (o mejor ajuste)
La recta que se ajusta mejor a los n puntos (x1 y1) (x2 y2) (xn yn) tiene la forma
y=mx+b
donde
Pendiente=m=n (x2) x 2n xy x y
Interseccin=b=n ym x
Aqu, significa "la suma de." As,
xy= suma del productos =x1y1+x2y2+ +xnyn x= suma del valores de x=x1+x2+ +xn
y= suma del valores de y=y1+y2+ +yn x2= suma del valores de x2=x21+x22+ +x2n
El uso de las formulas as bastante fcil, como se muestra el siguiente ejemplo.
Ejemplo 2: Calculando la recta de regresin a mano xx yy xyxy x2x2
Determine la recta de regresin asociada a los siguientes 1 1.5
datos:
Solucin Para aplicar las formulas, es mejor organizar los 2 1.6
datos en forma de tabla como sigue: (Cuando ha rellenado
los valores de xy y x2 correctamente, pulse "Sumas" para 3 2.1
obtener la suma de cada columna.) 4 3.0
Principio del formulario
Final del formulario x= 10 y= 8.2 xy= x2=
Sustituyendo los valores correctos de la tabla ms arriba en las formulas, obtenemos
Pendiente=m=n (x2) x 2n xy x y =4(30)1024(23)(10)(8 2)=0
5 Interseccin=b=n ym x =48 2(0 5)(10)=0 8
Por lo tanto, la recta de regresin es
y=0 5x+0 8
Antes de seguir... Aqu esta una traza de los pontos de dados y la
recta de regresin.
Observe que ni siquiera pasa la recta por uno de los puntos, pero es
la recta que se ajusta mejor a los puntos.