Regresion
Regresion
Regresion
METODOS NUMERICOS
Existen dos maneras de aproximar un grupo de datos con base en el error asociado.
1. Cuando los datos muestran un grado significativo de error, por ejemplo, cuando se utilizan datos
experimentales, la estrategia es derivar una curva simple que represente el comportamiento
general de los datos, en la que cada punto pueda ser incorrecto, pero la curva se diseñe de tal
manera que siga un patrón sobre los puntos tomados como un todo. En este proceso se puede
utilizar la regresión con mínimos cuadrados o regresión.
2. Por otro lado, cuando se conoce que los datos son muy exactos, el proceso de ajustar un grupo de
datos a una curva que pase exactamente por cada uno de los puntos se puede llevar a cabo por
medio de polinomios, los cuales se conocen como polinomios de interpolación.
1) REGRESIÓN POR MINIMOS CUADRADOS.
El método de mínimos cuadrados consiste en encontrar una función analítica sencilla que represente el comportamiento general
de los datos, aunque la curva propuesta no pase por todos y cada uno de los puntos en cuestión. Está ecuación debe satisfacer
la condición de minimizar la suma de las desviaciones (di) del comportamiento de cada par de datos discretos, con respecto al
comportamiento del método propuesto, elevadas al cuadrado, es decir:
2
=0 [1]
El ejemplo más simple de una aproximación por mínimos cuadrados, consiste en ajustar a una línea recta un conjunto de datos
discretos (x1,y1), (x2,y2), …., (xn, yn).
Se inicia la ecuación de una línea recta a la cual se le agrega el error producido entre el comportamiento de los datos y el modelo
propuesto, de esta forma se tiene: y = a0 + a1x [2]
Donde:
a0 = Ordenada al origen.
a1 = Pendiente.
De esta forma:
E = y – a0 – a1x [3]
Al aplicar el criterio de que el “mejor” ajuste se cumple cuando se puede minimizar la suma de los cuadrados
de los residuos Sr, es decir el error entre el modelo y los datos experimentales, se tiene:
[4]
Este criterio tiene la ventaja de proporcionar una línea única para un conjunto dado de datos.
Para determinar los valores de a0 y a1 que minimizan la ecuación (4), se deriva la ecuación con respecto a cada
uno de los coeficientes.
𝑑𝑆𝑟
= - 2 Σ(yi – a0 – a1xi)= 0
𝑑𝑎0 [5]
𝑑𝑆𝑟
𝑑𝑎1 = - 2 Σ[(yi – a0 – a1xi) xi]= 0
Al igual ambas derivadas a cero, se genera un mínimo para la suma de los cuadrados de los residuos Sr, de la
siguiente forma:
- 2 Σ(yi – a0 – a1xi)= 0 = Σyi – Σa0 – Σa1xi [6]
ȳ [11]
Donde los residuos representan el cuadrado de la distancia vertical entre los datos y la línea recta.
La dispersión de los puntos alrededor de la recta es de magnitud similar a lo largo de los datos, la regresión con
mínimos cuadrados proporciona la mejor aproximación a y b. A esto se le conoce como principio de probabilidad
máxima dentro de la estadística.
Para comparar la eficiencia del ajuste se determina la suma de los cuadrados alrededor de la media para la variable
dependiente (y), la cual se denomina suma total de los cuadrados.
[12]
Ésta es la cantidad de dispersión en la variable dependiente antes de la regresión. Después de llevar a cabo la
regresión lineal se puede calcular Sr, que es la suma de los cuadrados de los residuos alrededor de la línea de
regresión, la cual presenta la dispersión que existe después de la regresión. La diferencia entre las dos cantidades, St
– Sr cuantifica la mejora en la reducción del error al utilizar la línea recta. Esta diferencia se normaliza al error total y
se obtiene:
[13]
[14]
Si el coeficiente de
correlación tiende a
1, se dice que se tiene
un buen ajuste.
EJEMPLO 1:
Utilice la regresión por mínimos cuadrados para ajustar a una línea recta el grupo de datos mostrado:
x y
1 75
2 78
5 97
10 123
20 160
30 200
40 240
a) Se grafican los datos, y se ve con claridad que tienden hacia una línea recta, por lo que
aplicaremos mínimos cuadrados
300
250
200
150
100
50
0
0 5 10 15 20 25 30 35 40 45
b) Realizamos la tabla correspondiente para poder obtener a1 y a0 (se utilizan las fórmulas [10] y [11]
respectivamente). Y así obtener la ecuación de la recta [2]
Sr St
AHORA LEE LOS CODIGOS QR PARA VISUALIZAR LOS EJEMPLOS DE
REGRESIÓN LINEAL:
Una vez hecho lo anterior, resuelve en tu libreta el problema resuelto por cada una de las
formas vistas en los videos.
Ejercicio 2: Resuelve en tu libreta por el método de mínimos
cuadrados.
Algunos datos discretos se representan pobremente mediante una línea recta, tal como se
aprecia en la siguiente figura.
En este caso, es recomendable utilizar una curva para representarlos, por lo que otra
alternativa es ajustar a polinomios, utilizando regresión polinomial.
El método de mínimos cuadrados se puede extender fácilmente del caso lineal al polinomial y ajustar datos
discretos aun polinomio de m-ésimo grado.
El procedimiento se inicia de la ecuación de un polinomio de m-ésimo grado a al cual se le agrega el error
producido entre el comportamiento de los datos y el modelo propuesto, de esta forma se tiene:
Donde:
E= Error entre el modelo y los datos experimentales De esta forma:
E= yi - a0 - a1xi - a2xi2 - ... - amxim
Al aplicar el criterio de que el "mejor" ajuste se cumple cuando se puede minimizar la suma de los cuadrados
de los residuos Sr, es decir el error entre el modelo y los datos experimentales, se tiene:
Al seguir el mismo procedimiento de la sección anterior se calcula la derivada de la ecuación anterior con
respecto a cada uno de los coeficientes del polinomio.
Para aplicar el mínimo, estas ecuaciones se igualan a cero y se reordenan para obtener el siguiente conjunto:
Donde las sumatorias varían desde i=1 hasta n.
Si el coeficiente de
correlación tiende a 1,
donde: se dice que se tiene un
buen ajuste.
EJEMPLO:
Ajuste los siguientes datos discretos a un polinomio de 2° orden:
y
7.000000
6.000000
5.000000
4.000000
3.000000
2.000000
1.000000
0.000000
0.000000 0.50 0000 1.000000 1.500000 2.00 0000 2.50 0000
-1.000000
SOLUCIÓN:
3) Como se observa en la gráfica, el comportamiento de los datos, se encuentra lejos de ser lineal,
por lo que se propone un polinomio de segundo orden de la forma:
𝑦 =𝑎 +
0 𝑎 1 𝑥 +𝑎 2 𝑥2
Y el sistema que se debe plantear es aquel formado por tres ecuaciones con tres incógnitas:
Por lo tanto se genera una tabla que contenga los valores de las sumatorias que se requieren para
aplicar las ecuaciones anteriores:
Mediante los datos de la tabla anterior se plantea el sistema:
Quedando
El coeficiente de
correlación r=
0.998283
El coeficiente de
correlación tiende
a 1, por lo que fue
un buen ajuste.
Sr St
AHORA LEE LOS CODIGOS QR PARA VISUALIZAR LOS VIDEOS PARA
REFORZAR EL TEMA
Video 1 Video 2
Ejercicio: Resuelve en tu libreta por el método de regresión cuadrática.