TEORIA 03 Regresión Lineal
TEORIA 03 Regresión Lineal
TEORIA 03 Regresión Lineal
REGRESIÓN LINEAL
Introducción
Una empresa quiere saber cuánto costará perforar un nuevo pozo de 2500 metros de
profundidad. La información disponible es la profundidad (en miles de metros) y el costo de
perforación (en miles de dólares) de ocho pozos.
Pozo Profundidad 𝑥 (miles de metros) Costo 𝑦 (miles de dólares)
1 1 80
2 1,5 110
3 1,7 120
4 1,8 130
5 2 180
Nuevo 2,5 Valor para estimar
6 2,1 220
7 2,3 240
8 2,6 300
Objetivos
1. Construir un diagrama de dispersión e indicar el tipo de correlación.
2. Calcular medias marginales y centro de gravedad.
3. Calcular e interpretar los coeficientes de correlación y determinación.
4. Obtener la ecuación de la recta de regresión.
5. Resolver problemas con rectas de regresión, valorando la estimación.
37
© Ramón Omar Renfige Córdoba
𝑥 𝑦
𝑥1 𝑦1
𝑥2 𝑦2
… …
𝑥𝑖 𝑦𝑖
… …
𝑥𝑛 𝑦𝑛
Figura 24 La recta de regresión es la que mejor se aproxima a todos los puntos de la nube.
Cuando el valor de una variable se calcula “exactamente” a partir de la otra se dice que entre
las variables existe una relación funcional, tal como ocurre en una relación que es función lineal.
Correlación
Cuando el valor de una variable se “estima” a partir del valor de la otra se dice que entre las
variables existe correlación. Puede suceder que no exista correlación.
38
Introducción a la Matemática para Geología
Medias marginales
El centro de gravedad 𝐺(𝑥̅ , 𝑦̅) de la nube es un punto por donde pasa la recta de regresión. Sus
coordenadas son la media marginal de 𝑥 y la media marginal de 𝑦.
39
© Ramón Omar Renfige Córdoba
Varianzas marginales
Covarianza
La covarianza es el promedio de los productos de los desvíos de las variables respecto de sus
medias marginales y tiene el signo de la pendiente de la recta de regresión:
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) ∑𝒏𝒊=𝟏 𝒙𝒊 𝒚𝒊
𝑆𝑥𝑦 = = ̅ ̅𝒚
−𝒙
𝑛 𝒏
La covarianza es una medida de la dispersión “conjunta” de los valores de las variables respecto
de sus medias marginales y es dato necesario para calcular la pendiente de la recta de regresión
40
Introducción a la Matemática para Geología
La recta de regresión pasa por el centro de gravedad 𝐺(𝑥̅ , 𝑦̅). Entonces, con este punto y la
pendiente se tiene la ecuación de la recta de regresión:
𝑦 − 𝑦̅ = 𝑚(𝑥 − 𝑥̅ )
Pozo 𝑥 𝑦 𝑥2 𝑦2 𝑥𝑦
1 1 80 1 6400 80
2 1,5 110 2,25 12100 165
3 1,7 120 2,89 14400 204
4 1,8 130 3,24 16900 234
5 2,0 180 4,00 32400 360
6 2,1 220 4,41 48400 462
7 2,3 240 5,29 57600 552
8 2,6 300 6,76 90000 780
Suma 15 1380 29,84 278200 2837
Desviaciones marginales
∑𝑛 𝑥 2 ∑𝑛 𝑦 2
𝑆𝑥 = √ 𝑖=1 𝑖 − 𝑥̅ 2 𝑆𝑦 = √ 𝑖=1 𝑖 − 𝑦̅ 2
𝑛 𝑛
Las desviaciones marginales son datos para calcular la intensidad de la correlación entre las
variables. Si la desviación marginal es “pequeña”, la media marginal es representativa de los
datos. El coeficiente de correlación lineal de Pearson es una medida de la intensidad de la
correlación entre las variables y tiene el signo de la pendiente de la recta de regresión.
41
© Ramón Omar Renfige Córdoba
Coeficiente de determinación
Número de datos 𝑛 8
∑𝑛𝑖=1 𝑥𝑖
Media marginal de 𝑥 𝑥̅ = 1,88
𝑛
∑𝑛𝑖=1 𝑦𝑖
Media marginal de 𝑦 𝑦̅ = 172,50
𝑛
∑𝑛𝑖=1 𝑥𝑖2
Varianza marginal de 𝑥 𝑆𝑥2 = − 𝑥̅ 2 0,20
𝑛
42
Introducción a la Matemática para Geología
∑𝑛𝑖=1 𝑦𝑖2
Varianza marginal de 𝑦 𝑆𝑦2 = − 𝑦̅ 2 5018,75
𝑛
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖
Covarianza 𝑆𝑥𝑦 = − 𝑥̅ ̅𝑦 30,33
𝑛
𝑆𝑥𝑦
Pendiente de la recta 𝑚= 151,65
𝑆𝑥2
∑𝑛 𝑥 2
Desviación marginal de 𝑥 𝑆𝑥 = √ 𝑖=1 𝑖 − 𝑥̅ 2
𝑛
∑𝑛 𝑦 2
Desviación marginal de 𝑦 𝑆𝑦 = √ 𝑖=1 𝑖 − 𝑦̅ 2
𝑛
𝑆𝑥𝑦
Coeficiente de correlación 𝑟=
𝑆𝑥 𝑆𝑦
Coeficiente de determinación 𝑅2 = 𝑟2
43
© Ramón Omar Renfige Córdoba
cuenca de drenaje el territorio drenado por un único sistema de drenaje natural, es decir, que
drena sus aguas al mar a través de un único río, o que vierte sus aguas a un único lago endorreico.
Figura 28 Una cuenca hidrográfica es una especie de “embudo” del territorio por el que
escurre el agua desde las partes altas, de donde sale el agua que fluye hacia otro lado.
Superficie (km2) 128 140 161 186 199 216 231 244 250
Caudal (m3/s) 33 41 42 49 60 59 75 76 81
Línea de tendencia
Con una planilla de cálculo se puede construir el diagrama de dispersión, aproximar los puntos
mediante una línea de tendencia y obtener su ecuación (lineal, cuadrática, polinómica de grado
3, 4, 5 o 6, exponencial o logarítmica).
Para añadir la línea de tendencia al diagrama de dispersión:
• Haga clic en uno de los puntos del diagrama y con el botón derecho del ratón seleccione la
opción “Agregar línea de tendencia”.
• Elija la línea de tendencia que mejor se ajuste a los datos.
• Marque las opciones “Presentar ecuación y valor de R cuadrado en el gráfico”.
44
Introducción a la Matemática para Geología
Figura 29 En una planilla de cálculo puede crear un diagrama de dispersión, agregar una
línea de tendencia, su ecuación y valor de 𝑅2 .
45
© Ramón Omar Renfige Córdoba
Altitud (msnm) 0 184 231 481 730 911 1343 1550 1820 2184
Presión (mm de Hg) 760 745 740 720 700 685 630 650 610 580
Año 1984 1986 1988 1990 1992 1994 1996 1998 2000
CO2 (ppm) 344,3 347 351,3 354 356,3 358,9 362,7 366,5 369,4
Tierra 365 24 93
46
Introducción a la Matemática para Geología
Bibliografía
1. DEMANA, F., Waits, B. y Foley, G. (2007). Precálculo gráfico, numérico y algebraico. (7a ed.).
México. Pearson Educación. (página 155)
2. STEWART, J., Redlin, L. y Watson, S. (2012). Precálculo Matemáticas para el Cálculo. (6a ed.).
México. Cengage Learning. (página 130)
47