Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

MN - Tarea#5 - Regresión y Correlación - IQ. CarlosDaniePeraltaPeralta

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 20

1

UNIVERSIDAD JUÁREZ AUTÓNOMA DE TABASCO

División Académica de Ingeniería y Arquitectura

MÉTODOS NUMÉRICOS

TAREA #5

PROFESOR:
Ing. Pedro A. Sánchez Ruiz

ALUMNO:
Carlos Daniel Peralta Peralta

GRUPO:

C3C
2
Regresión lineal simple 3
Ejemplo.B.1 En la tabla B.1 se muestra el escurrimiento anual y la
precipitación anual de 1966 a 1977 en la estación hidrométrica
Altamirano, sobre el rio tzanconeja, chis. Y en la estación climatológica
del mismo nombre. Llamando X a la precipitación y Y al escurrimiento,
se desea saber si un modelo de la forma:
^
y=∝+ βx
Año Y= escurrimiento X= lluvia anual,
anual, m m
1966 0.557 1.637
1967 0.436 1.655
1968 0.562 1.884
1969 0.776 2.018
1970 0.600 1.536
1971 0.391 1.349
1972 0.359 1.327
1973 0.567 1.555
1974 0.635 1.405
1975 0.495 1.335
1976 0.580 1.391
1977 0.325 1.133

Para el ejemplo se tiene en cuestión:


n=12
∑ xi=6.283 ¿¿
∑ x i2=28.37 ;∑ xiyi=9.793
−0.229
∝= =−0.028
8.289
3.009
β= =0.363
8.289
- Ecuación de regresión resulta:
^y =−0.028+0.363 x
En la figura B.1 se muestra los datos y la recta de regresión
correspondiente, siempre que se realice un ajuste por regresión
como el anterior, conviene determinar que tan bien se ajusta la
recta a los puntos medidos, o dicho en otras palabras, que tanta
dispersión existe entre los puntos en torno a la recta.
4

- Cálculo del coeficiente de correlación:


σx
p=β
σy
Donde σx =desviación estándar de x
σy = desviación estándar de y
El coeficiente de correlación p varía entre -1 y +1, cuando su valor se
acerca a -1 (en el caso de β <o ¿ o a +1 (cuando β >0 ¿, se dice que hay
una buena dependencia o correlación lineal entre x y y. cuando p=0,
entonces dicha correlación no es aceptable.

En el ejemplo se tiene
σx=0.251
σy=0.124
Por lo tanto:
(0.251)
p= =( 0.363 )=0.735
( 0.124)
Coeficiente de correlación debe ser 0.8 o mayor también es aceptable. 5

Regresión lineal múltiple


Ejemplo B.2 se desea saber si en una cierta región él gasto máximo
medio anual, el área de la cuenca y la altura media de precipitación
máxima en 24hr se pueden correlacionar linealmente, y que tan bueno
es el ajuste, los datos se presentan en la tabla B.2
Solución
Los coeficientes de las ecuaciones (B.14) a (B.16) son:
n =14 ∑ ( x 1 x 2) =43.37
∑y =304.3 ∑ (x2 y) =628.04
∑ xi =21.34 ∑ ( x 2 ) 2 =86.99
∑x2 =34.30
∑ ( xiy) =1465.94
∑ ( xi ) 2 =108.74

Tabla B.2
Estación Y=gasto Xi= área de X2= altura media de
máximo medio la cuenca 10 precipitación max, en
anual, 10´2 ´3 Km2 24h/cm
m3/s
1 15.5 1.25 1.7
2 8.5 0.87 2.1
3 85.5 5.69 1.9
4 105.0 8.27 1.9
5 24.8 1.62 2.1
6 3.8 0.18 2.4
7 1.8 0.15 3.2
8 18.0 1.40 2.7
9 8.8 0.30 2.9
10 8.3 0.32 2.9
11 3.6 0.18 2.8
12 1.9 0.15 2.7
13 16.5 0.87 2.1
14 2.8 0.09 2.9

Por lo tanto, dichos ecuaciones resultan:


14 ∞ +21.34 β 1+34.38 β 2=304.30 6
21.34 ∞ +108.74 β 1+ 43.37 β 2=1465.94
34.30 ∞ +43.37 β 1+ 86.99 β 2=628.04
Resolviendo:
∞=2.013; β 1=13.134 ; β 2=−0.12
Además:
s2 ylx 1 x 2=15.6
s2 y=1026.77
Por lo que el coeficiente de correlación múltiple es:
15.6 12
(
R= 1−
1026.77 )
=0.9923

 Regresión no lineal
Ejemplo B.3 en la estación hidrométrica el colorado, sobre el rio
Lacantum, chis se han medido en 1976, las alturas de escala y los
gastos mostrados en la tabla B.3. Determinar una curva media que
relacione la altura de escala con el gasto.
A) Usando un modelo de la forma B.18
B) Usando un polinomio de segundo orden (modelo B.25)
Solución: a) sea x=gasto en m3/s, y=altura de escala en m.
entonces, usando el modelo lineal B.20 se tienen los siguientes
coeficientes de las ecuaciones normales
∑ y' = ∑ ¿ ¿ ¿
∑ ¿¿
∑ ( x y )=∑ (lnx lny )=89.413 7
∑ x ' =∑ ¿ ¿ ¿
n=23
σx=0.901
σy=0.775
De las ecuaciones B.10 y B.11
12.498 X 826.519−89.413 x 136.378
¿
23 x 826.519−¿ ¿
23 x 89.413−136.378 x 12.498
β= =0.857
410.978
Por lo tanto, de la ecuación B.21
∞=e−4.536=0.0107

Y el modelo es:
y=0.0107 x 0.857
Con un coeficiente de correlación:
σx 0.901
p=β =0.857 =0.996
σy 0.775

b) las ecuaciones normales son en este caso


∑ y=∞ n+ β 1 ∑ x + β 2 ∑ x 2
∑ xy =∞ ∑ x+ β 1 ∑ x 2 + β 2 ∑ x 3
∑ x 2 y=∞ ∑ x 2+ β 1 ∑ x 3 + β 2 ∑ x 4
Y se tiene:
n=23
∑ y=52.38
∑ x =12.729
∑ x 2=12,825,097
∑ x 3=1.70099 x 10 10
∑ x 4 =2.50982 x 1013
∑ xy =48682.46
∑ x 2 y=62.334,105
El sistema de ecuaciones es entonces:
23 ∞ +1.27 x 10 4 β 1+ 1.28 x 107 β 2=52.38
1.27 x 10 4 ∞+1.28 x 107 β 1+1.70 x 1010 β 2=4.87 x 104
1.28 x 107 ∞+1.70 x 1010 β 1+2.51 x 1013 β 2=6.23 x 107
Y su solución es, salvo errores de redondeo 8
∞=0.079
β 1=4.77 x 10−3
β 2=−7.91 x 10−7
Así, el modelo resulta:
y=0.079+4.77 x 10−3 x−7.91 x 10−7 x 2

Ejercicios extras:
 Regresión lineal simple
Ejercicio 1. La calificación de un grupo de estudiantes en el examen
parcial (x) x Y y en el examen final (y), fueron los siguientes:
X Y 15 17
12 15 12 15
8 10 11 12
10 12 12 13
13 14 11 12
9 12 10 13
14 15 14 12
11 16

x y x Y
13 14 18 20
10 13 12 14
12 15 10 12
13 14 12 10
12 13 14 16
16 18 9 11
15 17 10 13

A) Determinar la ecuación de regresión lineal de y en x.


x yxy X2 Y2 (xi-x) (xi-x)2 (yi-y) (yi-y)2 9
12 15
180 144 225 0 0 -1 1
8 10
80 64 100 4 17 4 15
10 12
120 100 144 2 4 2 3
13 14
182 169 196 -1 1 0 0
9 12
108 81 144 3 9 2 3
14 15
210 196 225 -2 4 -1 1
11 16
176 121 256 1 1 -2 5
18 20
360 324 400 -6 35 -6 38
12 14
168 144 196 0 0 0 0
10 12
120 100 144 2 4 2 3
12 10
120 144 100 0 0 4 15
14 16
224 196 256 -2 4 -2 5
9 11
99 81 121 3 9 3 8
10 13
130 100 169 2 4 1 1
15 17
255 225 289 -3 9 -3 10
12 15
180 144 225 0 0 -1 1
11 12
132 121 144 1 1 2 3
12 13
156 144 169 0 0 1 1
11 12
132 121 144 1 1 2 3
10 13
130 100 169 2 4 1 1
14 12
168 196 144 -2 4 2 3
13 14
182 169 196 -1 1 0 0
10 13
130’ 100 169 2 4 1 1
12 15
180 144 225 0 0 -1 1
13 14
182 169 196 -1 1 0 0
12 13
156 144 169 0 0 1 1
16 18
288 256 324 -4 15 -4 17
15 17
255 225 289 -3 9 -3 10
480
338 388 4222 5528 142 15
3

x́=
∑ xi
n
338
x́= =12
28

ý=
∑ yi
n
388
ý= =14 10
28
n ∑ xiyi−∑ xi ∑ yi
b=
n ∑ x i 2−¿ ¿
28 ( 4803 )−(338)(388)
b=
28 ( 4222 )−¿ ¿
134484−131144
b= =¿
118216−114244
b=0,85
a= ý−b x́
a=14−0.85 ( 12 )=3.80
y=a+bx
y=3.8+ 0.85 x

 Regresión lineal múltiple


2. Se quiere ajustar un modelo que permita estimar los gastos en
alimentación de una familia (y) en base a la información que
proporciona los variables represoras x1=ingresos mensuales y
x2=número de miembros de la familia para ello se recoge una
muestra aleatoria simple de 15 familias cuyos resultados son los de
la tabla adjunta.
gastos ingreso Tamaño gasto ingreso Tamaño
0.43 2.1 3 1.29 8.9 3
0.31 1.1 4 0.35 2.4 2
0.32 0.9 5 0.35 1.2 4
0.46 1.6 4 0.78 4.7 3
1.25 6.2 4 0.43 3.5 2
0.44 2.3 3 0.47 2.9 3
0.52 1.8 6 0.38 1.4 4
0.29 1.0 5

0.43 1 2.1 3
0.31 1 1.1 4
0.32 1 0.9 5
0.46 1 1.6 4
1.25 1 6.2 4
0.44 1 2.3 5
y=¿ ´ ¿
´ ∈=¿
¿ x ∞+ 1 1.8 6
0.52
1 1.0 5 ∝0 +∈
´
0.29
1 8.9 3 ∝1
1.29
1 2.4 2 ∝2
0.35
0.35 1 1.2 4
0.78 1 4.7 3
1 3.5 2
11

predicciones
0.38 0.41 0.33
0.31 0.57 0.77
0.36 0.37 0.51
Datos: 0.39 1.39 0.50
n=15
1.07 0.35 0.36
∑ x 1i=42
∑ xi 2 ;=¿ 188.08 ¿
∑ x 2i=55
∑ x 1 x 2;=140.80
∑ x 22 ;=219.00
∑ yi=8.070
∑ yix1 ;=32.063
∑ yix2 ;=28.960

El modelo de regresión lineal que se obtiene es:


Gasto: -0.160 + 0.149(ingreso) + 0.77 (tamaño) + error
Primera observación ( xi=2.1 , x 2=3 , y =0.43)
y=−0.160+0.149 ( 2 ) 2.1+0.77 ( 3 )=0.3839
e 1= y 1−^y 1=0.43−0.3839=0.0461

Residuos
 Cálculo de ScR
-0.046 -0.028 -0.024
0.001 0.048 -0.011 ScR=∑ e i 2=0.0721
0.038 0.083 0.084 S R =0.0060=SR=0.0775
2

-0.075 0.104 0.032


-0.180 0.000 -0.025
 Regresión no lineal 12

Ejercicio 3. Se sometió a una persona a unas sesiones de


entrenamiento para el manejo de una máquina de análisis químico y
se valoró la destreza en el manejo en diversas ocasiones, valorando
en una escala de 0 a 100. Los resultados obtenidos aparecen en la
siguiente tabla:

Sesiones 2 5 7 10 12 16

Destreza 15 40 62 86 92 95

1. Calcular la destreza alcanzada al cabo de 8 sesiones empleando


el medio logarítmico.
2. Calcular el número de sesiones necesarias para alcanzar una
destreza de 80 empleando el modelo exponencial
3. Justificar razonadamente cuál de las predicciones anteriores es
más fiable.

1._ modelo logarítmico de y sobre y


y=a+b log x=a+ bz
X= sesiones de entrenamiento
Y= destreza alcanzada
Recta de regresión de y sobre z
y ( 8 )=−18.4832+ 42.3954 log 8=69.7205 puntos
syz 19.6489
y= ý+ 2 ( z−ź )=65+ ( z−9.68 )=¿
sz 0.4635
18.4382+42.3954 ( z )=−18−4382+ 42.3554 . log x

ź=
∑ zi = 0.69+ 0.61+1.95+2.3+2.48+2.77 = 11.8086 =1.9681 log (sesiones)
w 6 6

ý=
∑ yi = 15+40+ 62+ 86+92+95 = 390 =65 puntos
Wz 6 6
S z 2=
∑ z i2 −z 2= 0.6 9 2+1.612 +1.952 +2.32 +2.482 +2.772 =1.198 12= 26.0212 =−19.6812 =0.465 13
w 6 6
885.4508
¿ =−1.9681.65=19.6489
6
2._ modelo exponencial de x sobre y
a +by
x=e
log x=loge a +by =a+by
Datos:
X=sesiones de entrenamiento
Y= destreza alcanzada
Z= log(x)
Recta de regresión de z sobre y
Szy 19.6489
z=ź + ( y − ý )=1.9681+ ( y−65 )=049.56+ 0.0227 y
Sy 2
867.3333
2 zy i 2 152+ 402 +622 +862 +922 +95 2 2 30554 2
sy = = ý 2= −65 = −65 =867.3333
w 6 6

z=logx=0.4956+0.0227 y
x ( 80 )=e 0.4956+0.0227 .80

x=e 0.4956+0.0227 y =10.0534


3._
2 Sz y 2 19.648 92
R= = =0.9604
S z 2 S y 2 0.4635−867.3333

Las dos predicciones son igual de


posibles
14
15
16
17
18
19
20

También podría gustarte