Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Regresión Lineal

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 37

ESTADISTICA

autor

Septiembre 2022
2
Índice general

1. REGRESIÓN LINEAL 5
1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2. Diagramas de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3. Correlación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.1. Correlación lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.2. Tipos de Correlación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4. Coeficiente de correlación lineal (r) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4.1. Requisitos para calcular el coeficiente de Correlación lineal . . . . . . . . . . . 8
1.4.2. Propiedades del coeficiente de Correlación lineal . . . . . . . . . . . . . . . . . 8
1.4.3. Cálculo del coeficiente de correlación lineal (r) . . . . . . . . . . . . . . . . . . 11
1.4.4. Validación del coeficiente de correlación lineal (r) . . . . . . . . . . . . . . . . 12
1.4.5. Errores comunes relacionados con la correlación . . . . . . . . . . . . . . . . . 14
1.5. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.6. Regresión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.6.1. Requisitos para la determinación de a y b de la ecuación de regresión . . . . . 16
1.6.2. Ecuaciones para determinar la pendiente y la intersección en la ecuación de
regresión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.6.3. Interpretación de la pendiente y la intersección . . . . . . . . . . . . . . . . . 19
1.6.4. Validación del modelo de regresión lineal . . . . . . . . . . . . . . . . . . . . . 19
1.6.5. Predicciones a partir de la ecuación de regresión . . . . . . . . . . . . . . . . 20
1.6.6. Coeficiente de determinación R2 . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.7. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.8. Regresión No lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.8.1. Reglas básicas para identificar un buen modelo matemático . . . . . . . . . . 31
1.9. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2. Capitulo 2 35

3
4 ÍNDICE GENERAL
Capítulo 1

REGRESIÓN LINEAL

1.1. Introducción

En este capítulo se analizará la relación que podría existir entre dos variables a las que llamaremos
x y y, y para ello es necesario conocer y familiarizarse con conceptos como: CORRELACIÓN y
REGRESIÓN, a continuación se irá detallando cada uno de estos conceptos con sus respectivos
ejemplos.

1.2. Diagramas de dispersión

Los gráficos de dispersión se usan para averiguar la intensidad de la relación entre dos variables
numéricas. El eje X representa la variable independiente, mientras que el eje Y representa la variable
dependiente. Los gráficos de dispersión permiten responder preguntas sobre los datos, por ejemplo:
¿cuál es la relación entre dos variables? ¿Cómo se distribuyen los datos? ¿Dónde están los valores
atípicos?.

1.3. Correlación

La correlación es una medida estadística que expresa hasta qué punto dos variables están relacionadas
(esto es, cambian conjuntamente a una tasa constante). Es una herramienta común para describir
relaciones simples sin hacer afirmaciones sobre causa y efecto.

1.3.1. Correlación lineal

Existe una correlación lineal entre dos variables cuando existe una correlación y los puntos graficados
de los datos pareados dan como resultado un patrón que se puede aproximar a una linea recta.

1.3.2. Tipos de Correlación

Los diagramas de dispersión pueden mostrar 4 tipos de correlación, los mismos que se muestran a
continuación:

5
6 CAPÍTULO 1. REGRESIÓN LINEAL

Los puntos se ajustan a un patrón lineal, por lo tanto


existe una correlación lineal positiva entre x y y, puesto
que a medida que los valores de x aumentan, los valores
correspondientes de y tambien aumentan.

Los puntos se ajustan a un patrón lineal, por lo tanto


existe una correlación lineal negativa entre x y y, puesto
que a medida que los valores de x aumentan, los valores
correspondientes de y disminuyen.

Los puntos no se ajustan a ningun patrón, lo cual su-


giere que no hay correlación entre x y y.

Los puntos se ajustan a un patrón, lo cual sugiere que


hay correlación entre x y y pero el patrón no es el de
una linea recta.

Veamos algunos ejemplos:

Ejemplo 1.1. Para el siguiente conjunto de datos, construye el diagrama de dispersión y comente
el resultado:

x 10 8 13 9 11 14 6 4 12 7 5
y 9.14 8.14 8.74 8.77 9.26 8.10 6.13 3.10 9.13 7.26 4.74
1.4. COEFICIENTE DE CORRELACIÓN LINEAL (R) 7

Los puntos se ajustan a un patrón, lo cual sugiere que


hay correlación entre x y y pero el patrón no es el de
una linea recta, correlación no lineal.
Debido a las conclusiones basadas en exámenes visuales
de diagramas de dispersión son subjetivos en gran me-
dida, se necesitan mediciones mas objetivas. Para este
efecto, se debe contar con un valor que permita realizar
conclusiones de una forma mucho más formal.

1.4. Coeficiente de correlación lineal (r)


El coeficiente de correlación lineal (r) mide la fuerza de la correlación lineal entre los valores cuan-
titativos x y y en una muestra. El coeficiente de correlación lineal (r) asume valores que van −1 ≤
r < 0 para una correlación negativa y 0 ≤ r ≤ 1 para una correlación positiva. El coeficiente de
correlación lineal (r), se calcula a partir de la siguiente expresión:
P P P
n ( xy) − x ∗ y
r=p p (Buen formato para realizar los cálculos)
n ∗ x2 − ( x)2 ∗ n ∗ y 2 − ( y)2
P P P P

Donde:
n:
Xnúmero de pares de datos muestrales
: expresa la suma de los elementos indicados
X
x: suma de todos los valores de x
X
x2 : indica que cada valor de x debe elevarse al cuadrado y después esos cuadrados deben sumarse.
X
( x)2 : indica que los valores de x deben sumarse y el total debe elevarse al cuadrado.
X
xy: indica que cada valor de x debe multiplicarse por su correspondiente valor de y. Después se
debe obtener la suma de todos esos productos.
r: es el coeficiente de correlación lineal para datos muestrales.
ρ: es el coeficiente de correlación lineal para una población de datos pareados.

Otra ecuación que permite calcular el coeficiente de correlación lineal (r) es:
P
zx zy
r= (Buen formato para entender)
n−1
Donde:
zx : expresa la puntuación z para un valor muestral individual x.

x − x̄
zx =
sx
x: valor individual x.
x̄: media de los valores x.
sx : desviación estándar en x.

zy : expresa la puntuación z para un valor muestral correspondiente y.

y − ȳ
zy =
sy
8 CAPÍTULO 1. REGRESIÓN LINEAL

y: valor individual y.
ȳ: media de los valores y.
sy : desviación estándar en y.

1.4.1. Requisitos para calcular el coeficiente de Correlación lineal


Para cualquier recopilación de datos muestrales CUANTITATIVOS pareados, siempre es posible
calcular el coeficeinte de correlación lineal si se cumplen los siguientes requisitos:

1. La muestra de datos pareados (x, y, es una muestra aleatoria simple de datos cuantitativos.
(Es importante que los datos muestrales no se hayan recopilado utilizando algún métodos
inadecuado, como el uso de una muestra de respuesta voluntaria)

2. El exámen visual del diagrama de dispersión debe confimar que los puntos se aproximan a un
patrón en línea recta.

3. Debido a quelos resultados pueden verse fuertemente afectados por la presncia de valores
atípicos, es necesario eliminar tales valores si se sabe que representan errores.

1.4.2. Propiedades del coeficiente de Correlación lineal


1. El valor de r siempre está entre −1 y 1 inclusive. Es decir, −1 ≤ r ≤ 1.

2. Si todos los valores de cualquiera de las variables se convierten a una escala diferente, el valor
de r no cambia.

Ejemplo 1.2. Hector registró la cantidad de café que tomó (en mililitros) y la duración de
su trayecto al trabajo (en minutos) durante cinco días esta semana. Calcule el coeficiente de
correalción lineal (r).

Café (ml) 100 200 150 75 225


Duración (minutos) 18 14 15 20 12

Los puntos se ajustan a un patrón, lo


cual sugiere que hay correlación lineal
negativa entre La cantidad de café que
tomó Héctor y la duración del trayecto
a su trabajo

PP P
n∗
xy − x ∗ y
r=p p
n ∗ x2 − ( x)2 ∗ n ∗ y 2 − ( y)2
P P P P
1.4. COEFICIENTE DE CORRELACIÓN LINEAL (R) 9

n Café [ml] Duración [minutos] x∗y x2 y2


1 100 18 1800 10000 324
2 200 14 2800 40000 196
3 150 15 2250 22500 225
4 75 20 1500 5625 400
5 225 12 2700 50625 144
Sumatorias 750 79 11050 128750 1289

5 ∗ 11050 − 750 ∗ 79
r=√ √ = −0,983
5 ∗ 128750 − 7502 ∗ 5 ∗ 1289 − 792

Para verificar el cumplimiento de la propiedad mencionada, veamos el mismo ejemplo consi-


derando las unidades de la cantidad de café en litros.
Ejemplo 1.3. Hector registró la cantidad de café que tomó (en litros) y la duración de su
trayecto al trabajo (en minutos) durante cinco días esta semana. Calcule el coeficiente de
correalción lineal (r).

Café (litros) 0.100 0.200 0.150 0.075 0.225


Duración (minutos) 18 14 15 20 12

Los puntos se ajustan a un patrón, lo


cual sugiere que hay correlación lineal
negativa entre La cantidad de café que
tomó Héctor y la duración del trayecto
a su trabajo

PP P
n∗
xy − x ∗ y
r=p p
n ∗ x2 − ( x)2 ∗ n ∗ y 2 − ( y)2
P P P P

n Café [ml] Duración [minutos] x∗y x2 y2


1 0.100 18 1.8 0.01 324
2 0.200 14 2.8 0.04 196
3 0.150 15 2.25 0.0225 225
4 0.075 20 1.5 0.005625 400
5 0.225 12 2.7 0.050625 144
Sumatorias 0.750 79 11.050 0.12875 1289

5 ∗ 11,050 − 0,750 ∗ 79
r=p √ = −0,983
5 ∗ 0,12875 − 0,7502 ∗ 5 ∗ 1289 − 792

Como se puede apreciar, el valor de r no cambia si las unidades se cambian a una escala
diferente.
10 CAPÍTULO 1. REGRESIÓN LINEAL

3. El valor de r no se ve afectado por la elección de x o y. Si se intercambian todos los valores


de x y y, el valor de r no cambiará.

Ejemplo 1.4. Hector registró la cantidad de café que tomó (en mililitros) y la duración de
su trayecto al trabajo (en minutos) durante cinco días esta semana. Calcule el coeficiente de
correalción lineal (r).

Duración (minutos) 18 14 15 20 12
Café (ml) 100 200 150 75 225

Los puntos se ajustan a un patrón, lo


cual sugiere que hay correlación lineal
negativa entre La cantidad de café que
tomó Héctor y la duración del trayecto
a su trabajo

P
P P
n∗
xy − x ∗ y
r=p p
n ∗ x2 − ( x)2 ∗ n ∗ y 2 − ( y)2
P P P P

n Café [ml] Duración [minutos] x∗y x2 y2


1 18 100 1800 324 10000
2 14 200 2800 196 40000
3 15 150 2250 225 22500
4 20 75 1500 400 5625
5 12 225 2700 144 50625
Sumatorias 79 750 11050 1289 128750

5 ∗ 11050 − 79 ∗ 750
r=√ √ = −0,983
5 ∗ 1289 − 792 ∗ 5 ∗ 128750 − 7502

4. r mide la fuerza de una relación lineal. No está diseñado para medir la fuerza de una relación
que no sea lineal.

5. r es muy sensible a los valores atípicos en el sentido de que un único valor de este tipo podría
afectar dramáticamente su valor.

Ejemplo 1.5. Hector registró la cantidad de café que tomó (en mililitros) y la duración de
su trayecto al trabajo (en minutos) durante cinco días esta semana. Calcule el coeficiente de
correalción lineal (r).

Duración (minutos) 18 14 15 20 12
Café (ml) 100 200 150 75 50
1.4. COEFICIENTE DE CORRELACIÓN LINEAL (R) 11

Los puntos se ajustan a un patrón, lo


cual sugiere que hay correlación lineal
negativa entre La cantidad de café que
tomó Héctor y la duración del trayecto
a su trabajo, pero se puede apreciar un
valor atípico.

P P P
n ∗ xy − x ∗ y
r= p p
n ∗ x2 − ( x)2 ∗ n ∗ y 2 − ( y)2
P P P P

n Café [ml] Duración [minutos] x∗y x2 y2


1 18 100 1800 324 10000
2 14 200 2800 196 40000
3 15 150 2250 225 22500
4 20 75 1500 400 5625
5 12 50 600 144 2500
Sumatorias 79 575 8950 1289 80625

5 ∗ 8950 − 79 ∗ 575
r=√ √ = −0,176
5 ∗ 1289 − 792 ∗ 5 ∗ 80625 − 5752
1.4.3. Cálculo del coeficiente de correlación lineal (r)
A continuación, veamos un ejemplo donde se muestra el procedimiento de cálculo del coeficiente de
correlación lineal (r) empleando las dos ecuaciones antes mencionadas:
Ejemplo 1.6. La siguiente tabla muestra la relación entre las calificaciones y el tiempo de estudio
(en horas) de cada examen sobre 20 puntos que tomó Dexter este año. Calcule el coeficiente de
correalción lineal (r).
Tiempo de estudio (minutos) 45 70 150 195 15 90
Calificación (sobre 20) 14 16 18 19 12 16
Cálculo del coeficiente de correlación lineal (r), empleando la relación:
P P P
n ∗ xy − x ∗ y
r=p p
n ∗ x2 − ( x)2 ∗ n ∗ y 2 − ( y)2
P P P P

Los puntos se ajustan a un patrón, lo


cual sugiere que hay correlación lineal
positiva entre el tiempo de estudio y la
calificación obtenida.
12 CAPÍTULO 1. REGRESIÓN LINEAL

n Tiempo de estudio [minutos] Calificación [sobre 20] x∗y x2 y2


1 45 14 630 2025 196
2 70 16 1120 4900 256
3 150 18 2700 22500 324
4 195 19 3705 38025 361
5 15 12 180 225 144
6 90 16 1440 8100 256
Sumatorias 565 95 9775 75775 1537

6 ∗ 9775 − 565 ∗ 95
r=√ √ = 0,963
6 ∗ 75775 − 5652 ∗ 6 ∗ 1537 − 952

Cálculo del coeficiente de correlación lineal (r), empleando la relación:


P
zx zy
r=
n−1

n Tiempo de estudio [minutos] Calificación [sobre 20] Zx Zy Zx ∗ Zy


1 45 14 -0.732 -0.715 0.523
2 70 16 -0.360 0.066 -0.024
3 150 18 0.830 0.848 0.704
4 195 19 1.500 1.238 1.857
5 15 12 -1.179 -1.496 1.763
6 90 16 -0.063 0.066 -0.004
media x̄ =94.2 media ȳ =15.83
Sx =67.2 Sy =2.56 Sumatoria Zx ∗ Zy 4.820

4,820
r= = 0,964
6−1

Como se puede apreciar los valores para el coeficiente de correlación lineal (r) que se obtiene uti-
lizando ambas relaciones nos proporcionan resultados bastante aproximados, por lo tanto ambos
métodos son válidos para el cálculo.

1.4.4. Validación del coeficiente de correlación lineal (r)


Existen dos maneras de validar el coeficiente de correlación lineal, a continuación se explican estos
dos procedimientos:

Uso del valor P

Utilice el valor P y el nivel de significancia α de la siguiente manera:

Valor P ≤ α : Respalda la afirmación de una correlación lineal.

Valor P > α : No respalda la afirmación de una correlación lineal.

El valor P aparece en cualquier programa estadístico y se lo puede interpretar según lo definido


anteriomente. Para el ejemplo 5.6, tenemos los siguientes datos obtenidos en el Minitab
1.4. COEFICIENTE DE CORRELACIÓN LINEAL (R) 13

El valor P que muestra el Minitab es de


0.002 para un nivel de significancia de
0.05, se cumple que Valor P ≤ α : Por
lo tanto se respalda la afirmación de una
correlación lineal.

Uso de los valores críticos de Pearson (tabla A-6)

Considere los valores críticos de la tabla A-6 como positivos y negativos y compare estos valores con el
valor del coeficiente de correlación lineal (r) calculado con las ecuaciones mencionadas anteriormente.
A continuación se muestra parte de la tabla A-6 que muestra los valores críticos para dos diferentes
valores de α, el que se usará para la validación son los valores de α = 0,05.

Los criterios para la validación del coeficiente de correlación lineal (r) se describen a continuación:

Correlación: Si el coeficiente de correlación lineal calculado (r) se encuentra en la región de la cola


izquierda o derecha mas allá del valor crítico para esa cola, se concluye que hay evidencia suficiente
para respaldar la afirmación de una correlación lineal.
Sin correlación: Si el coeficiente de correlación lineal calculado se encuentra entre los dos valores
críticos, concluya que no hay evidencia suficiente para respaldar la afirmación de una correlación
lineal.
14 CAPÍTULO 1. REGRESIÓN LINEAL

Para el ejemplo 5.6, rcalculado = 0,963, para n = 6, tenemos un valor crítico de rcritico = 0,811, como
rcalculado es positivo, tomaremos la cola derecha del gráfico para validar el rcalculado

Como el rcalculado se encuentra más allá del rcritico , (más cerca a 1), se concluye que existe evidencia
suficiente para respaldar la afirmación de que existe correlación lineal entre las horas de estudio y
la calificación obtenida.

1.4.5. Errores comunes relacionados con la correlación


A continuación se describen tres de los errores más comunes que se producen en la interpretación de
resultados que involucran correlación:
1. Suponer que la correlación implica causalidad

2. Usar datos basados en promedios, ya que los promedios suprimen la variación individual y
pueden inflar el coeficiente de correlación.

3. Ignorar la posibilidad de una relación no lineal, si no existe una correlación lineal, puede haber
alguna otra correlación que no sea lineal.

1.5. Ejercicios Propuestos


1. A continuación se listan las cantidades de embarcaciones recreativas registradas en Florida
(decenas de miles) y el número de muertes de mantíes por encuentros con embarcaciones
durante cada uno de los últimos años.

Embarcaciones recreativas 99 99 97 95 90 90 87 90 90
Muertes de manatíes 92 73 90 97 83 88 81 73 68

a) Construya el diagrama de dispersión y comente el resultado


b) ¿Existe evidencia suficiente para concluir que existe una correlación lineal entre el nú-
mero de embarcaciones recreativas registradas y el número de muertes de manatíes por
encuentros con embarcaciones?
1.5. EJERCICIOS PROPUESTOS 15

2. A continuación se listan los montos de cuentas de restaurante durante la cena y montos de las
propinas que se dieron.

Cuenta (dólares) 33.46 50.68 87.92 98.84 63.60 107.34


Propina (dólares) 5.50 5.00 8.08 17.00 12.00 16.00

a) Construya el diagrama de dispersión y comente el resultado


b) ¿Existe evidencia suficiente para concluir que existe una correlación lineal entre los montos
de las cuentas y los tamaños de las propinas?
c) Si todos los comensales tuvieran que dar una propina con el mismo porcentaje ¿Cuál
debería ser el valor de r?

3. Una aplicación clásica de la correlación implica la asociación entre la temperatura y el número


de veces que un grillo chirría en un minuto. A continuación se listan el número de chirridos en
1 minuto y las temperaturas correspondientes en ◦ F

Chirridos en 1 minuto 882 1188 1104 864 1200 1032 960 900
Temperatura ◦ F 69.7 93.3 84.3 76.3 88.6 82.6 71.6 79.6

a) Construya el diagrama de dispersión y comente el resultado


b) ¿Existe evidencia suficiente para concluir que existe una correlación lineal entre el número
de chirridos en 1 minuto y la temperatura?

4. A continuación se listan las edades de los ganadores del Oscar relacionadas de acuerdo con los
años en que obtuvieron los premios.

Mejor actriz 28 30 29 61 32 33 45 29 62 22 44 54
Mejor actor 43 37 38 45 50 48 60 50 39 55 44 33

a) Construya el diagrama de dispersión y comente el resultado


b) ¿Existe evidencia suficiente para concluir que existe una correlación lineal entre las edades
de las mejores actrices y los mejores actores?
c) ¿Deberíamos esperar que haya una correlación?

5. Se ha introducido un nuevo tipo de lavadora en 11 grandes almacenes. Aproximadamente,


todos los almacenes son del mismo tamaño y están situados en sectores similares. El productor
ha variado el precio en cada almacén y los datos siguientes muestran el número de unidades
que se han vendido, en un mes.

Precio (en dólares) 280 290 300 310 320 330 340 350 360 370 380
Unidades vendidas 44 41 34 38 33 30 32 26 28 23 20

a) Construya el diagrama de dispersión y comente el resultado


b) ¿Existe evidencia suficiente para concluir que existe una correlación lineal entre el precio
de las lavadoras y la cantidad de lavadoras que se venden?

6. El siguiente conjunto de datos muestra la temperatura a la que se se llevó adelante un experi-


mento y el porcentaje de producto resultante en dicho experimento:
16 CAPÍTULO 1. REGRESIÓN LINEAL

Temperatura (◦ C) 100 110 120 125 130 140 150 160 170 180 190 200
% de producto resultante 45 51 54 53 59 63 69 74 78 86 89 94

a) Construya el diagrama de dispersión y comente el resultado


b) ¿Existe evidencia suficiente para concluir que existe una correlación lineal entre la tem-
peratura del experimento y el porcentaje de producto obtenido?

7. Se sabe que la resistencia de un neumático depende de su presión. Se probó un nuevo tipo de


neumático a distintas presiones, mostrandom los resultados siguientes:

Presión (libras por pulgada) 30 31 32 33 34 35 36 37 38 39 40


Resistencia (en miles de millas) 29.4 32.2 35.9 38.4 36.6 34.8 35.0 32.2 30.5 28.6 27.4

a) Construya el diagrama de dispersión y comente el resultado


b) ¿Existe evidencia suficiente para concluir que existe una correlación lineal entre la presión
del neumático y su resistencia al uso?

1.6. Regresión
En esta sección se presentan métodos para encontrar la ecuación de la línea resta que mejor se
ajusta a los puntos en un diagrama de dispersión de datos muestrales pareados. Esa línea recta con
el mejor ajuste se denomina línea de regresión y su ecuación se llama ecuación de regresión.
La ecuación de regresión sirve para realizar predicciones para el valor de ian de las variables, dado
algún valor específico de la otra variable.
Dada una colección de datos muestrales pareados, la línea de regresión es la recta que "mejor"se
ajusta al diagrama de dispersión de los datos. La ecuación de regresión:
ŷ = a + bx
describe algebraicamente la línea de regresión. La ecuación de regresión expresa una relación entre
x (llamada variable explicativa, variable predictora o variable independiente) y ŷ (llamada variable
de respuesta o variable dependiente).

En Estadística la ecuación de la línea de regresión se expresa como: ŷ = a + bx, donde a es la


intersección y b es la pendiente. Ambos valores a y b se pueden obtener a partir de los muchos
programas de software y también a partir de cálculos manuales empleando fórmulas.

1.6.1. Requisitos para la determinación de a y b de la ecuación de regresión


1. La muestra de datos pareados (x, y) es una muestra aleatoria de datos cuantitativos.
2. El examen visual del diagrama de dispersión muestra que los puntos se aproximan a un patrón
en línea recta.
3. Los valores atípicos pueden tener un fuerte efecto en la ecuación de regresión; por lo tanto se
debe eliminar los valores atípicos si estos representan errores.

1.6.2. Ecuaciones para determinar la pendiente y la intersección en la ecuación


de regresión
Para determinar los valores de la pendiente y la intersección de la ecuación de regresión se pueden
emplear las siguientes ecuaciones:
1.6. REGRESIÓN 17

Primera forma para determinar la pendiente y la intersección


Sy
b=r∗ (ecuación para hallar la pendiente)
Sx
Donde:
r: Coeficiente de correlación lineal
Sx : Desviación estándar de los valores de x
Sy : Desviación estándar de los valores de y

a = ȳ − b ∗ x̄ (ecuación para hallar la intersección)

Donde:
ȳ: media de los valores en y
x̄: media de los valores en x

Veamos un ejemplo:

Ejemplo 1.7. La siguiente tabla muestra la relación entre las calificaciones y el tiempo de estudio
(en horas) de cada examen sobre 20 puntos que tomó Dexter este año. Encuentre la ecuación de
regresión lineal.

Tiempo de estudio (minutos) 45 70 150 195 15 90


Calificación (sobre 20) 14 16 18 19 12 16

Calculamos el coeficiente de correlación lineal:


n Tiempo de estudio [minutos] Calificación [sobre 20] x∗y x2 y2
1 45 14 630 2025 196
2 70 16 1120 4900 256
3 150 18 2700 22500 324
4 195 19 3705 38025 361
5 15 12 180 225 144
6 90 16 1440 8100 256
Sumatorias 565 95 9775 75775 1537

6 ∗ 9775 − 565 ∗ 95
r=√ √ = 0,963
6 ∗ 75775 − 5652 ∗ 6 ∗ 1537 − 952
Calculamos las desviaciones estándar para ambas variables:
n Tiempo de estudio [minutos] Calificación [sobre 20]
1 45 14
2 70 16
3 150 18
4 195 19
5 15 12
6 90 16
media x̄ =94.2 media ȳ =15.83
Sx =67.2 Sy =2.56
Calculamos la pendiente:
Sy
b=r∗
Sx
18 CAPÍTULO 1. REGRESIÓN LINEAL

2,56
b = 0,963 ∗ = 0,037
67,2

Calculamos la intersección:

a = ȳ − b ∗ x̄

a = 15,83 − 0,037 ∗ 94,2 = 12,345

La ecuación de regresión es:

ŷ = 12,345 + 0,037x

Segunda forma para determinar la pendiente y la intersección


P P P
n ∗ xy − x ∗ y
b= (ecuación para hallar la pediente)
n ∗ x2 − ( x)2
P P

y ∗ x2 − x ∗ xy
P P P P
a= (ecuación para hallar la intersección)
n ∗ x2 − ( x)2
P P

Veamos un ejemplo:

Ejemplo 1.8. La siguiente tabla muestra la relación entre las calificaciones y el tiempo de estudio
(en horas) de cada examen sobre 20 puntos que tomó Dexter este año. Encuentre la ecuación de
regresión lineal.

Tiempo de estudio (minutos) 45 70 150 195 15 90


Calificación (sobre 20) 14 16 18 19 12 16

Calculamos el coeficiente de correlación lineal:


n Tiempo de estudio [minutos] Calificación [sobre 20] x∗y x2 y2
1 45 14 630 2025 196
2 70 16 1120 4900 256
3 150 18 2700 22500 324
4 195 19 3705 38025 361
5 15 12 180 225 144
6 90 16 1440 8100 256
Sumatorias 565 95 9775 75775 1537

Calculamos la pendiente:
P P P
n ∗ xy − x ∗ y
b=
n ∗ x2 − ( x)2
P P

6 ∗ 9775 − 565 ∗ 95
b= = 0,037
6 ∗ 75775 − 5652
Calculamos la intersección:
y ∗ x2 − x ∗ xy
P P P P
a=
n ∗ x2 − ( x)2
P P

95 ∗ 75775 − 565 ∗ 9775


a= = 12,374
6 ∗ 75775 − 5652
1.6. REGRESIÓN 19

La ecuación de regresión es:

ŷ = 12,374 + 0,037x

Ambos métodos proporcionan valores bastante próximos para la pendiente y la intersección.

Regla de redondeo para la pendiente y la intersección: Redondee a y b a tres dígitos signifi-


cativos.

1.6.3. Interpretación de la pendiente y la intersección


Pendiente
Indica la cantidad en que se incrementa o disminuye el valor de la variable y, cuando la variable x
aumenta una unidad. El incremento se presenta cuando el valor de b es positivo y la disminución en
el caso contrario.

Intersección
La intersección es el punto exacto en el cual la línea de regresión corta al eje y, asume un valor en
y cuando x es igual a 0.
Veamos un ejemplo:

Ejemplo 1.9. La siguiente tabla muestra la relación entre las calificaciones y el tiempo de estudio
(en horas) de cada examen sobre 20 puntos que tomó Dexter este año. Interprete el significado de la
pendiente y la intersección de la ecuación de regresión.

Tiempo de estudio (minutos) 45 70 150 195 15 90


Calificación (sobre 20) 14 16 18 19 12 16

La ecuación de regresión es:

ŷ = 12,4 + 0,037x

b: 0.037, significa que la calificación se incrementa en 0.037 puntos por un minuto que se incrementa
en el tiempo de estudio.
a: 12.4, significa que si el tiempo de estudio de Dexter es 0 (no dedica tiempo a estudiar) la calificación
que obtendrá es 12.4 puntos.

1.6.4. Validación del modelo de regresión lineal


La validación del modelo de regresión se realiza encontrando los valores de ŷ a partir de la ecuación
de regresión y los valores de x, estos datos se deben graficar sobre el diagrama de dispersión y asi
determinar subjetivamente qué tan bien se ajusta la línea de regresión a los datos originales.
Veamos un ejemplo:

Ejemplo 1.10. La siguiente tabla muestra la relación entre las calificaciones y el tiempo de estudio
(en horas) de cada examen sobre 20 puntos que tomó Dexter este año. Valide el modelo de regresión
sobre el diagrama de dispersión.

Tiempo de estudio (minutos) 45 70 150 195 15 90


Calificación (sobre 20) 14 16 18 19 12 16

La ecuación de regresión es:


20 CAPÍTULO 1. REGRESIÓN LINEAL

ŷ = 12,4 + 0,037x

Reemplazamos los valores de x en la ecuación y encontramos los valores de ŷ. Luego graficamos los
valores de ŷ y x sobre el diagrama de dispersión original.

n Tiempo de estudio ŷ = 12,4 + 0,037x


(x)
1 45 14.1
2 70 15.0
3 150 18.0
4 195 19.6
5 15 13.0
6 90 15.7

Se puede apreciar que la línea de regresión se ajusta bien a los puntos de los datos originales, por lo
tanto la ecuación de regresión es un buen modelo para realizar predicciones.

1.6.5. Predicciones a partir de la ecuación de regresión

Con frecuencia, las ecuaciones de regresión son útiles para predecir el valor de una variable, dado
algún valor específico de la otra variable. Al realizar predicciones, es necesario tener en cuenta lo
siguiente:

1. Modelo Malo: Si la ecuación de regresión no parece ser útil para hacer predicciones, no use
la ecuación de regresión para realizarlas. Para los malos modelos, el mejor valor predicho de
una variable es simplemente su media muestral.

2. Buen modelo: Utilice la ecuación de regresión para realizar predicciones sólo si la gráfica
de la línea de regresión sobre el diagrama de dispersión confirma que la línea de regresión se
ajusta razonablemente bien a los puntos.

3. Correlación: Use la ecuación de regresión para realizar predicciones sólo si el coeficiente de


correlación lineal (r9 indica que existe una correlación lineal entre las dos variables.

4. Alcance: Utilice la línea de regresión para realziar predicciones sólo si los datos no van mas
allá del alacance de los datos muestrales disponibles.

Utilice el siguiente esquema para realizar las predicciones:


1.6. REGRESIÓN 21

Veamos un ejemplo:
Ejemplo 1.11. La siguiente tabla muestra la relación entre las calificaciones y el tiempo de estudio
(en horas) de cada examen sobre 20 puntos que tomó Dexter este año. Estime la calificación que
obtendrá Dexter si el tiempo de estudio es de 120 minutos.

Tiempo de estudio (minutos) 45 70 150 195 15 90


Calificación (sobre 20) 14 16 18 19 12 16

La ecuación de regresión es:


ŷ = 12,4 + 0,037x
El dato que proporciona el ejercicio es el tiempo de estudio y corresponde a la variables x, se debe
calcular ŷ para x = 120, reemplazamos en la ecuación de regresión:
ŷ = 12,4 + 0,037 ∗ 120 = 16,8
Lo que significa que si Dexter tiene un tiempo de estudio de 120 minutos, la calificación que obtendrá
será de 16.8 puntos.

1.6.6. Coeficiente de determinación R2


El coeficiente de determinación es la proporcion de la variación en y que se explica por la línea de
regresión. Se calcula a partir de la siguiente expresión:
variacion explicable
R2 =
variacion total
Las variaciones las podemos calcular a partir de la siguiente expresión:
X X X
(y − ȳ)2 = (ŷ − ȳ)2 + (y − ŷ)2
22 CAPÍTULO 1. REGRESIÓN LINEAL

Donde:
X
(y − ȳ)2 : Variación total
X
(ŷ − ȳ)2 : Variación explicable
X
(y − ŷ)2 : Variación inexplicable

Otra forma de calcular el coeficiente de determinación es elevando al cuadrado el valor del coeficiente
de correlación lineal:

R2 = (r)2

Veamos un ejemplo:

Ejemplo 1.12. La siguiente tabla muestra la relación entre las calificaciones y el tiempo de estudio
(en horas) de cada examen sobre 20 puntos que tomó Dexter este año. Determine el coeficiente de
determinación e interprete el resultado.

Tiempo de estudio (minutos) 45 70 150 195 15 90


Calificación (sobre 20) 14 16 18 19 12 16

Cálculo del coeficiente de correlación lineal (r), empleando la relación:


P P P
n ∗ xy − x ∗ y
r=p p
n ∗ x2 − ( x)2 ∗ n ∗ y 2 − ( y)2
P P P P

n Tiempo de estudio [minutos] Calificación [sobre 20] x∗y x2 y2


1 45 14 630 2025 196
2 70 16 1120 4900 256
3 150 18 2700 22500 324
4 195 19 3705 38025 361
5 15 12 180 225 144
6 90 16 1440 8100 256
Sumatorias 565 95 9775 75775 1537

6 ∗ 9775 − 565 ∗ 95
r=√ √ = 0,963
6 ∗ 75775 − 5652 ∗ 6 ∗ 1537 − 952

Cálculo del coeficiente de determinación R2


Una vez determinado el coeficiente de correlación lineal (r), el coeficiente de determinación se puede
calcular empleando la siguiente relación:

R2 = (r)2

Reemplazamos el valor de r = 0,963

R2 = (0,963)2 = 0,927

Para expresarlo como porcentaje, multiplicamos por 100:

R2 = 0,927 ∗ 100 = 92,7 %


1.6. REGRESIÓN 23

Cálculo del coeficiente de determinación usando las variaciones total y explicable

X X X
n Tiempo de estudio Calificación ŷ = 12,4 + 0,037x (y − ȳ)2 (ŷ − ȳ)2 (y − ŷ)2
(x) (y)
1 45 14 14.1 3.24 2.89 0.01
2 70 16 15.0 0.04 0.64 1.00
3 150 18 18.0 4.84 4.84 0.00
4 195 19 19.6 10.24 14.44 0.36
5 15 12 13.0 14.44 7.84 1.00
6 90 16 15.7 0.04 0.01 0.09
ȳ = 15,8 Sumatoria 32.84 30.66 2.46

Cálculo del coeficiente de determinación R2


30,66
R2 = = 0,934
32,84

Multiplicamos por 100, para expresarlo como porcentaje


R2 = 0,934 ∗ 100 % = 93,4 %

Interpretación del coeficiente de determinación R2


Como R2 =93.4 %, este se puede interpretar de la siguiente forma: El modelo matemático ŷ =
12,4 + 0,037x, explica en un 93.4 % la variación de las calificaciones en función del tiempo
de estudio y existe un 6.6 % que no se puede explicar a través del modelo matemático.

Ejemplo 1.13. A continuación se listan montos de cuentas de restaurante durante la cena y montos
de las propinas que se dieron. Los datos fueron recolectados por estudiantes de la asignatura de
Estadística.

Cuenta (dólares) 33.46 50.68 87.92 98.84 63.60 107.34


Propina (dólares) 5.50 5.00 8.08 17.00 12.00 16.00

a.- Realice el gráfico de dispersión


24 CAPÍTULO 1. REGRESIÓN LINEAL

b.- ¿Existe evidencia suficiente para concluir que existe una correlación lineal entre los montos de
las cuentas y los tamaños de las propinas?

n Cuenta (dólares) Propina (dólares) x∗y x2 y2


1 33.46 5.50 184.03 1119.57 30.25
2 50.68 5.00 253.40 2568.46 25.00
3 87.92 8.08 710.39 7729.93 62.29
4 98.84 17.00 1680.28 9769.35 289.00
5 63.60 12.00 763.20 4044.96 144.00
6 107.34 16.00 1717.44 11521.88 256.00
Sumatorias 441.84 63.58 5308.74 36754.14 809.54
P P P
n∗
xy − x ∗ y
r=p p
n ∗ x2 − ( x)2 ∗ n ∗ y 2 − ( y)2
P P P P

6 ∗ 5308,74 − 441,84 ∗ 63,58


r=p p = 0,828
6 ∗ 36754,14 − 441,842 ∗ 6 ∗ 809,54 − 63,582

rcalculado = 0,828

Para n = 6, tenemos que rcritico = 0,811


Como rcalculado > rcrtico

Con un nivel de confianza del 95 % existe suficiente evidencia para afirmar que
existe correlación lineal positiva entre la cuenta y las propinas.
c.- Si todos los comensales tuvieran que dar una propina con el mismo porcentaje, ¿cuál debería
ser el valor de r?

Cuando dice con el mismo porcentaje (este porcentaje se saca tomando el primer
dato y obteniendo el porcentaje, el mismo que se repetirá para cada cuenta 16 %)
indica que las propinas sean proporcionales al tamaño de cuenta, en este caso se
tendría la siguiente gráfica:

Cuenta (dólares) Propina (dólares)


33.46 5.30
50.68 8.03
87.92 13.93
98.84 15.66
63.60 10.07
107.34 17.00

El valor de r, tendría que ser 1.


1.6. REGRESIÓN 25

d.- Encuentre el valor de la ordenada al origen y la pendiente, escriba el modelo matemático e


interprete los valores de a y b.
Calculamos la pendiente:
P P P
n ∗ xy − x ∗ y
b=
n ∗ x2 − ( x)2
P P

6 ∗ 5308,74 − 441,84 ∗ 63,58


b= = 0,149
6 ∗ 36754,14 − 441,842

Calculamos la intersección:

y ∗ x2 − x ∗ xy
P P P P
a=
n ∗ x2 − ( x)2
P P

63,58 ∗ 36754,14 − 441,84 ∗ 5308,74


a= = −0,347
6 ∗ 36754,14 − 441,842

La ecuación de regresión es:

ŷ = −0,347 + 0,149x

a = −0,347 Indica que si la cuenta es de 0 $, la


propina será de −0,347 $

b = 0,149 Indica que si existe un incremento de


1 $ en la cuenta, la propina aumenta en 0.149 $
e.- Encuentre el coeficiente de determinación, interprete el resultado

R2 = 0,8282 ∗ 100 % = 68,6 %

El modelo lineal explica en 68.6 % la variación de la propina en función de la cuenta


y existe un 31.4 % de la variación de la propina que no se puede explicar con el
modelo matemático

f.- Con base en los datos de cuenta/propina, encuentre el mejor monto predicho para una cuenta
de $100 durante la cena.

y = −0,347 + 0,149x
y = −0,347 + 0,149 ∗ 100 = 14,55$

El modelo predice que para una cuenta de 100$, la propina es de 14.55$

g.- ¿Qué regla para dejar propinas sugiere la ecuación de regresión?

El modelo matemático sugiere que la propina debe de ser 15 % de la cuenta apro-


ximadamente
26 CAPÍTULO 1. REGRESIÓN LINEAL

h.- Represente el modelo de regresión lineal en el gráfico de dispersión de puntos

Cuenta (dólares) Propina (dólares)


y = −0,347 + 0,149x
33.46 4.64
50.68 7.20
87.92 12.75
98.84 14.38
63.60 9.13
107.34 15.65

1.7. Ejercicios Propuestos


1. A continuación se listan las cantidades de embarcaciones recreativas registradas en Florida
(decenas de miles) y el número de muertes de mantíes por encuentros con embarcaciones
durante cada uno de los últimos años.

Embarcaciones recreativas 99 99 97 95 90 90 87 90 90
Muertes de manatíes 92 73 90 97 83 88 81 73 68

a) Determina el valor de la pendiente y la intersección


b) Escriba el modelo matemático
c) Realiza la interpretación de la pendiente y la intersección.
d ) Represente el modelo de regresión lineal en el gráfico de dispersión de puntos.
e) Determina el valor del coefciente de determinación y realiza la interpretación.
f ) Si un año se registran 970000 embarcaciones recreativas registadas ¿Cuál es el número de
muertes de manatíes ?

2. Una aplicación clásica de la correlación implica la asociación entre la temperatura y el número


de veces que un grillo chirría en un minuto. A continuación se listan el número de chirridos en
1 minuto y las temperaturas correspondientes en ◦ F

Chirridos en 1 minuto 882 1188 1104 864 1200 1032 960 900
Temperatura ◦ F 69.7 93.3 84.3 76.3 88.6 82.6 71.6 79.6

a) Determina el valor de la pendiente y la intersección


b) Escriba el modelo matemático
c) Realiza la interpretación de la pendiente y la intersección.
d ) Represente el modelo de regresión lineal en el gráfico de dispersión de puntos.
e) Determina el valor del coefciente de determinación y realiza la interpretación.
1.7. EJERCICIOS PROPUESTOS 27

f ) Si un grillo regista 2000 chirridos en un minuto ¿Cuál es la temperatura del grillo? ¿Qué
sugiere esta respuesta?

3. A continuación se listan las edades de los ganadores del Oscar relacionadas de acuerdo con los
años en que obtuvieron los premios.

Mejor actriz 28 30 29 61 32 33 45 29 62 22 44 54
Mejor actor 43 37 38 45 50 48 60 50 39 55 44 33

a) Determina el valor de la pendiente y la intersección


b) Escriba el modelo matemático
c) Realiza la interpretación de la pendiente y la intersección.
d ) Represente el modelo de regresión lineal en el gráfico de dispersión de puntos.
e) Determina el valor del coefciente de determinación y realiza la interpretación.
f ) Si una actriz gana el Oscar con 38 años ¿Cuál es la edad del actor que gana el Oscar?
¿Qué sugiere el resultado?

4. Se ha introducido un nuevo tipo de lavadora en 11 grandes almacenes. Aproximadamente,


todos los almacenes son del mismo tamaño y están situados en sectores similares. El productor
ha variado el precio en cada almacén y los datos siguientes muestran el número de unidades
que se han vendido, en un mes.

Precio (en dólares) 280 290 300 310 320 330 340 350 360 370 380
Unidades vendidas 44 41 34 38 33 30 32 26 28 23 20

a) Determina el valor de la pendiente y la intersección


b) Escriba el modelo matemático
c) Realiza la interpretación de la pendiente y la intersección.
d ) Represente el modelo de regresión lineal en el gráfico de dispersión de puntos.
e) Determina el valor del coefciente de determinación y realiza la interpretación.
f ) Si se venden 60 lavadoras ¿Cuál sería el precio de venta de una lavadora? ¿Qué sugiere
el resultado?

5. El siguiente conjunto de datos muestra la temperatura a la que se se llevó adelante un experi-


mento y el porcentaje de producto resultante en dicho experimento:

Temperatura (◦ C) 100 110 120 125 130 140 150 160 170 180 190 200
% de producto resultante 45 51 54 53 59 63 69 74 78 86 89 94

a) Determina el valor de la pendiente y la intersección


b) Escriba el modelo matemático
c) Realiza la interpretación de la pendiente y la intersección.
d ) Represente el modelo de regresión lineal en el gráfico de dispersión de puntos.
e) Determina el valor del coefciente de determinación y realiza la interpretación.

6. Se sabe que la resistencia de un neumático depende de su presión. Se probó un nuevo tipo de


neumático a distintas presiones, mostrandom los resultados siguientes:
28 CAPÍTULO 1. REGRESIÓN LINEAL

Presión (libras por pulgada) 30 31 32 33 34 35 36 37 38 39 40


Resistencia (en miles de millas) 29.4 32.2 35.9 38.4 36.6 34.8 35.0 32.2 30.5 28.6 27.4

a) Determina el valor de la pendiente y la intersección

b) Escriba el modelo matemático

c) Realiza la interpretación de la pendiente y la intersección.

d ) Represente el modelo de regresión lineal en el gráfico de dispersión de puntos.

e) Determina el valor del coefciente de determinación y realiza la interpretación.

1.8. Regresión No lineal

La regresión no lineales es una técnica de regresión que encuentra relaciones entre dos o más variables
que poseen una relación compleja (no lineal).

La creación de una gráfica de dispersión es una manera útil de evaluar si existe una relación entre
variables y definir el tipo de relación (lineal o no lineal). Una relación no lineal es sólo una posibilidad.

Un modelo de regresión no lineal es una ecuación que describe la relación no lineal entre la variable
respuesta y la variable predictora cuando esta no puede ser formada adecuadamente mediante una
relación lineal, es decir, se utiliza cuando los datos no se ajustan a la recta de mejor ajuste, entonces
se debe considerar otras opciones para explicar la relación, entre estas opciones se puede conisderar
a los siguientes modelos: logarítmico, exponencial, potencial, cuadrático, entre otros.

A continuación se proporciona modelos genéricos y gráficos para los modelos de regresión NO LI-
NEALES.
1.8. REGRESIÓN NO LINEAL 29

Modelo lineal

Modelo matemático: ŷ = a + bx

Modelo logarítmico

Modelo matemático: ŷ = a + b lnx


30 CAPÍTULO 1. REGRESIÓN LINEAL

Modelo Potencial

Modelo matemático: ŷ = a xb

Modelo Exponencial

Modelo matemático: ŷ = a ebx


1.8. REGRESIÓN NO LINEAL 31

Modelo Cuadrático

Modelo matemático: ŷ = a + bx + cx2

1.8.1. Reglas básicas para identificar un buen modelo matemático

1. Elabore la gráfica de dispersión y busque un patrón conisderando los gráficos mostrados ante-
riormente, elija el que mejor se ejusta a sus datos.

2. Compare los valores de R2 para cada modelo, esto se debe realizar con ayuda de la calculadora
o algún software estadístico.

3. Use sentido común, no utilice un modelo que conduzca a valores predichos que no son realistas,
emplee el modelo para calcular valores futuros, valores pasados y valores de datos faltantes y
después, determine se los resultados son realistas y tienen sentido.

Veamos un ejemplo:

Ejemplo 1.14. La tabla, lista la distancia en metros por encima del suelo para un objeto soltado
en un vacío de baja gravedad desde una altura de 300 metros. El tiempo en segundos es el tiempo
después de soltar el objeto.

Tiempo (segundos) 1 2 3 4 5
Distancia (metros) 295.1 280.5 256.1 220.0 178.1

a.- Elabora el gráfico de dispersión de puntos.


32 CAPÍTULO 1. REGRESIÓN LINEAL

b.- Identifica el modelo matemático que mejor se ajusta a los datos, considera solamente los mo-
delos: lineal y = a + bx, cuadrático y = a + bx + cx2 , logarítmico y = a + b lnx, exponencial
y = aebx y de potencia y = axb .

Modelo Ecuación Coeficiente de determinación


Lineal y = 334,31 − 29,45x 96.5 %
Exponencial y = 352,46e−0,125x 93.3 %
Logaritmico y = 311,23 − 68,17Lnx 83.5 %
Potencial y = 318,22x−0,286 78.4 %
Cuadrático y = 301,16 − 1,04x − 4,74x2 99.9 %

El mejor modelo matemático que se ajusta a los datos es el MODELO CUADRÁTICO.

c.- Interpreta el valor del coeficiente de determinación del mejor modelo.

R2 = 99,9 %, significa que el modelo CUADRÁTICO explica en un 99.9 % la variación de la


Distancia en función del tiempo.

d.- ¿Que distancia recorre un objeto si este se soltó durante 3.5 segundos?

y = 301,16 − 1,04x − 4,74x2

y = 301,16 − 1,04 ∗ 3,5 − 4,74 ∗ (3,5)2 = 239,5 : m

El objeto recorre 239.5 metros, si se lo deja caer 3.5 segundos.

e.- Representa el mejor modelo en el gráfico de dispersión de puntos.


1.9. EJERCICIOS PROPUESTOS 33

Tiempo (s) Distancia (metros)


y = 301,16 − 1,04x − 4,74x2
1 295.4
2 280.1
3 255.4
4 221.2
5 177.5

1.9. Ejercicios Propuestos


1. La compañia Tierra abonada, vende tierra abonada. Se vende por yarda, que en realidad es
una yarda cúbica, y la variable x es la longitud (en yardas) de cada lado de un cubo de tierra
abonada.

x (yarda) 1 2 3 4 6
Costo (dólares) 25 200 675 1600 5400

a) Elabora el gráfico de dispersión de puntos


b) Identifica el modelo matemático que mejor se ajusta a los datos, considera solamente los
modelos: lineal y = a + bx, cuadrático y = a + bx + cx2 , logarítmico y = a + b lnx,
exponencial y = aebx y de potencia y = axb .
c) Interpreta el valor del coeficiente de determinación del mejor modelo.
d ) Representa el mejor modelo en el gráfico de dispersión de puntos

2. La tabla siguiente muestra los datos para la intensidad del sonido como múltiplos de un sonido
de referencia básico. Se usa una escala similar a la escala de decibeles para medir la intensidad
del sonido.

Intensidad de sonido 360 500 750 2000 5000


Valor en la escala 25.00 27.00 28.75 33.00 37.00

a) Elabora el gráfico de dispersión de puntos


b) Identifica el modelo matemático que mejor se ajusta a los datos, considera solamente los
modelos: lineal y = a + bx, cuadrático y = a + bx + cx2 , logarítmico y = a + b lnx,
exponencial y = aebx y de potencia y = axb .
c) Interpreta el valor del coeficiente de determinación del mejor modelo.
d ) Representa el mejor modelo en el gráfico de dispersión de puntos

3. En un experimento cuidadosamente controlado, las bacterias pueden crecer durante una sema-
na.
34 CAPÍTULO 1. REGRESIÓN LINEAL

Dias de la semana 1 2 3 4 5 6 7
Cantidad de bacterias 20 40 80 160 320 640 1280

a) Elabora el gráfico de dispersión de puntos


b) Identifica el modelo matemático que mejor se ajusta a los datos, considera solamente los
modelos: lineal y = a + bx, cuadrático y = a + bx + cx2 , logarítmico y = a + b lnx,
exponencial y = aebx y de potencia y = axb .
c) Interpreta el valor del coeficiente de determinación del mejor modelo.
d ) Representa el mejor modelo en el gráfico de dispersión de puntos

4. La tabla siguiente, lista diferentes cantidades (toneladas métricas) del explosivo TNT y el valor
correspondiente medido en la escala de Richter resultante de las explosiones del TNT.

TNT 2 10 15 50 100 500


Escala de Richter 3.4 3.9 4.0 4.4 4.6 5.0

a) Elabora el gráfico de dispersión de puntos


b) Identifica el modelo matemático que mejor se ajusta a los datos, considera solamente los
modelos: lineal y = a + bx, cuadrático y = a + bx + cx2 , logarítmico y = a + b lnx,
exponencial y = aebx y de potencia y = axb .
c) Interpreta el valor del coeficiente de determinación del mejor modelo.
d ) Representa el mejor modelo en el gráfico de dispersión de puntos

5. De acuerdo con la ley de Benford, una variable de conjuntos de datos diferentes incluye números
con los primeros dígitos que se listan en la siguiente tabla, de los cuales ocurren con las
proporciones indicadas.

Primer dígito 1 2 3 4 5 6 7 8 9
Proporción 0.301 0.176 0.125 0.097 0.079 0.067 0.058 0.051 0.046

a) Elabora el gráfico de dispersión de puntos


b) Identifica el modelo matemático que mejor se ajusta a los datos, considera solamente los
modelos: lineal y = a + bx, cuadrático y = a + bx + cx2 , logarítmico y = a + b lnx,
exponencial y = aebx y de potencia y = axb .
c) Interpreta el valor del coeficiente de determinación del mejor modelo.
d ) Representa el mejor modelo en el gráfico de dispersión de puntos
Capítulo 2

Capitulo 2

Teorema 2.1. este es el primer teorema

Ejemplo 2.1. Aqui introducimos su ejemplo visto en el Teorema 2.1 y este se enumera automati-
camente [1] y [2].

35
36 CAPÍTULO 2. CAPITULO 2
Bibliografía

[1] Bazaraa, M.S., J.J. Jarvis y H.D. Sherali, Programacion lineal y flujo en redes, segunda
edicion, Limusa, Mexico, DF, 2004.

[2] Dantzig, G.B. y P. Wolfe, Decomposition principle for linear programs, Operations Research,
8, págs. 101–111, 1960.

37

También podría gustarte