Regresión Lineal
Regresión Lineal
Regresión Lineal
EJERCICIO 13
X Y
4 4
5 6
3 5
6 7
10 7
DIAGRAMA DE DISPERSIÓN
8 Y
6
4
Y
2
0
0 2 4 6 8 10 12
y = 0.363x + 3.7671
8 Y R² = 0.5659
4
Y
2 Linear (Y)
0
0 2 4 6 8 10 12
MODELO:
Y=3.76+0.36X
Coeficiente de determinación
R² = 0,565
La variable x explica 56% a la variable y, y un 44% por otra variable que no está en el modelo.
EJERCICIO 14
X Y
5 13
3 15
6 7
3 12
4 13
4 11
6 9
8 5
DIAGRAMA DE DISPERSIÓN
Y
16
14
12
10
8
Y
6
4
2
0
0 2 4 6 8 10
Y y = -1.7425x + 19.12
R² = 0.7935
16
14
12
10
8 Y
6 Linear (Y)
4
2
0
0 2 4 6 8 10
MODELO
𝒚 = 𝒂 + 𝒃𝒙
Y=19.12 – 1.74 X
Coeficiente de determinación
R² = 0, 7935
La variable X explica en 79% a la variable Y. y un 21% se explica por otra variable que no está en
el modelo.
EJERCICIO 15
La Brandlord electric Ilumination Company estudia la relación entre kilowatts-hora (miles) usados
y el número de habitaciones en una residencia privada familiar. Una muestra aleatoria de 10 casas
mostro lo siguiente:
N°
habitaciones Consumo
12 9
9 7
14 10
6 5
10 8
8 6
10 8
10 10
5 4
7 7
DIAGRAMA DE DISPERSIÓN
Consumo
y = 0.6667x + 1.3333
12
R² = 0.8168
10
6 Consumo
Linear (Consumo)
4
0
0 5 10 15
𝒚 = 𝒂 + 𝒃𝒙
CONSUMO=1.333+0.666(N° de habitaciones)
Coeficiente de determinación
R² = 0,816
El número de habitaciones explica en un 82% el consumo y el 18% explica otras variables que no
están en el modelo.
EJERCICIO 16
El señor James McWhinney, presidente de Daniel James Financial Servicies, considera que hay
una relación entre el número de contactos con sus clientes y la calidad de ventas en dólares. Para
documentar esta afirmación, el Señor McWhinney reunió la siguiente información muestral:
Ventas miles de
N° de contactos
dólares
(X)
(Y)
14 24
12 14
20 28
16 30
46 80
23 30
48 90
50 85
55 120
50 110
DIAGRAMA DE DISPERSIÓN
Ventas miles de dolares
(Y) y = 2.1946x - 12.201
140 R² = 0.9513
120
100 Ventas miles de
80 dolares
(Y)
60
Linear (Ventas miles de
40 dolares
20 (Y))
0
0 20 40 60
Si hay relación entre el número de contactos y las ventas, la relación es directa, al aumentar el
Número de contactos aumentan las ventas.
MODELO
𝒚 = 𝒂 + 𝒃𝒙
Hay una relación directa entre el número de contactos y las ventas realizadas. +
Si el número de contactos se incrementa en 1, las ventas se incrementan en 2.194 dólares.
Coeficiente de determinación
R² = 0,9513
El número de contactos explica en un 95% a las ventas y el 5% explican otras variables que no
están en el modelo. Sin embargo, este modelo si da un ajuste óptimo.
El valor de la variable y cuando x toma el valor de 40 en la ecuación obtenida es de 75.5846
EJERCICIO 17
En un artículo reciente en BusinessWeek se listan las BEST Small Companies. Nos interesan los
resultados actuales de las ventas e ingresos de las compañías. Se seleccionó una muestra de 12
empresas y a continuación se reportan sus ventas e ingresos, en millones de dólares:
VENTAS INGRESOS
compañía
X Y
Papa jones 89,2 4,9
Applied
18,6 4,4
innovation
intregracare 18,2 1,3
Wall data 71,7 8
Davidson &
58,6 6,6
associates
Chico’s FAS 46,8 4,1
Checkmate 17,5 2,6
Royal Grip 11,9 1,7
´M-Ware 19,6 3,5
Serving 51,2 8,2
Daig 28,6 6
Cobra Golf 69,2 12,8
DIAGRAMA DE DISPERSIÓN
INGRESOS Y
y = 0.0836x + 1.8517
14 R² = 0.4536
12
10
8 INGRESOS Y
6
Linear (INGRESOS
4 Y)
0
0 20 40 60 80 100
Si hay relación entre las ventas y los ingresos de las compañías, la relación es directa, al
aumentarlas ventas aumentan los ingresos de las compañías
MODELO
𝒚 = 𝒂 + 𝒃𝒙
Hay una relación directa entre los ingresos y las ventas de las compañías. +
Si las ventas se incrementan en 1, los ingresos se incrementan en 0.083 dólares.
Coeficiente de determinación
R² = 0,4536
Las ventas explica en un 45% a la variable de los ingresos y el 55% explican otras variables que
no están en el modelo. Este es un modelo no óptimo.
EJERCICIO 18
Se realiza un estudio de fondos mutualistas para fines de inversión en varios fondos. Para este
estudio en particular, desean enfocarse en los archivos y su desempeño a cinco años. La pregunta
es: ¿es posible determinar la tasa de rendimiento a cinco años con base en los activos del fondo? Se
seleccionaron nueve fondos mutualistas al azar, y sus activos y tasas de recuperación se muestran a
continuación:
activos rendimiento
FONDO
(X) %(Y)
aarp High Quality 622,2 10,8
Badson 160,4 11,3
Compass Capital Fixed Income 275,7 11,4
Galaxy Bond 433,2 9,1
Keystone 437,9 9,2
MFS bond 494,5 11,6
Nichols Income 158,3 9,5
T. Rowe 681 8,2
Thopson Income B 241,3 6,8
DIAGRAMA DE DISPERSIÓN
rendimiento %(Y)
14 y = -0.0004x + 9.9198
R² = 0.0021
12
10
8 rendimiento %(Y)
6
Linear (rendimiento
4 %(Y))
0
0 200 400 600 800
Hay relación indirecta entre los activos y el rendimiento de los fondos mutualistas, la relación es
indirecta, al aumentar los activos disminuye el rendimiento de los fondos mutualistas.
MODELO
𝒚 = 𝒂 − 𝒃𝒙
Hay una relación indirecta entre los activos y el rendimiento de los fondos mutualistas. -
Si los activos se incrementan en 1, el rendimiento disminuye en 0.04%.
Coeficiente de determinación
R² = 0,0021
Los activos explica en un 0.2% al rendimiento de los fondos mutualistas y el 99.8% explican
otras variables que no están en el modelo. Este es un modelo es casi nulo.
EJERCICIO 1.
Partiendo de la información:
X1 X2 Y
2 17 1
1 15 3
3 13 4
4 10 6
5 9 7
8 8 10
7 6 15
9 5 16
11 3 18
12 4 20
DIAGRAMA DE DISPERSIÓN
Y y X1
Y
24
20
16
12
Y
8
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13
Y y X2
Y
25
20
15
Y
10
0
0 3 6 9 12 15 18
MODELO:
Y=a+b1x1+b2x2
Conclusiones
Coeficiente de determinación
R2= 0,947
Las variables X1, y X2 explican en un 94% la variable Y y solamente 6% por otra variable que no
está en el modelo.
EJERCICIO 2
Se pretenden estimar los gastos en alimentación de una familia en base a la información que
proporcionan las variables regresoras: “Ingresos mensuales” y “número de miembros de la
familia”. Para ello se recoge una muestra aleatoria simple de 15 familias, cuyos resultados se
facilitan en la tabla adjunta. (El gasto e ingreso se expresan en cien mil dólares).
Desarrolle la ecuación de estimación que mejor describa los datos
Encuentre el coeficiente de determinación
INGRESOS TAMAÑO GASTOS
(x1) (x2) ALIMENTICIOS
2,1 3 0,43
1,1 4 0,31
0,9 5 0,32
1,6 4 0,46
6,2 4 1,25
2,3 3 0,44
1,8 6 0,52
1 5 0,29
8,9 3 1,29
2,4 2 0,35
1,2 4 0,35
4,7 3 0,78
3,5 2 0,43
2,9 3 0,47
1,4 4 0,38
DIAGRAMA DE DISPERSIÓN
1.4
1.2
GASTOS ALIMENTICIOS
0.8
0.6
GASTOS
0.4
ALIMENTICI
0.2 OS
0
0 2 4 6 8 10
INGRESOS
Si hay una relación directa entre los ingresos y los gatos alimenticios de las familias. Al aumentar
los ingresos, los gastos alimenticios también aumentan.
GASTOS ALIMENTICIOS Y TAMAÑO
1.5
1.2
GASTOS ALIMENTICIOS
0.9
GASTOS
0.6 ALIMENTICI
OS
0.3
0
0 1 2 3 4 5 6 7
TAMAÑO
Hay una relación directa entre el tamaño de la familia y los gatos alimenticios. Al aumentar el
tamaño de miembros de una familia, los gastos alimenticos aumentan.
MODELO:
Y=a+b1x1+b2x2
Conclusiones
Coeficiente de determinación
R2= 0,949
Las variables tamaño e ingresos explican en un 94% los gastos alimenticios y solamente 6% por
otra variable que no está en el modelo. Pero tiene un ajuste óptimo.
EJERCICIO 3.-
DIAGRAMA DE DISPERSIÓN
120
indicador global
80
Indicador global de
consumo
40
0
0 25 50 75 100 125
N° de automoviles
Si hay una relación directa entre el número de automóviles y su indicador global en cada
provincia. Al aumentar el número de automóviles, el indicador global también aumenta.
100
INDICADOR GLOBAL
80
60 Indicador global de
consumo
40
20
0
0 50 100 150 200
N° DE TELEFONOS
Hay una relación directa entre el número de teléfonos y el indicador global de cada provincia. Al
aumentar el número de teléfonos, el indicador global aumenta.
MODELO:
Y=a+b1x1+b2x2
Conclusiones
Coeficiente de determinación
R2= 0,851
Las variables número de automóviles y teléfonos por mil habitantes explican en un 85% el
indicador global y 15% por otra variable que no está en el modelo.
Pronóstico
Una empresa de desarrollo de Software establece relacionar sus Ventas en función del número de
pedidos de los tipos de software que desarrolla (Sistemas, Educativos y Automatizaciones
Empresariales), para atender 10 proyectos en el presente año.
DIAGRAMA DE DISPERSIÓN
Si hay una relación directa entre el número de automóviles y su indicador global en cada
provincia. Al aumentar el número de automóviles, el indicador global también aumenta.
520
510
500
490
VENTAS
480
470
VENTAS (Y)
460
450
440
430
0 50 100 150
N° pedidos aplicaciones
Hay una relación indirecta entre el número de pedidos de aplicaciones y las ventas. Al aumentar el
número de pedidos de aplicaciones, las ventas disminuyen y viceversa.
Hay una relación indirecta entre el número de pedidos de automatizaciones y las ventas. Al
aumentar el número de pedidos de automatizaciones, las ventas disminuyen y viceversa.
MODELO:
Y=a+b1x1+b2x2+b3x3
VENTAS= 934,808+ 0,68 (N° SISTEMAS) - 0,446 (N° APLICACIONES) – 6.25(N° AUTOMATIZACIÓN)
Conclusiones
Coeficiente de determinación
R2= 0,4497
Variables explicativas:
EJERCICIO 6
Una empresa dedicada a entrega de encomiendas. Para poder contar con mejores programas de
trabajo, se desea estimar el tiempo diario total que viajan sus operarios. Se han considerado dos
variables independientes que se cree que influyen en el tiempo diario total
MILLAS CANT. DE TIEMPO DE
RECORRIDO RECORRIDAS ENTREGAS RECORRIDO EN
(X1) (X2) HORAS (Y)
1 100 4 9,3
2 50 3 4,8
3 100 4 8,9
4 100 2 6,5
5 50 2 4,2
6 80 2 6,2
7 75 3 7,4
8 65 4 6
9 90 3 7,6
10 90 2 6,1
EJERCICIO 7
Cuentas
DIAGRAMA DE DISPERSIÓN
PRECIO Y HABITACIONES
PRECIO
90000
88000
86000
84000
82000
80000 PRECIO
78000
76000
74000
72000
0 1 2 3 4 5 6
PRECIO
90000
88000
86000
84000
82000
80000 PRECIO
78000
76000
74000
72000
0 0.5 1 1.5 2 2.5 3 3.5
Entre el recio y el número de baños parece que si hay una relación directa.
MODELO:
Y=a+b1x1+b2x2
Conclusiones
Manteniendo constante el número de baños. Un incremento en una habitación, el precio aumenta
en 4133 dólares, la relación entre las dos variables es directa +.
Coeficiente de determinación
R2=0.99