Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Regresión Lineal

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 23

REGRESIÓN LINEAL SIMPLE

EJERCICIO 13

Las siguientes observaciones muestrales se seleccionaron al azar.

X Y
4 4
5 6
3 5
6 7
10 7

DIAGRAMA DE DISPERSIÓN

8 Y
6

4
Y
2

0
0 2 4 6 8 10 12

Se observa que al aumentar los valores de x aumenta los valores de y.

y = 0.363x + 3.7671
8 Y R² = 0.5659

4
Y
2 Linear (Y)

0
0 2 4 6 8 10 12
MODELO:

Y=3.76+0.36X

Hay una relación directa entre la variable x y la variable y +


Si se incrementa en 1 unidad la variable x, la variable y se incrementa en 0.36

Coeficiente de determinación

R² = 0,565

La variable x explica 56% a la variable y, y un 44% por otra variable que no está en el modelo.

EJERCICIO 14

Las siguientes observaciones muestrales se seleccionaron al azar.

X Y
5 13
3 15
6 7
3 12
4 13
4 11
6 9
8 5

DIAGRAMA DE DISPERSIÓN
Y
16
14
12
10
8
Y
6
4
2
0
0 2 4 6 8 10

Y y = -1.7425x + 19.12
R² = 0.7935
16
14
12
10
8 Y

6 Linear (Y)

4
2
0
0 2 4 6 8 10

Si hay relación entre las variables X y Y, la relación es indirecta, al aumentar el X disminuye la


variable Y

MODELO

𝒚 = 𝒂 + 𝒃𝒙

Y=19.12 – 1.74 X

Hay una relación indirecta entre las variables X y Y. -


Si la variable X incrementa en 1, la variable Y disminuye en 1.74.

Coeficiente de determinación

R² = 0, 7935
La variable X explica en 79% a la variable Y. y un 21% se explica por otra variable que no está en
el modelo.

EJERCICIO 15

La Brandlord electric Ilumination Company estudia la relación entre kilowatts-hora (miles) usados
y el número de habitaciones en una residencia privada familiar. Una muestra aleatoria de 10 casas
mostro lo siguiente:


habitaciones Consumo
12 9
9 7
14 10
6 5
10 8
8 6
10 8
10 10
5 4
7 7

DIAGRAMA DE DISPERSIÓN

Consumo
y = 0.6667x + 1.3333
12
R² = 0.8168
10

6 Consumo
Linear (Consumo)
4

0
0 5 10 15

Si hay relación entre el número de habitaciones y el consumo de kW-h, la relación es directa, al


aumentar el N° de habitaciones aumenta el consumo.
MODELO

𝒚 = 𝒂 + 𝒃𝒙

CONSUMO=1.333+0.666(N° de habitaciones)

Hay una relación directa entre el número de habitaciones y el consumo. +


Si el número de habitaciones se incrementa en 1, el consumo se incrementa en 0.66 kW.

Coeficiente de determinación

R² = 0,816

El número de habitaciones explica en un 82% el consumo y el 18% explica otras variables que no
están en el modelo.

EJERCICIO 16

El señor James McWhinney, presidente de Daniel James Financial Servicies, considera que hay
una relación entre el número de contactos con sus clientes y la calidad de ventas en dólares. Para
documentar esta afirmación, el Señor McWhinney reunió la siguiente información muestral:

Ventas miles de
N° de contactos
dólares
(X)
(Y)
14 24
12 14
20 28
16 30
46 80
23 30
48 90
50 85
55 120
50 110

DIAGRAMA DE DISPERSIÓN
Ventas miles de dolares
(Y) y = 2.1946x - 12.201
140 R² = 0.9513
120
100 Ventas miles de
80 dolares
(Y)
60
Linear (Ventas miles de
40 dolares
20 (Y))

0
0 20 40 60

Si hay relación entre el número de contactos y las ventas, la relación es directa, al aumentar el
Número de contactos aumentan las ventas.

MODELO

𝒚 = 𝒂 + 𝒃𝒙

VENTAS= - 12.201+2.194(N° de contactos)

Hay una relación directa entre el número de contactos y las ventas realizadas. +
Si el número de contactos se incrementa en 1, las ventas se incrementan en 2.194 dólares.

Coeficiente de determinación

R² = 0,9513

El número de contactos explica en un 95% a las ventas y el 5% explican otras variables que no
están en el modelo. Sin embargo, este modelo si da un ajuste óptimo.
El valor de la variable y cuando x toma el valor de 40 en la ecuación obtenida es de 75.5846

EJERCICIO 17

En un artículo reciente en BusinessWeek se listan las BEST Small Companies. Nos interesan los
resultados actuales de las ventas e ingresos de las compañías. Se seleccionó una muestra de 12
empresas y a continuación se reportan sus ventas e ingresos, en millones de dólares:

VENTAS INGRESOS
compañía
X Y
Papa jones 89,2 4,9
Applied
18,6 4,4
innovation
intregracare 18,2 1,3
Wall data 71,7 8
Davidson &
58,6 6,6
associates
Chico’s FAS 46,8 4,1
Checkmate 17,5 2,6
Royal Grip 11,9 1,7
´M-Ware 19,6 3,5
Serving 51,2 8,2
Daig 28,6 6
Cobra Golf 69,2 12,8

DIAGRAMA DE DISPERSIÓN
INGRESOS Y
y = 0.0836x + 1.8517
14 R² = 0.4536
12

10

8 INGRESOS Y

6
Linear (INGRESOS
4 Y)

0
0 20 40 60 80 100

Si hay relación entre las ventas y los ingresos de las compañías, la relación es directa, al
aumentarlas ventas aumentan los ingresos de las compañías

MODELO

𝒚 = 𝒂 + 𝒃𝒙

INGRESOS= 1.85 +0.083(VENTAS)

Hay una relación directa entre los ingresos y las ventas de las compañías. +
Si las ventas se incrementan en 1, los ingresos se incrementan en 0.083 dólares.

Coeficiente de determinación

R² = 0,4536

Las ventas explica en un 45% a la variable de los ingresos y el 55% explican otras variables que
no están en el modelo. Este es un modelo no óptimo.

EJERCICIO 18

Se realiza un estudio de fondos mutualistas para fines de inversión en varios fondos. Para este
estudio en particular, desean enfocarse en los archivos y su desempeño a cinco años. La pregunta
es: ¿es posible determinar la tasa de rendimiento a cinco años con base en los activos del fondo? Se
seleccionaron nueve fondos mutualistas al azar, y sus activos y tasas de recuperación se muestran a
continuación:

activos rendimiento
FONDO
(X) %(Y)
aarp High Quality 622,2 10,8
Badson 160,4 11,3
Compass Capital Fixed Income 275,7 11,4
Galaxy Bond 433,2 9,1
Keystone 437,9 9,2
MFS bond 494,5 11,6
Nichols Income 158,3 9,5
T. Rowe 681 8,2
Thopson Income B 241,3 6,8

DIAGRAMA DE DISPERSIÓN

rendimiento %(Y)
14 y = -0.0004x + 9.9198
R² = 0.0021
12

10

8 rendimiento %(Y)

6
Linear (rendimiento
4 %(Y))

0
0 200 400 600 800

Hay relación indirecta entre los activos y el rendimiento de los fondos mutualistas, la relación es
indirecta, al aumentar los activos disminuye el rendimiento de los fondos mutualistas.

MODELO

𝒚 = 𝒂 − 𝒃𝒙

RENDIMIENTO= 9.91 – 0.0004 (ACTIVOS)

Hay una relación indirecta entre los activos y el rendimiento de los fondos mutualistas. -
Si los activos se incrementan en 1, el rendimiento disminuye en 0.04%.

Coeficiente de determinación

R² = 0,0021
Los activos explica en un 0.2% al rendimiento de los fondos mutualistas y el 99.8% explican
otras variables que no están en el modelo. Este es un modelo es casi nulo.

El valor de la variable y cuando x toma el valor de 400 en la ecuación obtenida es de 9,7625


REGRESIÓN LINEAL MÚLTIPLE

EJERCICIO 1.

Partiendo de la información:

X1 X2 Y
2 17 1
1 15 3
3 13 4
4 10 6
5 9 7
8 8 10
7 6 15
9 5 16
11 3 18
12 4 20

1. Desarrollo la ecuación de estimación que mejor describa los datos


2. Encuentre el coeficiente de determinación

DIAGRAMA DE DISPERSIÓN

Y y X1

Y
24

20

16

12
Y
8

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13

Si hay una relación directa entre la variable X1 y la variable Y. Al aumentar la variable X1 la


variable Y aumenta.

Y y X2
Y
25

20

15

Y
10

0
0 3 6 9 12 15 18

Si hay una relación indirecta entre la variable X2 y la variable Y. Al aumentar la variable X2 la


variable Y disminuye y viceversa.

MODELO:

Y=a+b1x1+b2x2

Y= 10,318+ 0,925 (X1) - 0,673 (X2)

Conclusiones

Manteniendo constante X2. Un incremento en 1 unidad en X1, la variable Y aumenta en 0.925, la


relación entre las dos variables es directa +.

Manteniendo constante X1. Un incremento en 1 unidad en X2, la variable Y disminuye en 0.673,


la relación entre las dos variables es indirecta -.

Coeficiente de determinación

R2= 0,947

Las variables X1, y X2 explican en un 94% la variable Y y solamente 6% por otra variable que no
está en el modelo.

EJERCICIO 2

Se pretenden estimar los gastos en alimentación de una familia en base a la información que
proporcionan las variables regresoras: “Ingresos mensuales” y “número de miembros de la
familia”. Para ello se recoge una muestra aleatoria simple de 15 familias, cuyos resultados se
facilitan en la tabla adjunta. (El gasto e ingreso se expresan en cien mil dólares).
Desarrolle la ecuación de estimación que mejor describa los datos
Encuentre el coeficiente de determinación
INGRESOS TAMAÑO GASTOS
(x1) (x2) ALIMENTICIOS

2,1 3 0,43
1,1 4 0,31
0,9 5 0,32
1,6 4 0,46
6,2 4 1,25
2,3 3 0,44
1,8 6 0,52
1 5 0,29
8,9 3 1,29
2,4 2 0,35
1,2 4 0,35
4,7 3 0,78
3,5 2 0,43
2,9 3 0,47
1,4 4 0,38

DIAGRAMA DE DISPERSIÓN

GASTOS ALIMENTICIOS E INGRESOS

1.4

1.2
GASTOS ALIMENTICIOS

0.8

0.6
GASTOS
0.4
ALIMENTICI
0.2 OS

0
0 2 4 6 8 10
INGRESOS

Si hay una relación directa entre los ingresos y los gatos alimenticios de las familias. Al aumentar
los ingresos, los gastos alimenticios también aumentan.
GASTOS ALIMENTICIOS Y TAMAÑO

1.5

1.2
GASTOS ALIMENTICIOS

0.9

GASTOS
0.6 ALIMENTICI
OS
0.3

0
0 1 2 3 4 5 6 7
TAMAÑO

Hay una relación directa entre el tamaño de la familia y los gatos alimenticios. Al aumentar el
tamaño de miembros de una familia, los gastos alimenticos aumentan.

MODELO:

Y=a+b1x1+b2x2

GASTOS ALIMENTICIOS= -0.16+ 0,148 (INGRESOS) + 0,076 (TAMAÑO)

Conclusiones

Manteniendo constante tamaño de la familia. Un incremento en 1 unidad en los ingresos, los


gastos alimenticios aumentan en 0.148, la relación entre las dos variables es directa +.

Manteniendo constante ingresos. Un incremento en 1 unidad en el tamaño de la familia, los gastos


alimenticios aumentan en 0.076, la relación entre las dos variables es directa +.

Coeficiente de determinación

R2= 0,949

Las variables tamaño e ingresos explican en un 94% los gastos alimenticios y solamente 6% por
otra variable que no está en el modelo. Pero tiene un ajuste óptimo.

EJERCICIO 3.-

En la tabla adjunta se presenta un indicador provincia global de consumo (Y) el número de


automóviles por mil habitantes (X1) y el número de teléfonos por mil habitante (X2) en ocho
provincias ecuatorianas.
1. Dibuje un diagrama de dispersión y=f ((para cada X)
2. Desarrolle la ecuación de estimación que mejor describa los datos
3. Encuentre el coeficiente de determinación
4. Interprete los estadísticos encontrados. (Realice las conclusiones)
5. Para el ejercicio pronostique el consumo si el número de automóviles es 100 y el número
de teléfonos 150

Número de automóviles Número de teléfonos por mil Indicador global de


por mil hab. habitantes consumo
58 111 64
84 131 78
78 158 83
81 147 88
82 121 89
102 165 99
85 174 101
102 169 102

DIAGRAMA DE DISPERSIÓN

INDICADOR GLOBAL Y N° DE AUTOMÓVILES

120
indicador global

80

Indicador global de
consumo
40

0
0 25 50 75 100 125

N° de automoviles

Si hay una relación directa entre el número de automóviles y su indicador global en cada
provincia. Al aumentar el número de automóviles, el indicador global también aumenta.

INDICADOR GLOBAL Y N° DE TELÉFONOS


120

100

INDICADOR GLOBAL
80

60 Indicador global de
consumo
40

20

0
0 50 100 150 200
N° DE TELEFONOS

Hay una relación directa entre el número de teléfonos y el indicador global de cada provincia. Al
aumentar el número de teléfonos, el indicador global aumenta.

MODELO:

Y=a+b1x1+b2x2

INDICADOR GLOBAL= 0,851+ 0,520 (N° DE AUTOMÓVILES) + 0,239 (N° TELÉFONOS)

Conclusiones

Manteniendo constante el número de teléfonos. Un incremento en 1 unidad en el número de


automóviles, el indicador global aumentan en 0.52, la relación entre las dos variables es directa
+.

Manteniendo constante el número de automóviles. Un incremento en 1 unidad en el número de


teléfonos, el indicador global aumentan en 0.239, la relación entre las dos variables es directa +.

Coeficiente de determinación

R2= 0,851

Las variables número de automóviles y teléfonos por mil habitantes explican en un 85% el
indicador global y 15% por otra variable que no está en el modelo.

Pronóstico

Si el número de automóviles es 100 y el número de teléfonos 150. Se obtiene un indicador global


de 88.701.
EJERCICIO 4

Una empresa de desarrollo de Software establece relacionar sus Ventas en función del número de
pedidos de los tipos de software que desarrolla (Sistemas, Educativos y Automatizaciones
Empresariales), para atender 10 proyectos en el presente año.

En la tabla representa Y (Ventas miles de S. /) e X (N.- pedidos de sistemas), W(N.- de pedidos de


Aplicaciones Educativas) y Z (N.- de pedidos de Automatizaciones empresariales).

N° pedidos de N° pedidos N° pedidos


VENTAS (Y)
sistemas (X) aplicaciones (W) automatizaciones (Z)
50 105 75 440
40 140 68 455
35 110 70 470
45 130 64 510
51 125 67 506
55 115 72 480
53 100 70 460
48 103 73 500
38 118 69 490
44 98 74 450

1. Dibuje un diagrama de dispersión y=f(para cada X)


2. Desarrolle la ecuación de estimación que mejor describa los datos
3. Encuentre el coeficiente de determinación
4. Interprete los estadísticos encontrados (Realice las conclusiones)
5. Para el ejercicio pronostique sus Ventas en función del número de pedidos de los tipos de
software que desarrolla (Sistemas=50, Educativos=100 y Automatizaciones
Empresariales=80)

DIAGRAMA DE DISPERSIÓN

VENTAS Y N° PEDIDOS DEL SISTEMA


520
510
500
490
VENTAS 480
470
VENTAS (Y)
460
450
440
430
0 20 40 60
N° PEDIDOS DE SISTEMAS

Si hay una relación directa entre el número de automóviles y su indicador global en cada
provincia. Al aumentar el número de automóviles, el indicador global también aumenta.

VENTAS Y N° PEDIDOS DE APLICACIONES

520
510
500
490
VENTAS

480
470
VENTAS (Y)
460
450
440
430
0 50 100 150
N° pedidos aplicaciones

Hay una relación indirecta entre el número de pedidos de aplicaciones y las ventas. Al aumentar el
número de pedidos de aplicaciones, las ventas disminuyen y viceversa.

VENTAS Y N° PEDIDOS DE AUTOMATIZACIONES


520
510
500
VENTAS 490
480
470 VENTAS (Y)
460
450
440
430
60 65 70 75 80
N° PEDIDOS AUTOMATIZACIONES

Hay una relación indirecta entre el número de pedidos de automatizaciones y las ventas. Al
aumentar el número de pedidos de automatizaciones, las ventas disminuyen y viceversa.

MODELO:

Y=a+b1x1+b2x2+b3x3

VENTAS= 934,808+ 0,68 (N° SISTEMAS) - 0,446 (N° APLICACIONES) – 6.25(N° AUTOMATIZACIÓN)

Conclusiones

Manteniendo constante el número de pedidos de automatización y el número de aplicaciones. Un


incremento en 1 unidad en el número de pedidos de sistemas, las ventas aumentan en 0.68, la
relación entre las dos variables es directa +.

Manteniendo constante el número de pedidos de automatización y el número de pedido de


sistemas. Un incremento en 1 unidad en el número de pedidos de aplicaciones, las ventas
disminuyen en 0.446, la relación entre las dos variables es indirecta - .

Manteniendo constante el número de pedidos de aplicaciones y el número de pedido de sistemas.


Un incremento en 1 unidad en el número de pedidos de automatización, las ventas disminuyen en
6.25, la relación entre las dos variables es indirecta - .

Coeficiente de determinación

R2= 0,4497

Las variables número de pedidos de automatización, el número de aplicaciones y el número de


pedido de sistemas explican en un 45% las ventas y 55% por otra variable que no está en el
modelo. Este ajuste es no optimo se requieren de más variables para para mejor la determinación.
EJERCICIO 5

Respuesta Y= Temperatura (en Fahrenheit) máxima promedio durante el mes de enero en la


estación meteorológica de un condado de Texas

Variables explicativas:

X1=Latitud, X2=Altitud (en pies) y X3= Longitud de la estación.

LATITUD ALTITUD LONGITUD TEMPERATURA


(x1) (x2) (x3)
29,767 41 95,367 56
32,85 440 90,25 48
26,933 25 97,8 60
31,95 2451 102,283 46
34,8 3840 102,467 38
33,45 1461 99,633 66
28,7 815 100,483 53
32,45 2380 100,533 46
31,8 3918 106,4 44
34,85 2040 100,217 41
30,867 3000 102,9 47
36,35 3693 102,083 36
30,3 597 97,7 52
26,9 313 99,283 60
28,45 459 99,217 56
25,9 19 97,433 62

1. Dibuje un diagrama de dispersión y=f (para cada X)


2. Desarrolle la ecuación de estimación que mejor describa los datos
3. Encuentre el coeficiente de determinación
4. Interprete los estadísticos encontrados (Realice las conclusiones)
5. Para el ejercicio pronostique la temperatura X1= Latitud=30, X2=Altitud=2000 y
X3=Longitud de la estación= 100.

EJERCICIO 6

Una empresa dedicada a entrega de encomiendas. Para poder contar con mejores programas de
trabajo, se desea estimar el tiempo diario total que viajan sus operarios. Se han considerado dos
variables independientes que se cree que influyen en el tiempo diario total
MILLAS CANT. DE TIEMPO DE
RECORRIDO RECORRIDAS ENTREGAS RECORRIDO EN
(X1) (X2) HORAS (Y)
1 100 4 9,3
2 50 3 4,8
3 100 4 8,9
4 100 2 6,5
5 50 2 4,2
6 80 2 6,2
7 75 3 7,4
8 65 4 6
9 90 3 7,6
10 90 2 6,1

1. Dibuje un diagrama de dispersión y=f(para cada X)


2. Desarrolle la ecuación de estimación que mejor describa los datos
3. Encuentre el coeficiente de determinación
4. Interprete los estadísticos encontrados (Realice las conclusiones)
5. Para el ejercicio pronostique el tiempo si recorre 85 millas y la cantidad de entregas es

EJERCICIO 7

Cuentas

HABITACIONES BAÑOS PRECIO


3 2 78800
2 1 74300
4 3 83800
2 1 74200
3 2 79700
2 2 74900
5 3 88400
4 2 82900

DIAGRAMA DE DISPERSIÓN
PRECIO Y HABITACIONES

PRECIO
90000
88000
86000
84000
82000
80000 PRECIO
78000
76000
74000
72000
0 1 2 3 4 5 6

Si hay una relación directa entre el número de habitaciones y el precio.

PRECIO Y NÚMERO DE BAÑOS

PRECIO
90000
88000
86000
84000
82000
80000 PRECIO
78000
76000
74000
72000
0 0.5 1 1.5 2 2.5 3 3.5

Entre el recio y el número de baños parece que si hay una relación directa.

MODELO:

Y=a+b1x1+b2x2

Precio=65192.6+4133.3 (N° de habitaciones) +758.3 (N° baños)

Conclusiones
Manteniendo constante el número de baños. Un incremento en una habitación, el precio aumenta
en 4133 dólares, la relación entre las dos variables es directa +.

Manteniendo constante el número de habitaciones, un incremento en un baño, el precio aumenta


en 748 dólares, la relación es directa entre las dos variables

Coeficiente de determinación

R2=0.99

Las variables número de habitaciones, y numero de baños explican en un 99


% el precio de las casas y solamente 1% por otra variable que no está en el modelo.

También podría gustarte