Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
0% encontró este documento útil (0 votos)
56 vistas12 páginas

Regresion Lineal

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1/ 12

REGRESIÓN LINEAL

MARIA MÓNICA MONTOYA SANDOVAL


HECTOR MAURICIO RUEDA
ORLANDO LOPEZ LEMON
DANIEL MARTINEZ MORALES

PROFESOR
DEIVIS JESUS RODRIGEZ
ING

UNIVERSIDAD DEL ATLANTICO – UA


ESTADISTICA II
BARRANQUILLA – COLOMBIA
26/02/2021
1. A continuación, se muestra los datos de la producción de trigo en toneladas
y el precio del kilo de harina en pesos.
Producción de trigo: 30 28 32 25 25 25 22 24 35 40
Precio de la harina: 25 30 27 40 42 40 50 45 30 25
a. Identificando la variable dependiente e independiente, a partir de los
datos muestre un modelo de regresión lineal simple.

Nuestra variable independiente será la producción de trigo (X) ya que esta es la que
Afecta directamente a nuestra variable dependiente el cual será el precio de la harina
El cual dependerá de los valores de nuestra producción de trigo.

Producción de trigo Precio de la harina


30 25
28 30
32 27
25 40
25
Pendiente 42
-1,353675451
25 40
Intersección
22 74,11511789
50
24 45
Coeficiente de R -0,8471402
35 30
40
Coeficiente de 25
0,717646518
determinación

Precio de la harina
60

50

40 f(x) = − 1.35 x + 74.12


R² = 0.72
30

20

10

0
20 25 30 35 40 45
b. Determine el coeficiente de correlación. ¿Qué se puede afirmar con
esta constante?

El coeficiente de correlación es de -0,8471402 nos indica que hay una


correlación negativa, lo que significa que cuando una de nuestras
muestras variable crece se encuentra en decrecimiento, en nuestro caso
vemos que nuestra variable X (producción de trigo) esta decrecimiento
mientras que nuestra variable Y (Precio de la harina) está creciendo.

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple -0,8471402
Coeficiente de determinación R^2 0,717646518
R^2 ajustado 0,682352333
Error típico 5,098101412
Observaciones 10

c. Determine los errores relativos.

Observación Pronóstico para Y Residuos Residuos estándares


1 33,50485437 -8,504854369 -1,76943524
2 36,21220527 -6,21220527 -1,292449517
3 30,79750347 -3,797503467 -0,790070725
4 40,27323162 -0,273231623 -0,056845848
5 40,27323162 1,726768377 0,35925422
6 40,27323162 -0,273231623 -0,056845848
7 44,33425798 5,665742025 1,178757821
8 41,62690707 3,373092926 0,701772098
9 26,73647712 3,263522885 0,678976047
10 19,96809986 5,031900139 1,046886995
d. Muestre la tabla ANOVA.

Análisis de la varianza ANOVA

Promedio de los Valor


  Grados de libertad Suma de cuadrados Errores cuadrados F crítico de F
20,3332790
Regresión 1 528,474896 528,474896 8 0,00197779
Errores 8 207,925104 25,990638
Total 9 736,4      

Inferior Superior Inferior Superior


  Coeficientes Error típicoEstadístico t Probabilidad 95% 95% 95,0% 95,0%
Intercepció 74,1151178 8,48409527 53,970392 94,259843 53,970392 94,259843
n 9 8,735771523 4 2,85402E-05 6 1 6 1
Variable X 1 - 0,300200107 - 0,001977787 - - - -
1,35367545 4,50924373 2,0459381 0,6614127 2,0459381 0,6614127
1 7 4 6 4 6

2. A continuación, se relaciona un conjunto de variables (precio en dólares,


número de habitaciones, pies cuadrados, número de pisos) de algunas
viviendas.

Precio Habitacion Bañ Pies Pis


es os Cuadrados os
221900 3 1 1180 1
538000 3 2 2570 2
180000 2 1 770 1
604000 4 3 1960 1
510000 3 2 1680 1
1230000 4 5 5420 1
257500 3 2 1715 2
291850 3 2 1060 1
229500 3 1 1780 1
323000 3 2 1890 2
662500 3 3 3560 1
468000 2 1 1160 1
310000 3 1 1430 1,5
400000 3 2 1370 1
530000 5 2 1810 1,5
650000 4 3 2950 2
395000 3 2 1890 2
485000 4 1 1600 1,5
189000 2 1 1200 1
230000 3 1 1250 1
385000 4 2 1620 1
2000000 3 3 3050 1
285000 5 3 2270 2
252700 2 2 1070 1
329000 3 2 2450 2
233000 3 2 1710 1,5
937000 3 2 2450 2
667000 3 1 1400 1,5
438000 3 2 1520 1
719000 4 3 2570 2
580500 3 3 2320 2
280000 2 2 1190 3
687500 4 2 2330 1,5
535000 3 1 1090 1,5
322500 4 3 2060 1
696000 3 3 2300 1,5
550000 4 1 1660 1
640000 4 2 2360 2
240000 4 1 1220 1
605000 4 2 2620 2
625000 4 3 2570 2
775000 4 2 4220 1
861990 5 3 3595 2
685000 3 1 1570 2
309000 3 1 1280 1
488000 3 3 3160 2
210490 3 1 990 1
785000 4 3 2290 2
450000 3 2 1250 1
a. Ajustar un modelo de regresión lineal múltiple, donde explique el precio del
inmueble con respecto al resto de variables.
El modelo encontrado con el complemento de análisis de datos de Excel fue:
Precio=−18626.0945∗¿ Habitaciones+32202.0631∗¿ Baños+211.889∗¿ piescuadrados−44720.2698∗¿ piso
El coeficiente de determinación dio 0.4334 es decir que cerca del 43% del
comportamiento es explicado por el modelo encontrado, además el coeficiente de
correlación es 0.65911 lo que evidencia una correlación entre los datos

A continuación, se muestra el informe generado por el software Excel.


Resumen

Estadísticas de la regresión
Coeficiente de
correlación 0,6591144
múltiple 8
Coeficiente de
determinación
R^2 0,4344319
0,3830166
R^2 ajustado 2
244781,72
Error típico 8
Observaciones 49

ANÁLISIS DE
VARIANZA
Promedio
Grados de Suma de de los Valor crítico
  libertad cuadrados cuadrados F de F
2,0251E+1 5,0628E+1
Regresión 4 2 1 8,44947046 3,78642E-05
2,6364E+1 5,9918E+1
Residuos 44 2 0
4,6615E+1
Total 48 2      

Estadístico Probabilida Superior Inferior Superior


  Coeficientes Error típico t d Inferior 95% 95% 95,0% 95,0%
- -
181420,15 0,8423428 212810,321 518446,269 212810,32 518446,269
Intercepción 152817,974 4 7 0,40415154 9 3 2 3
- -
53764,149 126977,617 89731,4281 126977,61 89731,4281
Habitaciones -18623,0945 1 -0,346385 0,73070442 3 9 7 9
- -
63402,565 0,5078984 95577,4115 159981,537 95577,411 159981,537
Baños 32202,0631 5 2 0,61406139 7 7 6 7
62,860157 3,3708052 85,2030276 338,575675 85,203027 338,575675
Pies Cuadrados 211,889352 9 7 0,00156946 6 6 7 6
Pisos -44720,2698 72203,831 - 0,5388723 - 100796,990 -190237,53 100796,990
0,6193614 190237,529
1 5 7 1 1

b. ¿El modelo es significativo? Explique. Determine R2 ajustado.

El modelo puede considerarse significativo ya que el valor asociado a la


probabilidad dio inferior al 5% con un valor de 0.0037864 %, por lo que
podemos asumir que el modelo es significativo según análisis ANOVA

El coeficiente de determinación ajustado es 0.383. aunque el coeficiente de


determinación ajustado es cerca del 38%, este parámetro no indica que el
modelo debe ser desechado, sino que las variables independientes presentan
una explicación del 38.3% en el comportamiento del precio.

c. Indique cuál de las variables tiene mayor correlación con los precios de las
viviendas.
La variable que presenta una mayor correlación con el precio es el número
de pies cuadrados con un factor de correlación igual a 0.6524, es decir cerca
del 65%.
Habitacione
  Precio s Baños Pies Cuadrados Pisos
Precio 1
0,2715344
Habitaciones 4 1
0,5288710
Baños 3 0,40275931 1
0,6524198
Pies Cuadrados 4 0,46872326 0,76600756 1
0,0624538
Pisos 9 0,13773437 0,236803019 0,193382629 1

Para futuros estudios se recomienda eliminar la variable número de pisos del


estudio, debido a su pequeño coeficiente de correlación con la variable dependiente

d. Represente los gráficos de dispersión del variable precio con respecto a cada
una de las variables independientes y genere una breve explicación de cada
uno de ellos.
Habitaciones vs Precio
2500000

2000000

1500000

1000000

500000

0
1.5 2 2.5 3 3.5 4 4.5 5 5.5

Como se puede observar en este grafico podemos concluir que el precio


siempre va a depender del número de habitaciones, ya que al haber más el
precio será más alto.

Baños Vs Precio
2500000

2000000

1500000

1000000

500000

0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5

En este otro seguimos observando el mismo comportamiento dependiente


de la variable precio que se ubica en el eje Y, ya que a mayor número de
baños el precio de los apartamentos sube.
Pies cuadrados Vs Precio
2500000

2000000

1500000

1000000

500000

0
0 1000 2000 3000 4000 5000 6000

Esta es quizás la respuesta más obvia ya que como todos sabemos el precio
de un apartamento siempre va a depender de lo grande que este sea, y
queda evidenciado en el grafico anterior.

Pisos Vs Precio
2500000

2000000

1500000

1000000

500000

0
0.5 1 1.5 2 2.5 3 3.5

En este último grafico se observa que la dependencia del precio con


respecto a los pisos no es tan significativa, es decir, es mayor pero no
exageradamente

e. Ajustar un modelo de regresión lineal múltiple, donde explique los pies


cuadrados del inmueble con respecto al resto de variables.
El modelo que se obtuvo fue:
¿ Pie s2=0.000968∗precio+202.74593∗Habitaciones+534.9806∗Baños+49.231098∗Pisos+ 318.5410
El coeficiente de determinación dio 0.6959 es decir que cerca del 70% del
comportamiento es explicado por el modelo encontrado, además el coeficiente
de correlación es 0.8342 lo que evidencia una fuerte correlación entre los datos

Resumen

Estadísticas de la regresión
Coeficiente de
correlación
múltiple 0,83422934
Coeficiente de
determinación R^2 0,69593859

R^2 ajustado 0,66829664

Error típico 523,354975

Observaciones 49

ANÁLISIS DE
VARIANZA
Promedio
Grados de Suma de de los Valor crítico
  libertad cuadrados cuadrados F de F
27583857,
Regresión 4 6 6895964,41 25,1769025 6,8805E-11
12051618,
Residuos 44 9 273900,43
39635476,
Total 48 5      

Coeficiente Estadístico Probabilida Superior Inferior Superior


  s Error típico t d Inferior 95% 95% 95,0% 95,0%
- -
- - 1100,58372 1100,5837
Intercepción 318,541033 388,03973 0,82089799 0,41612993 3 463,5016569 2 463,5016569
0,0002873 0,00038948 0,0003894
Precio 0,0009686 5 3,37080527 0,00156946 4 0,001547713 8 0,001547713
-
20,9088419
Habitaciones 202,74593 110,97468 1,82695665 0,07449439 6 426,400702 -20,908842 426,400702
109,44852 314,401647 314,40164
Baños 534,980658 6 4,88796585 1,3947E-05 4 755,5596685 7 755,5596685

Pisos 49,2310981 154,86897 0,31788871 0,75207319 - 361,3490095 - 361,3490095


262,886813 262,88681
5 3 3

f. ¿El modelo del ítem e. es significativo? Explique. Determine R2 ajustado.

El modelo puede considerarse significativo ya que el valor asociado a la


probabilidad dio inferior al 5% con un valor de 0.00000000688%, por lo que
podemos asumir que el modelo es significativo según análisis ANOVA

El coeficiente de determinación ajustado es 0.668, por lo cual podemos


afirmar que el modelo tiene un alto grado de explicación del comportamiento
en el variable dependiente.

g. Teniendo en cuenta el modelo del ítem e, ¿Puede eliminarse alguna variable


del modelo? Realiza los contrastes de significación individuales.
Para resolver esta duda se presenta a continuación la siguiente de
correlación.
Pies Habitacione
  Cuadrados Precio s Baños Pisos
Pies
Cuadrados 1
Precio 0,65241984 1
Habitacione 0,2715344
s 0,468723264 4 1
0,5288710
Baños 0,76600756 3 0,40275931 1
0,0624538
Pisos 0,193382629 9 0,13773437 0,236803019 1

Como se puede evidenciar la variable que presenta mayor correlación con la


variable de salida (Pies cuadrados) es número de baños con un factor de correlación
equivalente a 0.766, le sigue la variable precio con un factor de correlación 0.6524
después esta la variable número de habitaciones con un factor de correlación
equivalente a 0.468, por ultimo esta la variable pisos la cual presenta un coeficiente
de correlación de 0.1933.

En este orden de ideas podría ser eliminada la variable número de pisos del estudio,
debido a que presenta el menor coeficiente de correlación.

También podría gustarte