Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Estadistica - Tarea S6

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 9

Regresión Lineal

CARLOS BUGUEÑO ROJO

Instituto IACC

23/07/2018
Desarrollo.

Le han solicitado elaborar un estudio de desempeño laboral en la empresa Luz Ltda. con

el fin de observar la incidencia y determinar si es relevante que un empleado realice

actividades personales en su horario de trabajo. Es por esto que se tomó como

referencia el tiempo en horas que un empleado navega en internet en su puesto

durante la semana hábil y verificar si existe relación entre el consumo de internet y las

siguientes variables: edad, antigüedad laboral, sueldo mensual que percibe y su

escolaridad, además de si el sexo del funcionario incide en este comportamiento de

actividades no laborales en su lugar de trabajo.

De acuerdo con los datos entregados:

a) Realice un gráfico de dispersión e indique el tipo de relación entre las

variables edad del trabajador y horas conectadas a internet.

R ela c io n en t r e las Variab les ed ad d el t ra b aj ad o r y la s h o ra s c o n ec t a d as a


in t ern et
25
20
15 f(x) = − 0.35 x + 27.39
HORAS

R² = 0.75
10
5
0
20 25 30 35 40 45 50 55 60 65
EDAD AÑOS

Horas conectado a Internet (semanal)


Linear (Horas conectado a Internet (semanal))

Al analizar las variables X e Y, de manera visual en el diagrama de dispersión, se observa

en el eje horizontal los años de edad y el eje vertical la variable de las horas conectadas
a internet, corroborando que si existe correlación entre ambas variables, existiendo una

tendencia hacia abajo, siendo esta negativa y la fuerza o intensidad de se determina

como fuerte.

b) Con respecto a las mismas variables de la letra a), construya un modelo de regresión

e interprete el valor de la pendiente.

MODELO DE REGRESIÓN
25
f(x)
f(x) == 46.39 exp(
− 15.01 − 0.03
ln(x) x)
+ 68.69
20 R²
R² ===0.73
f(x) 0.74
− 0.35 x + 27.39
15 R² = 0.75
HORAS

10

5
Linear ()
0 Exponential ()
20 25 30 35 40 45 50 55 Linear ()60 65
EDAD AÑOS Logarithmic ()

El tipo de relación que existe es negativa, por lo que a medida que aumenta la edad,

disminuye las horas en internet.

Por lo tanto posee una pendiente negativa.

Siendo 𝑏=𝑆_𝑥𝑦/(𝑆_𝑥^2 )= −0,3488


𝑎=𝑌−𝑏∗𝑋=27,39
El modelo de regresión seria:
y = -0,3488 x + 27,39
𝐡𝐨𝐫𝐚𝐬 𝐜𝐨𝐧𝐞𝐜𝐭𝐚𝐝𝐨 𝐚 𝐢𝐧𝐭𝐞𝐫𝐧𝐞𝐭= −0,3488 (𝐞𝐝𝐚𝐝)+ 27,39
c) Estime el número de horas que un trabajador está conectado a internet, si tiene 62

años.

𝐡𝐨𝐫𝐚𝐬 𝐜𝐨𝐧𝐞𝐜𝐭𝐚𝐝𝐨 𝐚 𝐢𝐧𝐭𝐞𝐫𝐧𝐞𝐭= −0,3488(𝐞𝐝𝐚𝐝)+ 27,39


Siendo la edad del trabajador 62 años

𝐡𝐨𝐫𝐚𝐬 𝐜𝐨𝐧𝐞𝐜𝐭𝐚𝐝𝐨 𝐚 𝐢𝐧𝐭𝐞𝐫𝐧𝐞𝐭= −0,3488 ∗(𝟔𝟐)+ 27,39

𝐡𝐨𝐫𝐚𝐬 𝐜𝐨𝐧𝐞𝐜𝐭𝐚𝐝𝐨 𝐚 𝐢𝐧𝐭𝐞𝐫𝐧𝐞𝐭=5,7644

Se estima que un trabajador que tiene 62 años de edad pasa aproximadamente 5,8

horas en internet.

d) Si un trabajador está conectado 18 horas a internet, ¿qué edad se puede estimar que

tiene el trabajador?

𝐡𝐨𝐫𝐚𝐬 𝐜𝐨𝐧𝐞𝐜𝐭𝐚𝐝𝐨 𝐚 𝐢𝐧𝐭𝐞𝐫𝐧𝐞𝐭= −0,3488(𝐞𝐝𝐚𝐝)+ 27,39

Siendo que el trabajador pasa 18 horas en internet

𝐡𝐨𝐫𝐚𝐬 𝐜𝐨𝐧𝐞𝐜𝐭𝐚𝐝𝐨 𝐚 𝐢𝐧𝐭𝐞𝐫𝐧𝐞𝐭= −0,3488(𝐞𝐝𝐚𝐝)+ 27,39


𝟏𝟖= −0,3488(𝐞𝐝𝐚𝐝)+ 27,39
𝒆𝒅𝒂𝒅:(18−27,39)/(−0,3488)=26,9208716

Se estima que un trabajador que pasa 18 horas en internet tendría una edad

aproximada de 27 años.
Resumen

Estadísticas de la regresión
Coeficiente de
correlación
múltiple 0,866131075
Coeficiente de
determinación R^2 0,750183039
R^2 ajustado 0,749344727
Error típico 1,166916984

Observaciones 300

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crítico
  libertad cuadrados cuadrados F de F
Regresión 1 1218,544816 1218,544816 894,87337 9,377E-92
Residuos 298 405,785184 1,361695248

Total 299 1624,33      

Probabilida Superior Inferior Superior


  Coeficientes Error típico Estadístico t d Inferior 95% 95% 95,0% 95,0%
Intercepción 27,39032965 0,541086305 50,62099964 2,172E-148 26,325495 28,455164 26,3255 28,455164

Edad (años) -0,348758516 0,011658536 -29,91443414 9,3771E-92 -0,371702 -0,325815 -0,371702 -0,325815
e) Desde la gerencia se requiere establecer un modelo de regresión para las variables:

sueldo mensual y antigüedad de los trabajadores, para realizar estimaciones respecto a

esas variables.
Entonces:

e.1) Construya el modelo lineal y exponencial.

MODELO LINEAL
1600
1400
1200
1000 f(x) = 77.47 x + 48.67
R² = 0.77
SUELDOS

800 Linear ()

600 Linear ()
400
200
0
0 2 4 6 8 10 12 14 16
ANTIGÜEDAD LABORAL
MODELO EXPONENCIAL
1600
1400
1200
f(x) = 274.45 exp( 0.11 x )
1000 R² = 0.81
SUELDOS

800
600
400
200
0
0 2 4 6 8 10 12 14 16
ANTIGÜEDAD LABORAL

e.2) Estime qué modelo se ajusta mejor a los datos. Justifique su respuesta.

De acuerdo a los modelos planteados, el modelo exponencial es más confiable, porque

se ajusta mejor a los datos, ya que su coeficiente de determinación es mayor (0,8053 o

80,53%), por lo que las estimaciones serán más confiables.

REA Semana 6

ESTADÍSTICA
e.3) Utilizando el modelo más adecuado, determine el sueldo mensual de un trabajador,

si lleva 15 años en la empresa.

Utilizando el modelo más adecuado, determine el sueldo mensual de un trabajador, si lleva 15 años en la
empresa

Años promedio 9,536666667 b 77,47304254


Sueldo promedio 787,5046667 a 48,67008434
Covarianza 346,7168289
Varianza años 4,475322222 Antigüedad 15 años

Sueldo para un trabajador con 15 años de


antigüedad laboral 1210,765722 miles de $

e.4) Utilizando el mismo modelo anterior estime la antigüedad de un trabajador, con un

sueldo mensual de $750.000.

Utilizando el mismo modelo anterior estime la antigüedad de un


trabajador, con un sueldo mensual de $750.000

Sueldo 750 miles de $

La antigüedad laboral de un
trabajador con un sueldo mensual años
de $750.000, es de 9,052567096 aproximadamente

Bibliografía

 IACC (2018). Estadística. Regresión Lineal. Semana 6.

También podría gustarte