Proyecto Final
Proyecto Final
Proyecto Final
Autores:
Chacon Montero Eva; Cañarte Panezo Carlos; Mata Pilco Jeferson; Rumipamba Guacho Miguel;
Calderón Rodas Bryan.
Escuela Superior Politécnica del Litoral
emchacon@espol.edu.ec; ccanarte@espol.edu.ec; Jdmata@espol.edu.ec; mrumipam@espol.edu.ec;
bscalder@espol.edu.ec
RESUMEN
Este estudio determina cual es el efecto que tienen las horas de descanso y de estudio en el rendimiento de los
estudiantes en la ESPOL. Se encontró que el aporte marginal de una hora de estudio es más grande que el aporte
marginal de una hora de descanso, con valores de 5,27 y 2,50 puntos al promedio de calificaciones
respectivamente. Se realizaron pruebas de independencia, bondad de ajuste, normalidad y de significancia
individual para asegurarse que la estimación de los efectos sea lo más cercana a la realidad.
Objetivos
• Determinar el aporte marginal que tienen las horas de descanso y de estudio al rendimiento de los
estudiantes, para dar recomendaciones acerca de la metodología de estudio.
• Probar la independencia entre el número de horas de descanso y el rendimiento académico de los
estudiantes.
• Probar la independencia entre el número de horas de estudio y el rendimiento académico de los
estudiantes.
• Determinar si el promedio de calificaciones de los estudiantes se distribuye de forma normal
• Determinar si existen diferencias entre el rendimiento académico de los estudiantes de semestres
superiores y semestres inferiores.
Metodología
En el presente estudio la información fue levantada mediante un muestreo aleatorio simple para asegurarse de
tener una muestra representativa de la población.
La población conforma todos los estudiantes de pregrado de la ESPOL II termino 2017.
A continuación se presenta la determinación del tamaño de la muestra para tener un error del 5% en las pruebas
de proporciones.
Datos:
N ∗ Zα 2 ∗ p ∗ q
N = 9513 estudiantes. n=
d2 ∗ (N − 1) + Zα 2 ∗ p ∗ q
n = Tamaño de la muestra
𝐙𝛂 𝟐 = 1,96
p = proporción esperada (en este caso 50% = 0.5) 9513∗1,962 ∗0.5∗0.5
n =
0.052 ∗(9513−1)+1,962 ∗0.5∗0.5
q = 1 – p (en este caso 1 – 0.5 = 0. 5) 369 estudiantes
d = precisión en este caso deseamos un 5%
Por otra parte, la metodología usada para probar las hipótesis a lo largo de esta investigación es la siguiente:
En la cuadro 1 y 2 en Anexos se presentan las distribuciones de frecuencias del número de horas de estudio a la
semana y el número de horas de descanso de un estudiante politécnico, se observa que la variable número de horas
de estudio y horas de descanso siguen una distribución parecida a la uniforme y el promedio es de 5,65 horas con
un desviación estándar de la muestra de 3,44 horas para las horas de estudio y para las horas de descanso un
promedio de 7,41 horas y una desviación estándar de la muestra de 1,71 horas.
Por otra parte, en la tabla 1 se presenta la distribución de frecuencia de datos agrupados para la variable: promedio
de calificaciones del semestre II-2016, se observa que en general hay un mayor número de estudiantes que tienen
calificaciones entre 70 y 90 en comparación con el número de estudiantes que tienen calificaciones entre 40 y 60.
El promedio es de 59,80 y la desviación estándar de la muestra de 18,99 puntos.
De acuerdo a las medidas de posición se puede observar que 25% de los promedios de calificaciones se concentran
entre 62 y 74.
Medidas de Posición
mínimo 23,55
cuartil 1 43,60
cuartil 2 62,18
cuartil 3 74,976
máximo 97,10
Hipótesis 1: Los coeficientes de regresión lineal múltiple entre el rendimiento de un estudiante, el número de horas
que descansa al día y el número de horas que estudia a la semana son significativos.
Modelo a probarse:
R=𝑏0 +𝑏1 𝑥1 + 𝑏2 𝑥2 + 𝑢𝑖
Donde R es el rendimiento de un estudiante medido como el promedio de calificaciones de las materias que curso
el semestre II-2016.
X1=Es el número de horas que un estudiante estudia a la semana.
X2= Es el número de horas que un estudiante descansa al día.
Hipótesis 2: Existe dependencia entre el rendimiento de un estudiante y el número de horas que descansa al día.
Hipótesis 3: Existe dependencia entre el rendimiento de un estudiante y el número de horas que estudia a la
semana.
Hipótesis 4: La proporción de estudiantes de 5to semestre en adelante que estudian en la biblioteca de la ESPOL,
es mayor a la proporción de estudiantes de semestres inferiores que estudian en la biblioteca de la ESPOL.
Hipótesis 5: En promedio los estudiantes de 5to semestre en adelante tienen mejores calificaciones que los
estudiantes que cursan en semestres inferiores.
Prueba de hipótesis 1
La prueba de hipótesis 1 se puede reformular de la siguiente forma matemática:
H0: b0=0 H0: b1=0 H0: b2=0
H1: b0 ≠ 0 H1: b1 ≠ 0 H1: b2 ≠ 0
Los resultados de la regresión múltiple generada en EXCEL (Anexos), arrojan p-values de las pruebas de
significancia individual cercanos a cero para cada uno de los coeficientes, por lo tanto, todos los coeficientes del
modelo son significativos o distintos de cero.
Los intervalos de confianza al 95% se presentan en el siguiente cuadro:
Tabla 2
Intervalos de confianza del 95% de los coeficientes.
Coeficiente Superior
Inferior 95% 95%
.b0 10,89740704 12,1667253
.b1 5,228338259 5,3080068
.b2 2,41571681 2,57560887
Prueba de hipótesis 2 y 3:
Las pruebas de hipótesis 2 y 3 se pueden reformular de la siguiente forma:
H0: El rendimiento de un estudiante y el número de horas que descansa al día son variables independientes.
H1: Existe dependencia entre el rendimiento de un estudiante y el número de horas que descansa al día.
H0: El rendimiento de un estudiante y el número de horas que estudia a la semana son variables independientes.
H1: Existe dependencia entre el rendimiento de un estudiante y el número de horas que estudia a la semana.
Los resultados de las tablas de contingencia se presentan en las siguientes tablas:
Tabla 3
Tabla de contingencia entre el promedio de calificaciones y las horas de descanso.
Promedio de calificaciones
Horas de descanso menor a 33 (A) entre 33 y 65 (B) mayor o igual a 66 (C) Total
menor o igual a 7 (R1) 32(19,35) 100(93,10) 61(80,55) 193
mayor a 7(R2) 5(17,65) 78(84,90) 93(73,45) 176
Total 37 178 154 369
Tabla 4
Tabla de contingencia entre el promedio de calificaciones y las horas de estudio.
Promedio de calificaciones
Horas de estudio menor a 33 (A) entre 33 y 65 (B) mayor o igual a 66 (C) Total
menor o igual a 5 (E1) 37(16,75) 130(80,56) 0(69,70) 167
mayor a 5(E2) 0(20,25) 48(97,44) 154(84,30) 202
Total 37 178 154 369
Cada frecuencia esperada fue calculada en base a la suposición de que la hipótesis nula era verdadera, es decir se
cumplía la independencia entre las variables, los cálculos de estas frecuencias esperadas se encuentran en anexos
cuadro 3 y 4 , en la (tabla de cálculo de probabilidades en caso de H0 sea verdadera).
Los estadísticos chicuadrado calculados en estas pruebas se muestran en los cuadro 6 y 7 de anexos (Cálculo del
chicuadrado-tabla de contingencia Rendimiento vs Horas de descanso. Y vs Horas de estudio) con un valor de
28,36 para la prueba de hipótesis 2 y un valor de 227,49 para la prueba de hipótesis 3. Con el nivel de significancia
del 5% y v=(2-1)(3-1)=2 grados de libertad, los chicuadrado calculados superan el estadístico critico de 3,841. Por
lo tanto, se rechaza la hipótesis nula y se concluye que el promedio de calificaciones y las horas de descanso de
un estudiante son dependientes. Además, el promedio de calificaciones y las horas de estudio, también son
dependientes.
Prueba de hipótesis 4:
La hipótesis 4 se puede reformular matemáticamente de la siguiente manera:
H0: P1=P2
H1: P1>P2
Donde P1= La proporción de estudiantes de 5to semestre en adelante que estudian en la biblioteca de la ESPOL,
y P2= La proporción de estudiantes de semestres inferiores que estudian en la biblioteca de la ESPOL.
El estadístico z calculado es el siguiente:
0,5154−0,5085
z= 1 1
= 0,1324
√0,5122∗0,4878( + )
194 175
100+89
Donde = 0,5122
194+175
1 − 0,5122 = 0,4878
Dado que el estadístico crítico a un nivel de significancia del 5% es de 1,645, No existe evidencia estadística para
rechazar la hipótesis nula de que las 2 proporciones son iguales.
Prueba de hipótesis 5:
La hipótesis 5 se puede reformular de la siguiente manera:
H0: u1=u2
H1: u1>u2
Donde u1= La media de los (promedios de calificaciones) de los estudiantes de 5to semestre en adelante en el
término II-2016.
Y u2= La media de los (promedios de calificaciones) de los estudiantes de semestres inferiores en el término II-
2016.
Dado que se desconoce las varianzas de los rendimientos de los estudiantes, primero se efectúa una prueba de
hipótesis de igualdad de varianzas:
H0: 𝜎12 = 𝜎22
H1: 𝜎12 ≠ 𝜎22
El estadístico f de Fisher es el ratio de varianzas muestrales:
F=(361,0143/360,8755)=1,00038
El estadístico f crítico a un nivel de significancia del 5%, con v1=(194-1) grados de libertad en el numerador y
v2=(175-1) grados de libertad en el denominador tiene un valor de 1,00. Por lo tanto, dado que el estadístico
calculado de 1,00038 no sobrepasa por mucho el valor de 1,00, no existe fuerte evidencia estadística que pueda
rechazar la hipótesis nula de que las varianzas de los rendimientos son iguales.
Dada la prueba de varianzas, se realiza la prueba de diferencia de medias asumiendo varianzas iguales. Además
puesto que en la prueba de bondad de ajuste no se encontró evidencia estadística de que la variable rendimiento
de los estudiantes se distribuya normalmente, no se puede utilizar el estadístico t.
Por otra parte, debido a que el tamaño de las muestras es lo suficientemente grande como para tener una buena
estimación de las varianzas poblacionales, se utilizara el estadístico z.
60,61−58,90
z= 361,0143 360,8755
=0,8633
√ +( )
194 175
Con un nivel de significancia del 5%, el z critico es de 1,645, por lo tanto 0,8633<1,645, no existe evidencia
estadística para rechazar la hipótesis nula de que los estudiantes de semestres superiores tuvieron mejores
calificaciones que los estudiantes de semestres inferiores en el II termino 2016.
Conclusiones:
De acuerdo a la regresión realizada (ver Anexos), el modelo estimado es el siguiente:
Rendimiento=11,53 +5,27(Horas de estudio) + 2,50(Horas de descanso)
(0,32) (0,02) (0,04)
Por lo tanto, por una hora adicional de estudio a la semana, se espera que el promedio de calificaciones de un
estudiante aumente en 5,27 puntos, además por una hora adicional de descanso al día se espera que el rendimiento
aumente en 2,50 puntos. Claramente las horas de estudio tienen un aporte marginal mayor al de las horas de
descanso.
Los intervalos de confianza se presentaron en la prueba de hipótesis 1, demostrando que estos efectos marginales
son significativos al 5% de significancia.
Se determinó que el rendimiento no es independiente de las 2 variables en este modelo con un análisis de tablas
de contingencia (redefiniendo las variables continuas como categóricas).
Es evidente que existen más variables que fueron omitidas en el modelo y explican el comportamiento del
Rendimiento, por ejemplo el hecho de que los estudiantes de semestres superiores puedan tener mejores
calificaciones (en promedio) que los estudiantes de semestres inferiores.
Afortunadamente, no se encontró evidencia de que existan diferencias en los rendimientos de los estudiantes de
semestres superiores o inferiores; Esto tiene coherencia con el hecho de que tampoco se encontró evidencia de que
los estudiantes de semestre superiores asistan en mayor proporción a la biblioteca, que los estudiantes de semestres
inferiores.
Referencias bibliográficas:
WALPOLE R.; MYERS R.; MYERS S. ; Keying Ye (2012), “Probabilidad y estadística para ingeniería y
ciencias”, Pearson, Novena Edición, México-México.
Anexos
Cuestionario de la encuesta:
3.- ¿Cuál fue su promedio de calificaciones de las materias cursadas el semestre anterior?
Cuadro 4-Anexos
Tabla de probabilidades
Cuadro 3- Anexos
Tabla de cálculo de probabilidades en caso de P(A) 0,100271003
H0 sea verdadera P(B) 0,482384824
Probabilidad de P(C) 0,417344173
intersección frecuencia esperada
P(E1) 0,452574526
A E1 0,04538 16,75
P(E2) 0,547425474
A E2 0,054891 20,25
P(R1) 0,52303523
B E1 0,218315 80,56
P(R2) 0,47696477
B E2 0,26407 97,44
C E1 0,188879 69,70
C E2 0,228465 84,30
Cuadro 5 -Anexos
A R1 0,052445 19,35
Calculo del estadístico U y Z para la prueba de
A R2 0,047826 17,65 bondad de ajuste
B R1 0,252304 93,10 1 suma desviaciones 12103,93
B R2 0,230081 84,90 absolutas
C R1 0,218286 80,55 2 suma desviaciones 576060,35
cuadráticas
C R2 0,199058 73,45 1dividido para 369 32,80
2dividido para 369 1561,14
promedio 59,8
desv. Estándar 19
Estadístico U 1,04049323
Estadístico Z 2,9231
Anexos
Cuadro 6
Cuadro 7
Cálculo del chicuadrado-tabla de contingencia
Cálculo del chicuadrado-tabla de contingencia
Rendimiento vs Horas de estudio
Rendimiento vs Horas de descanso.
frecuencia frecuencia
frecuencia frecuencia
observada esperada Chicuadrado
observada esperada Chicuadrado
37 16,75 24,48134328
32 19,35 8,269896641
0 20,25 20,25 5 17,65 9,066430595
130 80,56 30,34152929 100 93,1 0,511385607
48 97,44 25,0853202 78 84,9 0,560777385
0 69,7 69,7 61 80,55 4,744909994
154 84,3 57,62858837 93 73,45 5,20357386
227,4867812 28,35697408
Estadísticas de la regresion
Coeficiente de correlación multiple 0,997531335
Coeficiente de determinación R^2 0,995068765
R^2 ajustado 0,995041818
Error típico 1,337642003
Observaciones 369
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados
Regresión 2 132147,2882
Residuos 366 654,878723
Total 368 132802,1669