Ejercicio 2.1y 4
Ejercicio 2.1y 4
Ejercicio 2.1y 4
Estadística descriptiva
1. (20 puntos) Una medida de la forma física es el consumo máximo de oxígeno, que es la
velocidad máxima a la que una persona puede consumir oxígeno. Se utilizó un test basado en
cinta de correr para determinar el máximo consumo de oxígeno de nueve universitarias antes
y después de participar en un programa de 10 semanas de ejercicio enérgico. La Tabla
1muestra las medidas antes y después del cambio (después−antes). Todos los valores están en
ml de O2 por kg de peso corporal.
Los cálculos siguientes se realizarán sobre el cambio en el consumo máximo de oxígeno (la
columna más a la derecha).
Para los presentes cálculos de utilizó el Software Excel, en este se procedió a realizar los
cálculos.
Media muestral: la media es una medida de tendencia central, se la representa como “x̄”. La
media de un conjunto de numero es el valor promedio de los mismos, es decir, se la encuentra
al sumar todas las cantidades y dividirlas para el numero de muestras.
n
1 x + x +…+ xn
x̄ n= ∑ x i= 1 2 (1)
n i=1 n
Donde:
x i : datos
n :n ú mero de datos
Para este caso se sumaron todos los valores de la columna de “Cambio” de la Tabla 1, este
resultado se lo divide para el numero de dato, en este caso 9. De esta forma se obtiene la
media.
∑ ¿ x i− x̄ ¿2 (2)
DE muestra (s)=
√ n−1
Donde:
x i : datos
x̄ : media
n :n ú mero de datos
Siguiendo los valores dados de la columna “Cambio” de la Tabla 1, encontramos:
b) Determine la mediana
Mediana: esta medida nos indica el dato que se encuentra en la posición central de un
conjunto de datos ordenados. Para encontrarla es necesario ordenar de mayor a menor el
conjunto de muestra de datos. Existen dos caminos para encontrar la mediana, esto depende
si la cantidada de datos, es decir, n es impar o par.
(n+1)
Si n es impar: la mediana será el valor del dato que se encuentre en la posición , por lo
2
tanto:
Si n es par: la mediana será el promedio, o la media entre los dos valores centrales del
n
conjunto de datos. Los datos que se encuentran en el centro ocupan las posiciones: ( ¿y(
2
n
+ 1), por lo tanto:
2
(xn +xn )
+1
Me= 2 2 (4)
2
En este caso al tener un número de datos impares se utiliza el caso cuando n es impar.
Cambio
-9,8
-2,2
-0,1
0,8
1
1,5
2,7
3,5
4,3
Tabla 2. Datos de la columna “Cambio” ordenados de forma ascendente.
c) Elimine la participante 1 de los datos en la Tabla 1 y repita los apartados 1a y 1b. ¿Cuál
de las medidas de tendencia central muestran resistencia o robustez y cuál no?
Consumo máximo de oxígeno
Participante Antes Después Cambio
2 38,0 40,7 2,7
3 31,2 32,0 0,8
4 45,5 45,4 -0,1
5 41,7 43,2 1,5
6 41,8 45,3 3,5
7 37,9 38,9 1,0
8 39,2 43,5 4,3
9 47,2 45,0 -2,2
Tabla 3: Consumo máximos de oxígeno sin el participante 1
Cambio
-2,2
-0,1
0,8
1
1,5
2,7
3,5
4,3
Tabla 4. Datos de la columna “Cambio” de la Tabla 3 ordenados de forma ascendente.
Se observa que n=8, por lo tanto, se debe aplicar la ecuación (4), se encuentra que la mediana
es el promedio de los datos centrales 1 y 1,5.
Mediana: 1,25
Primer caso Segundo caso
Media 0,2 1,4
Desv. Estándar 4,2 2,1
Mediana 1 1,25
Tabla 5. Comparación de los datos obtenidos en los distintos casos. Siendo el primer caso el
aplicado a la Tabla 1, y el segundo caso el aplicado a la Tabla 3.
Se dice que es un método robusto cuando los resultados no dependen de la distribución de los
datos, y que es un método resistente cunado no hay influencia de datos atípicos. En este caso
se lo tomaría como dato atípico el primer dato de la Tabla 1, es decir, el dato -9,8, este dato es
el dato más pequeño de nuestra muestra, esto se lo puede apreciar el la Tabla 2, donde ya se
encuentran los datos ordenados de forma ascendente. Observando la Tabla 5, se puede
apreciar que la media, desviación estándar y mediana no son valores robustos ni resistentes ya
que al eliminar el valor atípico si varían las medidas de tendencia central. El valor que muestra
mayor resistencia y robustez es la mediana ya que al aproximar su valor ambos tienden a 1.
4. A Investigar
(20 puntos) De la siguiente lista de problemas seleccione dos y responda esas dudas, indique
los detalles del problema que más le llamaron la atención. La idea es que investigue un poco
más y permita aclarar dudas. Se pude incluir todos los datos que crea necesarios. Es muy
importante que la redacción sea propia y no solo una copia o un “collage” de varias fuentes.
Tamaño de muestra.
Estoy realizando un estudio basado en una encuesta ¿Cuál debe ser el tamaño de la muestra
para que las conclusiones sean fiables? ¿Por qué el tamaño de la muestra no crece
proporcionalmente con el tamaño de la población?
Para encontrar el tamaño óptimo de la muestra se debe tomar en cuenta distintos aspectos
del parámetro, estimador, sesgo, error muestral, nivel de confianza y la varianza poblacional.
De igual forma se debe tener presente las circunstancias en que se va a desarrollar la
investigación. (QuestionPro, 2020)
Al tomar un tamaño de muestra demasiado grande, esta implicará pérdida de tiempo y dinero,
mientras que al optar por un tamaño de muestra demasiado pequeño puede no
proporcionarnos información suficiente y confiable.
k 2 qpN
n= (1)
e2 ( N−1 ) +k 2 pq
Si se desconoce el tamaño de la población:
k 2 qp
n= (2)
e2
Donde:
Media y variación
¿Por qué si a una serie de datos, a todos se les incrementa en un porcentaje determinado, la
media y la desviación estándar aumentan en ese mismo porcentaje?
Media:
n
1 x + x +…+ xn
x̄ n= ∑ x i= 1 2 (3)
n i=1 n
Desviación estándar:
∑ ¿ x i− x̄ ¿2 (4)
DE muestra (s)=
√ n−1
Si a dichas ecuaciones les aumentamos en un porcentaje que en este caso será “a”,
observamos que las ecuaciones nos quedarían de la siguiente manera:
Media:
ax 1+ ax 2+ …+ax n a n
= ∑ x i=a x̄ n(5)
n n i=1
Desviación estándar:
Como se puede observar las ecuaciones 5 y 6 aumentan en el mismo porcentaje a cuando sus
datos son incrementados por un porcentaje igual.
Bibliografía: