Niversidad Utónoma DE Uerétaro: Edidas Uméricas
Niversidad Utónoma DE Uerétaro: Edidas Uméricas
Niversidad Utónoma DE Uerétaro: Edidas Uméricas
FACULTAD DE INGENIERÍA
TRONCO COMÚN
Media
Si X 1 , X 2 ,..., X n es una muestra aleatoria de tamaño n entonces la media de la muestra es la estadística es:
n
X
i 1
i
X
n .
Ejercicio. Tenemos las edades de los once jugadores de un equipo de futbol y queremos calcular su media.
29 3 20 1 26 25 2 30 18 2 26
1 9 6 3
273
¿ =24.8181
11
En un conjunto de datos discretos agrupados en frecuencias, podemos calcular el promedio o media aritmética
a partir de las frecuencias relativas de las observaciones distintas.
n
Media ( X )=∑ x i f i
i=1
Ejercicio: Tenemos una distribución con valores agrupadosen frecuencias. Hallar el valor de la media
aritmética mediante las frecuencias absolutas y con las frecuencias relativas. Comprobar que se obtiene el
mismo resultado:
Mediana
Si X 1 , X 2 ,..., X n es una muestra aleatoria de tamaño n acomodada en orden creciente de magnitud, entonces
la mediana de la muestra es la estadística
X n 1 n impar
2
X~ X n X n
1
2 2
n par
2
6, 2, 4, 4, 5, 5, 6, 3, 8, 6, 5, 3, 7, 6, 5, 6, 4, 4, 4, 3, 5, 5, 4, 6, 7, 4
Calcula la mediana:
n=26
26
=13
2
x 13=5
x 14=5
5+5 10
Mediana ( X )= = =5
2 2
0, 1, 1, 1, 3, 2, 2, 7, 1, 2, 1, 0, 0, 0, 1, 2, 1, 2, 1, 2, 0, 0, 4, 6, 7
Calcula la mediana:
Moda
Si X 1 , X 2 ,..., X n es una muestra aleatoria de tamaño n entonces la moda M es el valor de la muestra que
ocurre con mayor frecuencia.
Ejercicio: Las longitudes de tiempo (en minutos) que 10 pacientes esperan en el consultorio de un doctor son 5,
11, 9, 5, 10, 15, 6, 10, 5 y 10. Encontrar
a) Media
b) Mediana
c) Moda
CUANTILES
Los cuartiles son los tres valores que dividen una serie de datos ordenada en cuatro porciones iguales.
N + 1 3 ( N +1 )
Que pasa si y pueden resultar números decimales. Por ejemplo, si el conjunto de datos
4 4
N + 1 20+1 21
es de 20 elementos, N=20, tendremos que el sujeto del primer cuartil es el = = =5,25.
4 4 4
¿Qué hacemos en el caso de que nos de un número decimal?
Sin parte decimal: elegimos ese mismo sujeto. Por ejemplo, si el conjunto tiene 19 elementos,
N + 1 19+1 20
= = =5, por lo que el primer cuartil será Q 1=X 5 .
4 4 4
Con parte decimal: supongamos que el elemento es un número con parte decimal entre el
sujeto i y el i+1. Sea un número de la forma i,d donde i es la parte entera y d la decimal. El cuartil
será:
Q1=x i +d (x i+1−x i )
Datos Agrupados.
kN
−F i−1
4
Qk =Li + ai
fi
Donde Li ≔límite inferior de laclase donde se encuentra
N=suma de frecuencias absolutas
F i−1 ≔ frecuenciaacumulada anterior ala clase del cuartil
a i=amplitud de clase
Ejercicio: Calcular las posiciones de los tres cuartiles. El número de dados es N=60
1/ m
2
Frecuencian Frecuencia
Absoluta absoluta
acumulada
¿ 4 4
¿ 6 10
¿ 7 17
¿ 8 25
¿ 13 38
¿ 16 54
¿ 6 60
PORCENTILES
El percentil es una medida de posición no central. Los percentiles Pi son los 99 puntos que dividen una serie de
datos ordenada en 100 partes iguales, es decir, que contienen el mismo número de elementos cada una.
El percentil 50 es la mediana.
MEDIDAS DE DISPERSIÓN
Rango: El rango (R) o recorrido estadísitico es la diferencia entre el valor máximo y el mínimo de un conjunto
de datos.
Ejemplo: Supongamos que deseamos calcular el rango de las edades de once inicial de un equipo de futbol.
29 31 20 19 26 25 26 30 18 23 26
Datos:
Máximo:____ (31)
Mínimo:____ (18)
Rango: 31−18=13
RANGO INTERCUARTÍLICO
El rango rango intercuartil IQR es una estimación estadística de la dispersión de una distribución de datos.
Consiste en la diferencia entre el tercer y el primer cuartil. Mediante esta medida se eliminan los valores
extremadamente alejados.
IQR=Q3 −Q1
En una distribución, encontramos la mitad de los datos, el 50 %, ubicados dentro del rango intercuartílico.
Conforme aumente el IQR, indicará que la dispersión será mayor. Con el IQR podremos elaborar los diagramas
de caja, que es un instrumento muy visual para evaluar la dispersión de una distribución.
19 21 24 28 28 29 30 32 33 34
37 40 45 45 52 53 54 56 60 63
Calcular el rango Intercuartìlico de las edades de los veinte sujetos.
VARIANZA
VARIANZA
∑ ( x i−x )
2
S2= i=1
N−1
Siempre se cumple que la varianza es mayor o igual que cero (S2 ≥ 0) . Ésta es cero cuando todos los
datos son el mismo (ejemplo: {1,1,1,1,1}).
Para datos agrupados, la fórmula de la varianza muestral será:
∑ ( x i−x )2 ni
2 i=1
S=
N −1
∑ ( xi −x )2
2 i=1
σ =
N
EJERCICIO 1:
Un médico de un instituto quiere realizar un estudio para ver si los alumnos de un centro tienen sobrepeso. Le
interesaría estimar la varianza para ver como difieren los pesos respecto a la media. Para ello, se selecciona una
muestra de doce alumnos de 14 0 15 años
Alumnos 1 2 3 4 5 6 7 8 9 10 11 12
Peso(kg) 54 36 73 60 42 58 55 48 40 75 62 39
DESVIACIÓN ESTÁNDAR
La desviación estándar (o desviación típica) es una medida de dispersión (S) asociada a
la media. Es la raíz cuadrada de la varianza.
√
N
2
∑ ( x i−x )
i=1
S=
N−1
√
N
∑ ( X i−x )2
i=1
σ=
N
Para datos agrupados, la fórmula de la desviación de una población será:
√
N
∑ ( X i−x )2 ni
i=1
σ=
N
ni ≔ frecuenciaabsoluta del valor x i
La desviación estándar (igual que la varianza) siempre es igual o superior a cero.
Media
Varianza
Des
Ejercicio. Estimar la desviación estándar de las estaturas de niños de 10 años que habitan en
una capital. La muestra estudiada es de 400 sujetos.
COEFICIENTE DE VARIACIÓN DE PERSON
El coeficiente de variación de Pearson (r) mide la variación de los datos respecto a la media, sin tener en
cuenta las unidades en la que están;
S
r=
|x|
Donde S ≔desviacón estándar y x ≔ media
(T)Ejercicio: Los tiempos de reacción, en segundos, de nueve personas para un estimulante (en segundos)
fueron 2.5, 3.6, 3.1, 4.3, 2.9, 2.3, 2.6, 4.1 y 3.4. Calcular
a) Rango
b) Varianza
(T)Ejercicio: Dos mediciones en litros para dos muestras de jugo embotellado por las compañías A y B son
14 21 23 21 16
19 22 25 16 16
24 24 25 19 16
19 18 19 21 12
16 17 18 23 25
20 23 16 20 19
24 26 15 22 24
20 22 24 22 20
Traza una gráfica de puntos, un histograma y una ojiva de los datos y compara las 3 gráficas.
Ejercicio Considere los siguientes datos:
8.9 10.2 11.5 7.8 10.0 12.2 13.5 14.1 10.0 12.2
6.8 9.5 11.5 11.2 14.9 7.5 10.0 6.0 15.8 11.5
(T) Ejemplo: El personal de un consultorio analiza los tiempos de espera de los pacientes que requieren
servicio de emergencia. Los datos siguientes son los tiempos de espera en minutos recolectados a lo largo de un
mes
2 5 10 12 4 4 5 17 11 8
9 8 12 21 6 8 7 13 18 3
(T)Ejercicio: El contenido de nicotina, en miligramos, de 20 cigarros de cierta marca se registró como sigue:
Una gráfica de caja encierra el rango intercuartil de los datos en una caja que tiene la mediana representada
dentro. Además, se prolongan extensiones que muestran las observaciones extremas en la muestra.
Ejercicio: Los siguientes datos representan la vida, en segundos, de 50 moscas sometidas a un nuevo
atomizador en un experimento de laboratorio controlado.
17 20 10 9 23
13 12 19 18 24
12 14 6 9 13
3 32 9 7 10
11 13 7 18 27
Ejercicio: En seguida aparecen las comisiones que ganó el último mes una muestra de 15 corredores de bolsa
de la oficina de Salomon Smith Barney’s Okland, California. Esta compañía de inversiones tiene oficinas a lo
largo de Estados Unidos.
su media x. Cuanto mayor sea la suma ∑ ( x i – x )3, mayor será la asimetría. Sea el
conjunto X=(x , x ,…, x ), entonces la fórmula de la asimetría de Fisher es:
1 2 N
∑ ( x i – x )3
C AF= 3
N Sx
Si CA F< 0: la distribución tiene una asimetría negativa y se alarga a valores menores que
la media.
Si CA F=0: la distribución es simétrica.
Si CA F> 0: la distribución tiene una asimetría positiva y se alarga a valores mayores que
la media.
Donde M 0 ( x ) ≔ Moda
Si CA P<0 : la distribución tiene una asimetría negativa, puesto que la media es menor que
la moda.
Si CA P=0 : la distribución es simétrica.
Si CA P>0: la distribución tiene una asimetría positiva, ya que la media es mayor que la moda.
si la distribución es simétrica o no. Para aplicar este coeficiente, se supone que el comportamiento
de la distribución en los extremos es similar. Sea el conjunto X =( x 1 , x 2, … , x N ), la asimetría de
Bowley es:
Q3 +Q 1−2 Me(X )
C A B=
Q3−Q1
Donde Me ≔ mediana
CURTOSIS
La curtosis es una medida de forma que mide cuán escarpada o achatada está una curva o distribución.
Este coeficiente indica la cantidad de datos que hay cercanos a la media, de manera que a mayor grado de
curtosis, más apuntada será la forma de la curva.
Mide promediando la cuarta potencia de la diferencia entre cada elemento del conjunto y la media, dividido
entre la desviación típica elevado también a la cuarta potencia. Sea el conjunto X=(x1, x2,…, xN), entonces el
coeficiente de curtosis será:
N
∑ ( x i−x ) 4 n i
i=1
g2 = 4
N SX