Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Niversidad Utónoma DE Uerétaro: Edidas Uméricas

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 21

UNIVERSIDAD AUTÓNOMA DE QUERÉTARO

FACULTAD DE INGENIERÍA
TRONCO COMÚN

MEDIDAS DE TENDENCIA CENTRAL.


MEDIDAS NUMÉRICAS
Cualquier función de las variables aleatorias que forman una muestra aleatoria se llama estadística.

Media
Si X 1 , X 2 ,..., X n es una muestra aleatoria de tamaño n entonces la media de la muestra es la estadística es:
n

X
i 1
i
X 
n .

La media  x  (también llamada promedio o media aritmética) de un conjunto de datos (X 1 , X 2 , … , X N ) es


una medida de posición central. La definimos como el valor característico de la serie de datos resultado de la
suma de todas las observaciones dividido por el número total de datos.

Si se trata de los datos (X 1 , X 2 , … , X N ) de una muestra, estaremos en la media muestral. Si el conjunto de


datos es toda la población, se llama media poblacional. Cuando se trata de la media de una población,
este parámetro suele caracterizarse con la letra griega  μ. El estadístico media muestral y la medida media
poblacional son dos conceptos distintos, ya que el primero es un valor estimado a partir de
una muestra mientras que el segundo es un valor medido sobre una población. Pero la fórmula para hallarlos y
su valor numérico es el mismo:

 La media aritmética es muy útil para hacer comparacions entre varias poblaciones.


 La desventaja de la media aritmética es que si hay valores extremos alejados, no resulta el promedio
más indicado.

Ejercicio. Tenemos las edades de los once jugadores de un equipo de futbol y queremos calcular su media.
29 3 20 1 26 25 2 30 18 2 26
1 9 6 3

29+31+20+19+26+ 25+26+30+18+ 23+26


x=
11

273
¿ =24.8181
11

Media para datos Agrupados.

En un conjunto de datos discretos agrupados en frecuencias, podemos calcular el promedio o media aritmética
a partir de las frecuencias relativas de las observaciones distintas.
n
Media ( X )=∑ x i f i
i=1

Donde f i frecuencia Relativa.

Ejercicio: Tenemos una distribución con valores agrupadosen frecuencias. Hallar el valor de la media
aritmética mediante las frecuencias absolutas y con las frecuencias relativas. Comprobar que se obtiene el
mismo resultado:

Frecuencia Frecuencia Solución:


Absoluta Relativa
xi ni fi xi ni xi f i
112 11
113 19
115 23
118 19
119 35
121 28
122 32
124 17
126 16
Si el conjunto de datos no está ordenado, la mediana es el valor del conjunto tal que el 50% de los elementos
son menores o iguales y el otro 50% mayores o iguales.

Mediana
Si X 1 , X 2 ,..., X n es una muestra aleatoria de tamaño n acomodada en orden creciente de magnitud, entonces
la mediana de la muestra es la estadística
 X n 1 n impar
 2
X~   X n  X n
1
 2 2
n par
 2

Ejercicios: Las notas de matemáticas de los 26 alumnos de una clase son:

6, 2, 4, 4, 5, 5, 6, 3, 8, 6, 5, 3, 7, 6, 5, 6, 4, 4, 4, 3, 5, 5, 4, 6, 7, 4

Calcula la mediana:

2, 3, 3, 3, 4,4,4,4,4,4,4, 5,5,5,5,5,5, 6,6,6,6,6,6,7,7,8

n=26

26
=13
2

x 13=5

x 14=5

5+5 10
Mediana ( X )= = =5
2 2

Ejercicio. Las faltas de asistencia de 25 alumnos de otra clase son:

0, 1, 1, 1, 3, 2, 2, 7, 1, 2, 1, 0, 0, 0, 1, 2, 1, 2, 1, 2, 0, 0, 4, 6, 7

Calcula la mediana:
Moda
Si X 1 , X 2 ,..., X n es una muestra aleatoria de tamaño n entonces la moda M es el valor de la muestra que
ocurre con mayor frecuencia.

La moda no siempre existe y no necesariamente es única.

Ejercicio: Las longitudes de tiempo (en minutos) que 10 pacientes esperan en el consultorio de un doctor son 5,
11, 9, 5, 10, 15, 6, 10, 5 y 10. Encontrar

a) Media

b) Mediana

c) Moda

MEDIDAS DE POSICIÓN NO CENTRAL.

Las medidas de posición no central (o medidas de tendencia no central) permiten conocer puntos


característicos de una serie de valores, que no necesariamente tienen que ser centrales. La intención de estas
medidas es dividir el conjunto de observaciones en grupos con el mismo número de valores.

CUANTILES

Los cuartiles son los tres valores que dividen una serie de datos ordenada en cuatro porciones iguales.

 El primer cuartil (Q1 ) deja a la izquierda el 25% de los datos.


Q1= X N +1
4

 El segundo(Q2 ) deja a izquierda y derecha el 50% y coincide con la mediana.


Q2=Mediana ( X ) =X N +1
2

 El tercero (Q 3 )deja a la derecha el 25% de valores.


Q 3=3 X (N +1)
4

N + 1 3 ( N +1 )
Que pasa si y pueden resultar números decimales. Por ejemplo, si el conjunto de datos
4 4
N + 1 20+1 21
es de 20 elementos, N=20, tendremos que el sujeto del primer cuartil es el = = =5,25.
4 4 4
¿Qué hacemos en el caso de que nos de un número decimal?

 Sin parte decimal: elegimos ese mismo sujeto. Por ejemplo, si el conjunto tiene 19 elementos,
N + 1 19+1 20
= = =5, por lo que el primer cuartil será Q 1=X 5 .
4 4 4
 Con parte decimal: supongamos que el elemento es un número con parte decimal entre el
sujeto i y el i+1. Sea un número de la forma i,d donde i es la parte entera y d la decimal. El cuartil
será:

Q1=x i +d (x i+1−x i )

Datos Agrupados.
kN
−F i−1
4
Qk =Li + ai
fi
Donde Li ≔límite inferior de laclase donde se encuentra
N=suma de frecuencias absolutas
F i−1 ≔ frecuenciaacumulada anterior ala clase del cuartil
a i=amplitud de clase

Ejercicio: Calcular las posiciones de los tres cuartiles. El número de dados es N=60
1/ m
2
Frecuencian Frecuencia
Absoluta absoluta
acumulada
¿ 4 4
¿ 6 10
¿ 7 17
¿ 8 25
¿ 13 38
¿ 16 54
¿ 6 60

PORCENTILES

El percentil es una medida de posición no central. Los percentiles Pi son los 99 puntos que dividen una serie de
datos ordenada en 100 partes iguales, es decir, que contienen el mismo número de elementos cada una.
El percentil 50 es la mediana.

MEDIDAS DE DISPERSIÓN
Rango: El rango (R) o recorrido estadísitico es la diferencia entre el valor máximo y el mínimo de un conjunto
de datos.

Rango=( Max ) −( Min)

Ejemplo: Supongamos que deseamos calcular el rango de las edades de once inicial de un equipo de futbol.
29 31 20 19 26 25 26 30 18 23 26

Datos:

Máximo:____ (31)

Mínimo:____ (18)

Rango: 31−18=13

RANGO INTERCUARTÍLICO

El rango rango intercuartil IQR es una estimación estadística de la dispersión de una distribución de datos.
Consiste en la diferencia entre el tercer y el primer cuartil. Mediante esta medida se eliminan los valores
extremadamente alejados.

IQR=Q3 −Q1
En una distribución, encontramos la mitad de los datos, el 50 %, ubicados dentro del rango intercuartílico.
Conforme aumente el IQR, indicará que la dispersión será mayor. Con el IQR podremos elaborar los diagramas
de caja, que es un instrumento muy visual para evaluar la dispersión de una distribución.

Ejercicio: En un estudio que se realiza en un club de deportivo se obtienen 20 edades de algunos


jugadores.

EDADES DE LOS SOCIOS DE UN CLUB

19 21 24 28 28 29 30 32 33 34

37 40 45 45 52 53 54 56 60 63
Calcular el rango Intercuartìlico de las edades de los veinte sujetos.

VARIANZA

VARIANZA

La varianza S2 mide la dispersión de los datos de una muestra (X 1 , X 2 , X 3 , … , X N ) respecto a la media (x ),


calculando la media de los cuadrados de las distancias de todos los datos.
N

∑ ( x i−x )
2

S2= i=1
N−1
 Siempre se cumple que la varianza es mayor o igual que cero (S2 ≥ 0) . Ésta es cero cuando todos los
datos son el mismo (ejemplo: {1,1,1,1,1}).
 Para datos agrupados, la fórmula de la varianza muestral será:

∑ ( x i−x )2 ni
2 i=1
S=
N −1

Si en vez de tratarse de una muestra, la varianza se refiere a la población, el denominador será  N .


La fórmula de la varianza poblacional, de símbolo σ², es:

∑ ( xi −x )2
2 i=1
σ =
N

La razón de las dos expresiones de la varianza es que de una población se pueden extraer


diversas muestras.

EJERCICIO 1:
Un médico de un instituto quiere realizar un estudio para ver si los alumnos de un centro tienen sobrepeso. Le
interesaría estimar la varianza para ver como difieren los pesos respecto a la media. Para ello, se selecciona una
muestra de doce alumnos de 14 0 15 años
Alumnos 1 2 3 4 5 6 7 8 9 10 11 12
Peso(kg) 54 36 73 60 42 58 55 48 40 75 62 39

Calcular la media y la varianza.

DESVIACIÓN ESTÁNDAR
La desviación estándar (o desviación típica) es una medida de dispersión (S) asociada a
la media. Es la raíz cuadrada de la varianza.


N
2
∑ ( x i−x )
i=1
S=
N−1

Las fórmulas de arriba se corresponden con el estadístico de la desviación estándar de una


variable aleatoria de una muestra.
Para medir el parámetro de la desviación de una variable aleatoria de una población, con
símbolo σ, se usa:


N

∑ ( X i−x )2
i=1
σ=
N
 Para datos agrupados, la fórmula de la desviación de una población será:


N

∑ ( X i−x )2 ni
i=1
σ=
N
ni ≔ frecuenciaabsoluta del valor x i
 La desviación estándar (igual que la varianza) siempre es igual o superior a cero.

(r)Ejercicio: Medir la desviación estándar de las notas de una clase 18 alumnos.


2 3 4 4.2 4. 5 5 5 5
5
5.8 6 6. 6.5 6. 7 8 9 5.5
1 8

Media

Varianza

Des

Ejercicio. Estimar la desviación estándar de las estaturas de niños de 10 años que habitan en
una capital. La muestra estudiada es de 400 sujetos.
COEFICIENTE DE VARIACIÓN DE PERSON

El coeficiente de variación de Pearson (r) mide la variación de los datos respecto a la media, sin tener en
cuenta las unidades en la que están;
S
r=
|x|
Donde S ≔desviacón estándar y x ≔ media

 El coeficiente de variación toma valores entre 0 ≤ r ≤1.


 Si el coeficiente es próximo al 0, significa que existe poca variabilidad en los datos y es una muestra
muy compacta.
 Si tienden a 1 es una muestra muy dispersa y la media pierde confiabilidad.

(T)Ejercicio: Los tiempos de reacción, en segundos, de nueve personas para un estimulante (en segundos)
fueron 2.5, 3.6, 3.1, 4.3, 2.9, 2.3, 2.6, 4.1 y 3.4. Calcular
a) Rango

b) Varianza

(T)Ejercicio: Dos mediciones en litros para dos muestras de jugo embotellado por las compañías A y B son

A 0.97 1 0.94 1.03 1.06


:
B: 1.06 1.01 0.88 0.91 1.14

Encontrar la media y la desviación estándar para cada compañía.

(T)Ejercicio: Considere los siguientes datos:

14 21 23 21 16
19 22 25 16 16
24 24 25 19 16
19 18 19 21 12
16 17 18 23 25
20 23 16 20 19
24 26 15 22 24
20 22 24 22 20

Traza una gráfica de puntos, un histograma y una ojiva de los datos y compara las 3 gráficas.
Ejercicio Considere los siguientes datos:

8.9 10.2 11.5 7.8 10.0 12.2 13.5 14.1 10.0 12.2
6.8 9.5 11.5 11.2 14.9 7.5 10.0 6.0 15.8 11.5

a) Construya un diagrama de punto.


b) Grafica un histograma.
c) Grafica una ojiva.

(T) Ejemplo: El personal de un consultorio analiza los tiempos de espera de los pacientes que requieren
servicio de emergencia. Los datos siguientes son los tiempos de espera en minutos recolectados a lo largo de un
mes
2 5 10 12 4 4 5 17 11 8

9 8 12 21 6 8 7 13 18 3

Con las clases 0-4, 5-9, etcétera.

a) Muestre la distribución de la frecuencia.


b) Exprese la distribución de la frecuencia relativa.
c) Muestre la distribución de frecuencia acumulada.
d) Presente la distribución de frecuencia relativa acumulada.
e) ¿Cuál es la proporción de los pacientes que requieren servicio de emergencia y esperan 9 minutos o
menos?

(T)Ejercicio: El contenido de nicotina, en miligramos, de 20 cigarros de cierta marca se registró como sigue:

1.09 1.92 2.31 1.79


2.28 1.74 1.47 1.97
0.85 1.24 1.58 2.03
1.70 2.17 2.55 2.11
1.86 1.90 1.68 1.51

a) Calcular: Los tres cuartiles

Una gráfica de caja encierra el rango intercuartil de los datos en una caja que tiene la mediana representada
dentro. Además, se prolongan extensiones que muestran las observaciones extremas en la muestra.

Ejercicio: Los siguientes datos representan la vida, en segundos, de 50 moscas sometidas a un nuevo
atomizador en un experimento de laboratorio controlado.
17 20 10 9 23

13 12 19 18 24

12 14 6 9 13

3 32 9 7 10

11 13 7 18 27

Construir la gráfica de caja y determinar si hay datos apartados.

Ejercicio: En seguida aparecen las comisiones que ganó el último mes una muestra de 15 corredores de bolsa
de la oficina de Salomon Smith Barney’s Okland, California. Esta compañía de inversiones tiene oficinas a lo
largo de Estados Unidos.

$2038 $1758 $1721 $1637 $2097

$2047 $2205 $1787 $2287 $1940

$2311 $2054 $2406 $1471 $1460

Trace la gráfica de cuantiles correspondiente a los datos.


ASIMETRÍA Y CURTOSIS

La asimetría y curtosis informan sobre la forma de la distribución de una variable.

La asimetría es la medida que indica la simetría de la distribución de una variable respecto a


la media aritmética, sin necesidad de hacer la representación gráfica. Los coeficientes de
asimetría indican si hay el mismo número de elementos a izquierda y derecha de la media

Existen tres tipos de curva de distribución según su asimetría:


 Asimetría negativa: la cola de la distribución se alarga para valores inferiores a la media.
 Simétrica: hay el mismo número de elementos a izquierda y derecha de la media. En este caso,
coinciden la media, la mediana y la moda. La distribución se adapta a la forma de la campana
de Gauss, o distribución normal.
 Asimetría positiva: la cola de la distribución se alarga (a la derecha) para valores superiores a
la media.

Existen tres coeficientes de asimetría:

COEFICIENTE DE ASIMETRÍA DE FISHER


 El coeficiente de asimetría de Fisher CA  evalúa la proximidad de los datos a
F

su media x. Cuanto mayor sea la suma ∑ ( x i – x )3, mayor será la asimetría. Sea el
conjunto X=(x , x ,…, x ), entonces la fórmula de la asimetría de Fisher es:
1 2 N

∑ ( x i – x )3
C AF= 3
N Sx

Cuando los datos están agrupados o agrupados en intervalos, la fórmula del coeficiente de


asimetría de Fisher se convierte en:
3
∑ ( x i – x ) ni
C AF= 3
N Sx

 Si CA F< 0: la distribución tiene una asimetría negativa y se alarga a valores menores que
la media.
 Si CA F=0: la distribución es simétrica.
 Si CA F> 0: la distribución tiene una asimetría positiva y se alarga a valores mayores que
la media.

COEFICIENTE DE ASIMETRÍA DE PEARSON


El coeficiente de asimetría de Pearson CA  mide P la diferencia entre la media y
la moda respecto a la dispersión del conjunto X=(x , x ,…, x ).
1 2 N

Este procedimiento, menos usado, lo emplearemos solamente en distribuciones unimodales y


poco asimétricas.
x−M O ( X)
C A P=
SX

Donde M 0 ( x ) ≔ Moda
 Si CA P<0 : la distribución tiene una asimetría negativa, puesto que la media es menor que
la moda.
 Si CA P=0 : la distribución es simétrica.
 Si CA P>0: la distribución tiene una asimetría positiva, ya que la media es mayor que la moda.

COEFICIENTE DE ASIMETRÍA DE BOWLEY


El coeficiente de asimetría de Bowley CA  toma como referencia los cuartiles para determinar
B

si la distribución es simétrica o no. Para aplicar este coeficiente, se supone que el comportamiento
de la distribución en los extremos es similar. Sea el conjunto  X =( x 1 , x 2, … , x N ), la asimetría de
Bowley es:
Q3 +Q 1−2 Me(X )
C A B=
Q3−Q1
Donde Me ≔ mediana

 Si CA B<0: la distribución tiene una asimetría negativa, puesto que la distancia de


la mediana al primer cuartil es mayor que al tercero.
 Si CA B=0: la distribución es simétrica, ya que el primer y tercer cuartil están a la misma
distancia de la mediana.
 Si CA B>0: la distribución tiene una asimetría positiva, ya que la distancia de la mediana al
tercer cuartil es mayor que al primero.

CURTOSIS
La curtosis es una medida de forma que mide cuán escarpada o achatada está una curva o distribución.
Este coeficiente indica la cantidad de datos que hay cercanos a la media, de manera que a mayor grado de
curtosis, más apuntada será la forma de la curva.

Mide promediando la cuarta potencia de la diferencia entre cada elemento del conjunto y la media, dividido
entre la desviación típica elevado también a la cuarta potencia. Sea el conjunto X=(x1, x2,…, xN), entonces el
coeficiente de curtosis será:
N

∑ ( x i−x ) 4 n i
i=1
g2 = 4
N SX

También podría gustarte