Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

MTC y Dispersión

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 61

Estadística Descriptiva

MI. Maru Ballesteros Félix


¿Qué es Estadística?

 “La Estadística estudia métodos


científicos para recoger, organizar,
resumir y analizar datos, así como para
sacar conclusiones válidas y tomar
decisiones razonables basadas en tal
análisis”
Murray R. Spiegel
Problema 2
Los siguientes datos representan el periodo de vida, en segundos, de
50 mosquitos que están sujetos a un nuevo insecticida en un
experimento controlado de laboratorio:
•Dibuja su histograma y su polígono de frecuencias.

18 20 10 8 25 14 13 19 18 24
12 17 8 9 12 14 7 9 15 22
14 18 17 14 16 31 8 7 15 12
13 8 18 7 10 5 28 17 14 15
10 12 15 19 6 8 13 14 18 21
k= 5.64 = 6 Clases
A= 4.33 = 5
Intervalo de Clase

Li Ls Frec
16
5 9 12 15

10 14 16 12

15 19 15
20 24 4
25 29 2
4
30 34 1
2 1

5 10 15 20 25 30

Media 14.27
Mediana 14
TÉCNICAS NUMÉRICAS
Técnicas Numéricas

 Estos son los estadísticos muestrales.


 Calculamos valores que “resumen” las
características de los datos en la muestra:
 Tendencia Central
 Dispersión
 Forma
 Medidas de Posición
Problema 2
Los siguientes datos representan el periodo de vida, en segundos, de
50 mosquitos que están sujetos a un nuevo insecticida en un
experimento controlado de laboratorio:
Dibuja su histograma y su polígono de frecuencias.

18 20 10 8 25 14 13 19 18 24
12 17 8 9 12 14 7 9 15 22
14 18 17 14 16 31 8 7 15 12
13 8 18 7 10 5 28 17 14 15
10 12 15 19 6 8 13 14 18 21
k= 5.64 = 6 Clases
A= 4.33 = 5
Intervalo de Clase

Li Ls Frec
16
5 9 12 15

10 14 16 12

15 19 15
20 24 4
25 29 2
4
30 34 1
2 1

5 10 15 20 25 30

Media 14.27
Mediana 14
Tendencia Central

 Las principales medidas son:


 Media Aritmética
 Mediana
 Moda
 Media Geométrica
 Media aritmética ponderada
Tendencia Central
Media Aritmética
 La media aritmética poblacional se denota
como μ
 La media aritmética muestral es el promedio
de los datos.
n

X
i 1
i
X=
n
 En Excel Opción 2: función PROMEDIO
Tendencia Central
Mediana
 Se define como el valor central.
 El valor que delimita al 50% de los datos .
 En Excel Opción 2: función MEDIANA
Tendencia Central
Moda
 Es el valor más frecuente, el que se observa
mayor número de veces
 Pueden existir varios o ningún valor de moda
para un solo conjunto de datos, la
distribución puede ser:
 Amodal cuando ningún valor se repite
 Unimodal cuando un solo valor es el más frecuente
 Bimodal cuando dos valores son los más
frecuentes
 trimodal,...., polimodal
 En Excel Opción 2: función MODA
Relación entre Tendencia Central y
la Simetría de la distribución

Simetría Relación
Simétrica o insesgada Moda = Mediana = Media

sesgo positivo o a la Moda > Mediana > Media


derecha
sesgo negativo o a la Moda < Mediana < Media
izquierda
Relación entre Tendencia Central y
la Simetría de la distribución

Insesgada

Moda=Mediana=Media
Relación entre Tendencia Central y
la Simetría de la distribución

Sesgo Positivo (a la derecha)

Media
Moda Mediana
Relación entre Tendencia Central y
la Simetría de la distribución

Sesgo Negativo (a la izquierda)

Media Mediana Moda


Tendencia Central
Media Geométrica
 Es el crecimiento promedio.
 El factor de crecimiento de la variable X:

 1  i 
Xi
Yi 
X i 1

 Entonces, el factor de crecimiento promedio


de la variable X:

G  n Y1Y2 Yn  n 1  i1 1  i2 1  in 


Tendencia Central
Media Geométrica
 La tasa de crecimiento de la variable X:

Xi
i  Yi  1  1
X i 1
 Entonces, la tasa de crecimiento promedio
de la variable X:

i  G -1
 La media aritmética siempre es mayor que la
geométrica.
Tendencia Central
Media Geométrica
 En Excel: función MEDIA.GEOM
 usando como argumentos los factores de
crecimiento de la variable X = (1+i)
 Para calcular la tasa promedio de
crecimiento, al resultado de MEDIA.GEOM se
le resta 1.
 También se puede calcular:

Xn
Gn
X1
Tendencia Central
Media Aritmética Ponderada
 Se calcula la media aritmética muestral,
adjudicando diferente “importancia” a cada
uno de los datos.
n

w X
i 1
i i
Xp= n

w
i 1
i
 La Citizens Banking Company estudia la cantidad de
veces que utiliza al día el cajero automático ubicado
en uno de los supermercados de Loblaws, sobre
Market Street. Enseguida figuran las cantidades de
ocasiones que se utilizó la máquina al día durante los
pasados 30 días. Determine la cantidad media de
veces que se utilizó la máquina al día.

83 64 84 76 84 54 75 59 70 61
63 80 84 73 68 52 65 90 52 77
95 36 78 61 59 84 95 47 87 60
 La Split-A- Rail Fence Company vende tres
tipos de cerca a propietarios de casa en los
suburbios de Seattle, Washington. Las cercas
grado A tienen un costo de $5.00 el pie de
instalación. Las cercas grado B tienen un costo
de $6.50 el pie de instalación y las grado C, las
de alta calidad, tiene un costo de $8.00 el pide
de instalación. Ayer, Split-A- Rail instaló 270
pies de cerca grado A, 300 pies de cerca grado
B y 100 pies de cerca grado C. ¿Cuál fue el
costo medio por pie de cerca instalada?
 Rolland Poust es un estudiante de primer grado de
la Facultad de Administración del Scandia Tech. El
semestre anterior tomó dos cursos de estadística y
contabilidad de 3 horas cada uno y obtuvo una A en
ambos. Obtuvo B en un curso de historia de cinco
horas y B en un curso de historia del jazz de dos
horas. Además tomó un curso de una hora que
tenía que ver con las reglas de básquetbol con el fin
de obtener su licencia para arbitrar partidos de
básquetbol de escuela secundaria. Obtuvo una A en
este curso. ¿Cuál fue su promedio semestral?
Suponga que le dan 4 puntos por una A; 3 por una
B y así sucesivamente. ¿Qué medida de ubicación
calculó?.
 Los siguientes datos representan el periodo de duración, en
años, de 30 componentes electrónicos iguales:
•Construye una tabla completa de distribución de frecuencias
para este conjunto de datos usando 5 clases.
•Dibuja su histograma y su polígono de frecuencias.

Usando la tabla de distribución de frecuencias.

•¿Qué porcentaje de los componentes tienen una vida de entre


1.45 y 2.75 años?
•¿Qué porcentaje de los componentes tienen una vida menor a
5.3 años?
2.0 3.0 0.3 3.3 1.3 0.5
0.7 6.0 5.8 6.6 0.2 2.3
1.5 4.0 5.8 1.9 4.8 0.7
4.5 0.9 1.5 0.7 2.8 5.3
1.3 6.2 5.7 6.3 1.5 0.4
Problema 2
 Los siguientes datos representan el periodo de vida, en segundos,
de 50 mosquitos que están sujetos a un nuevo insecticida en un
experimento controlado de laboratorio:
•Construye una tabla completa de distribución de frecuencias para
este conjunto de datos, usando 6 clases.
•Dibuja su histograma y su polígono de frecuencias.

Usando la tabla de distribución de frecuencias.

•¿Qué porcentaje de los mosquitos lograron una vida bajo la presencia


del insecticida por arriba de los 29.5 segundos?
•¿Qué porcentaje de los mosquitos lograron una vida bajo la presencia
del insecticida entre 9.5 y 24.5 segundos?

18 20 10 8 25 14 13 19 18 24
12 17 8 9 12 14 7 9 15 22
14 18 17 14 16 31 8 7 15 12
13 8 18 7 10 5 28 17 14 15
10 12 15 19 6 8 13 14 18 21
Relación entre Tendencia Central y
la Simetría de la distribución

Simetría Relación
Simétrica o insesgada Moda = Mediana = Media

sesgo positivo o a la Moda > Mediana > Media


derecha
sesgo negativo o a la Moda < Mediana < Media
izquierda
Relación entre Tendencia Central y
la Simetría de la distribución

Insesgada

Moda=Mediana=Media
Relación entre Tendencia Central y
la Simetría de la distribución

Sesgo Positivo (a la derecha)

Media
Moda Mediana
Relación entre Tendencia Central y
la Simetría de la distribución

Sesgo Negativo (a la izquierda)

Media Mediana Moda


k= 5.64 = 6 Clases
A= 4.33 = 5
Intervalo de Clase

Li Ls Frec
16
5 9 12 15

10 14 16 12

15 19 15
20 24 4
25 29 2
4
30 34 1
2 1

5 10 15 20 25 30

Media 14.27
Mediana 14
Medidas de Dispersión
Dispersión

 Las principales medidas son:


 Rango
 Desviación Media
 Varianza
 Desviación Estándar
 Coeficiente de Variación
Dispersión
Rango
 Es la diferencia que existe entre el valor mas
grande y el mas pequeño.

rango  max  min


Dispersión
Desviación Media Absoluta
 Es el promedio de las distancias absolutas
de los datos a su media aritmética.

 X X
i 1
i
DM =
n

 En Excel: función DESVPROM


Dispersión
Varianza poblacional
 La varianza poblacional se denota como σ²
 Es el promedio de los cuadrados de las
distancias de los datos a su media
aritmética. n

 X i  X 2

 2 = i 1
n
 Es un estimador sesgado. Funciona solo
para muestras “grandes”.
 En Excel Opción 2: función VARP
Dispersión
Varianza muestral
 La varianza muestral se denota como S²
 Se calcula igual que la varianza poblacional,
dividiendo entre n-1.
n

 X X 
2
i
i 1
S2 =
n -1
 Es un estimador insesgado. Funciona para
cualquier tamaño de muestra.
 En Excel Opción 2: función VAR
Dispersión
Desviación Estándar
 Mide la variación de los datos en términos
absolutos.
 Se interpreta como la distancia promedio de
los datos a su media aritmética.
 Se expresa en las mismas unidades que las
empleadas en los datos.
 Se calcula tomando la raíz cuadrada positiva
de la varianza.
Dispersión
Desviación Estándar
 Desviación Estándar Poblacional:

  2

 En Excel: función DESVESTP

 Desviación Estándar Muestral:


2
S= S
 En Excel: función DESVEST
Dispersión
Desviación Estándar
 Para interpretar la dispersión absoluta, se
construyen intervalos alrededor del
promedio. Con esto se determina en dónde
se sitúan los valores de una distribución de
frecuencia en relación con la media
aritmética. Esto se puede lograr utilizando:
 Teorema de Chebyshev
 Regla Emprírica
Dispersión: Desviación Estándar
Teorema de Chebyshev
Cualquiera que sea la forma de la
distribución de los datos:
 al menos el 75% de los valores (población)
caerán dentro de 2 desviaciones estándar
respecto de la media de la distribución:
X  2S
 al menos el 89% de los valores (población)
caerán dentro de 3 desviaciones estándar
respecto de la media de la distribución:
 X  3S
Dispersión: Desviación Estándar
Regla Empírica
Solo cuando la forma de la distribución de
los datos es simétrica (insesgada):
 aproximadamente el 68% de los datos
(población) se encuentran a una desviación
estándar alrededor de la media de la
distribución :
X  S
Dispersión: Desviación Estándar
Regla Empírica
 aproximadamente el 95% de los datos
(población) se encuentran a 2 desviaciones
estándar alrededor de la media de la
distribución :
X  2S
 aproximadamente el 99% de los datos
(población) se encuentran a 3 desviaciones
estándar alrededor de la media de la
distribución :
 X  3S
 Las edades de una muestra que se tomó
de turistas canadienses que vuelan de
Toronto a Hong Kong fueron las
siguientes:
32, 21,60,47,54,17,72,55,33, y 41.
 A) calcule el rango
 B) Estime la desviación media
 C) Calcule la desviación estándar.
 Creek Ratz es un restaurante muy popular localizado en la costa del norte de
Florida, sirve una variedad de alimentos con carne de res y mariscos. Durante la
temporada de vacaciones de verano, no se aceptan reservaciones. La gerencia del
restaurante está interesada en conocer el tiempo que un cliente tiene que esperar
antes de pasar a la mesa. A continuación aparece la lista de tiempos de espera, en
minutos, para las 25 mesas que se ocuparon la noche del sábado pasado.

28 39 23 67 37 28 56 40 28 50
51 45 44 65 61 27 24 61 34 44
64 25 24 27 29
a) Explique la razón por la que los tiempos constituyen una población.
b) Calcule la media y la mediana de los tiempos de espera.
c) Estime el rango y la desviación estándar de los tiempos de espera.
 Los siguientes datos representan el periodo de duración, en
años, de 30 componentes electrónicos iguales:
•Construye una tabla completa de distribución de frecuencias
para este conjunto de datos usando 5 clases.
•Dibuja su histograma y su polígono de frecuencias.

Usando la tabla de distribución de frecuencias.

•¿Qué porcentaje de los componentes tienen una vida de entre


1.45 y 2.75 años?
•¿Qué porcentaje de los componentes tienen una vida menor a
5.3 años?
2.0 3.0 0.3 3.3 1.3 0.5
0.7 6.0 5.8 6.6 0.2 2.3
1.5 4.0 5.8 1.9 4.8 0.7
4.5 0.9 1.5 0.7 2.8 5.3
1.3 6.2 5.7 6.3 1.5 0.4
Problema 2
 Los siguientes datos representan el periodo de vida, en segundos,
de 50 mosquitos que están sujetos a un nuevo insecticida en un
experimento controlado de laboratorio:
•Construye una tabla completa de distribución de frecuencias para
este conjunto de datos, usando 6 clases.
•Dibuja su histograma y su polígono de frecuencias.

Usando la tabla de distribución de frecuencias.

•¿Qué porcentaje de los mosquitos lograron una vida bajo la presencia


del insecticida por arriba de los 29.5 segundos?
•¿Qué porcentaje de los mosquitos lograron una vida bajo la presencia
del insecticida entre 9.5 y 24.5 segundos?

18 20 10 8 25 14 13 19 18 24
12 17 8 9 12 14 7 9 15 22
14 18 17 14 16 31 8 7 15 12
13 8 18 7 10 5 28 17 14 15
10 12 15 19 6 8 13 14 18 21
Dispersión
Coeficiente de Variación
 Mide la variación relativa de la variable con
respecto a su promedio.
 Cuando deseamos comparar la dispersión
de dos distribuciones, necesitamos medir la
magnitud de la desviación estándar en
relación con la magnitud de la media
 Expresa a la variación de los datos como
porcentaje de su promedio.
S
CV =
X
Forma

 Las medidas de forma son:


 Sesgo
 Curtosis
Forma
Sesgo
 Es el grado de asimetría que tiene la
distribución
 Una curva insesgada tiene sesgo cero
 Medimos en cuánto se aleja la distribución
de una insesgada:
 Si el polígono de frecuencias tiene la mayor
acumulación a la izquierda, tiene sesgo
positivo o a la derecha.
 Si el polígono de frecuencias tiene la mayor
acumulación a la derecha, tiene sesgo
negativo o a la izquierda
Forma
Sesgo
 En Excel Opción 2: función
COEFICIENTE.ASIMETRIA
Coeficiente de Sesgo
Asimetría
=0 No hay sesgo. La distribución
es insesgada
>0 La distribución tiene sesgo
positivo o a la derecha.
<0 La distribución tiene sesgo
negativo o a la izquierda.
Forma
Curtosis
 Mide qué tan “puntiaguda” es una
distribución, con respecto a la Normal.
 La distribución Normal se considera
mesocúrtica, es el término medio.
 Las distribuciones mas puntiagudas que la
Normal se llaman leptocúrticas
 Las distribuciones menos puntiagudas que la
Normal se conocen como platocúrticas
Forma
Curtosis

Leptocúrtica

Mesocúrtica

Platocúrtica
Forma
Curtosis
 En Excel Opción 2: función CURTOSIS

Función Curtosis Curtosis

=3 Mesocúrtica

>3 Leptocúrtica

<3 Platocúrtica
Medidas de Posición

 Las medidas de posición son:


 Cuartiles: Son tres y delimitan al 25%, 50% y
75% de los datos acumulados.
 Deciles: Son nueve y delimitan al 10%, 20%,
... , 90% de los datos acumulados.
 Percentiles: Son noventa y nueve y delimitan
al 1%, 2%, ... , 99% de los datos acumulados.
 Siempre acumulamos de izquierda a
derecha.
 En Excel: función PERCENTIL
 En años recientes, como consecuencia de las bajas tasas de interés,
muchos propietarios de una casa refinanciaron sus créditos.Linda Lahey es
agente hipotecaria en Down River Federal Savings and Loan. A
continuación aparecen las sumas refinanciadas de 20 préstamos a los que
les dio curso la semana pasada. Los datos se expresan en miles de dólares
y se encuentran ordenados de menor a mayor.
59.2 59.5 61.6 65.5 66.6 72.9 74.8 77.3 79.2

83.7 85.6 85.8 86.6 87.0 87.1 90.2 93.3 98.6

100.2 100.7

 A) Calcule la mediana, el primer cuartil y el tercer cuartil.


 B)Determine los percentiles 26° y 83°
 En la siguiente lista aparece la cantidad
de comisiones que ganaron el mes
pasado los ocho miembros del personal
de ventas de Best Electronics. Calcule el
coeficiente de sesgo utilizado ambos
métodos. Sugerencia: el uso de una hoja
de cálculo agilizará los cálculos.
980.9 1036.5 1099.5 1153.9 1409.0 1456.4 1718.4 1721.2
Calculo de MTC y Dispersion

 Para datos agrupados


 Los temas de salud representan una preocupación para gerentes,
especialmente cuando éstos evalúan el costo del seguro médico.
Una encuesta reciente de 150 ejecutivos de Elvers Industries, una
importante empresa financiera y de seguros, ubicada en el suroeste
de Estados Unidos, informó la cantidad de libras de sobrepeso de
los ejecutivos. Calcule la media y la desviación estándar.

LIBRAS DE SOBREPESO FRECUENCIA


0a6 14
6 a 12 42
12 a 18 58
18 a 24 28
24 a 30 8
 La siguiente distribución de frecuencias contiene los costos de
electricidad de una muestra de 50 departamentos de dos
recámaras en Albequerque, Nuevo México, durante el mes de
mayo del año pasado.
COSTOS DE FRECUENCIA
ELECTRICIDAD
$80 a $100 3
100 a 120 8
120 a 140 12
140 a 160 16
160 a 180 7
180 a 200 4
TOTAL: 50
A) Calcule el costo medio.
 B) Aproxime la desviación estándar.
 C) Utilice la regla empírica para calcular la
fracción de costos que se encuentra a dos
desviaciones estándares de la media.
 ¿Cuáles son estos límites?

También podría gustarte