Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

0 - Sesión 4 - EYP

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 32

FACULTAD DE INGENIERIA INDUSTRIAL Y DE SISTEMAS

CURSO: ESTADÍSTICA Y PROBABILIDADES

Docente: Mg. Miguel Cutipa C.


LOGRO DE LA SESIÓN

Al finalizar la sesión el estudiante elabora tablas y


graficas de frecuencias. Conoce, calcula y aplica las
medidas de posición y dispersión para conocer la
ubicación y variabilidad de los datos en muestras.
Tabla de frecuencias
(V. cuantitativas continuas)
Intervalo I i xi fi Fi hi Hi
𝒏:´Total de datos
e0 – e1 x1 f1 F1 h1 H1 𝒌: número de clases.
𝑰𝒊 : Intervalo de clase o clase 𝒊.
... ... ... ... ... ... 𝒙𝒊 : marca de clase de 𝑰𝒊 . Es el punto
medio del intervalo de clase.
. e i-1 – ei xi fi Fi hi Hi 𝒆 +𝒆
𝒙𝒊 = 𝒊−𝟏𝟐 𝒊 ; 𝒊 = 𝟏, … , 𝒌
𝒘𝒊 : Ancho de la clase 𝒊.
... ... ... ... ... ... 𝒘𝒊 = 𝒆𝒊 − 𝒆𝐢−𝟏
e k-1 – ek xk fk Fk hk Hk Nota: El número de intervalos de
clase son construidos siguiendo
N 1 alguna regla o por criterio del
investigador.(Por defecto asumimos
la regla de Sturges)
Tabla de frecuencias
(V. cuantitativas continuas)
Definiciones, sea una tabla de frecuencias de 𝒌 intervalos de clase, entonces se
define:
• Frecuencia absoluta acumulada “menor que “ (𝑭𝒊 )
𝑭𝒊 = 𝒇𝟏 + 𝒇𝟐 + ⋯ + 𝒇𝒊

• Frecuencia absoluta acumulada “mayor o igual que “ (𝑭∗𝒊 )


𝑭𝒊∗ = 𝒇𝒊 + 𝒇𝒊+𝟏 + ⋯ + 𝒇𝒌
.• Frecuencia relativa acumulada “menor que “ (𝑯𝒊 )
𝑯𝒊 = 𝒉𝟏 + 𝒉𝟐 + ⋯ + 𝒉𝒊

• Frecuencia relativa acumulada “mayor o igual que “ (𝑯∗𝒊 )


𝑯∗𝒊 = 𝒉𝒊 + 𝒉𝒊+𝟏 + ⋯ + 𝒉𝒌

• Frecuencia relativa acumulada porcentual, Se define de manera analoga


𝟏𝟎𝟎%𝑯𝒊 y 𝟏𝟎𝟎%𝑯∗𝒊
Simetría de una tabla de distribución
de frecuencias
En una tabla de frecuencias,
• Si el número de intervalos de clase es impar es simétrica si las clases
equidistantes de la clase central tienen frecuencias iguales.

• Si el número de intervalos de clase es par es simétrica si las clases equidistantes


de las dos clases centrales tienen frecuencias iguales.

Ejemplo: En una tabla de distribución simétrica de 8 intervalos de clase se conoce


la siguiente información, 𝒇𝟏 = 𝟒; 𝑭∗𝟏 = 𝟏𝟐𝟎; 𝑭∗𝟒 = 𝟗𝟐; 𝑭∗𝟔 − 𝒇𝟕 = 𝟐𝟎; 𝒘 =
𝟔; σ𝟖𝒊=𝟒 𝒙𝒊 = 𝟐𝟐𝟎.
a. Construir el cuadro de frecuencias completo.
b. Determine el % de datos que están entre 18 y 45.
EJEMPLO (gráficas de frecuencias)
 Sean los registros de 50 observaciones referentes a los pesos de 50
lingotes de acero producidos por SIDERPERU la muestra obtenida de
la producción semanal y las unidades están dadas en Kg.
94.3 93 95.5 95.3 92.4 94.4 92.8 93.2 93.6 95.5

92.9 93.6 95.7 93.8 94.8 93.9 92.7 91.6 93.6 93.7

94.2 95.7 94.7 94.3 92.7 94.5 96.2 95.4 93.7 91.9

94.7 92.7 95.0 93.0 92.9 93.7 92.7 93.3 94.6 96.4

94.1 93.7 94.2 93.7 94 93.9 93.6 94.6 92.3 94.4

1. Clasificar estas observaciones en una tabla de frecuencias con 5


clases de igual amplitud.
EJERCICIO
Medida de Dispersión
DEFINICIÓN: Una medida de dispersión es un número que mide el grado de separación
de los datos con respecto a un valor central generalmente es la media aritmética.

Las principales medidas de dispersión son:

• El rango

. •
El rango intercuartil
El rango interdecil
• Desviación media
• Desviación mediana
• La varianza
• La desviación estandar
• El coeficiente de variación
Rango - rango intercuartil
DEFINICIÓN: El rango o recorrido, 𝑹,para una serie de datos es la diferencia entre
sus valores máximos y minimos.

𝑹 = 𝒙𝒎𝒂𝒙 − 𝒙𝒎𝒊𝒏

DEFINICIÓN: El rango intercuartil, 𝑹𝑰, es la diferencia entre sus cuartiles tercero y


. primero.

𝑹𝑰 = 𝑸𝟑 − 𝐐𝟏

DEFINICIÓN: El rango interdecil, 𝑹𝑰𝑫, es la diferencia entre el percentil 90 y decimo.

𝑹𝑰𝑫 = 𝑷𝟗𝟎 − 𝑷𝟏𝟎


Desviación media
Datos no agrupados Datos agrupados
Sean los datos 𝑥1, 𝑥2, … , 𝑥𝑛 no nulos de Sean los marcas de clase 𝑥1, 𝑥2, … , 𝑥𝑘 de
la variable 𝑋, entonces la distribución de frecuencias para
𝑋, con respectivas 𝑓1 , 𝑓2, … , 𝑓𝑘 entonces
σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ σ𝑛
𝑖=1 𝑓𝑖 𝑥𝑖 −𝑥ҧ
𝐷𝑀 =
𝑛
𝐷𝑀 =
𝑛

.
Ventajas y desventajas:
• Considera a todos los datos, se toma en cuenta si todos los datos son mas
representativos por la media, es menos sensible a valores extremos.
• Es muy operativa.
Desviación mediana
Datos no agrupados Datos agrupados
Sean los datos 𝑥1, 𝑥2, … , 𝑥𝑛 no nulos de Sean los marcas de clase 𝑥1, 𝑥2, … , 𝑥𝑘 de
la variable 𝑋, entonces la distribución de frecuencias para
𝑋, con respectivas 𝑓1 , 𝑓2, … , 𝑓𝑘 entonces
σ𝑛𝑖=1 𝑥𝑖 − 𝑀𝑒 σ𝑛𝑖=1 𝑓𝑖 𝑥𝑖 −𝑀𝑒
𝐷𝑀 =
𝑛
𝐷𝑀 =
𝑛
Nota: Si la cantidad de datos de una muestra es mayor de 60, se puede aplicar
la varianza poblacional.
Forma reducida de la varianza muestral:
𝟐 σ𝒏 𝟐
𝒊=𝟎 𝒙𝒊 −𝒏ഥ𝒙𝟐 𝟐 σ𝒏 𝟐 𝒙𝟐
𝒊=𝟎 𝒇𝒊 .𝒙𝒊 −𝒏ഥ
𝑺 = ; 𝑺 =
𝒏−𝟏 𝒏−𝟏
• Esta medida es mas recomendable que la varianza, pues muestra la dispersión de los
datos en las mismas unidades de la variable.
• Sus propiedades son similares a la varianza.
• La varianza y la desviación estándar son las medidas mas usadas.
El coeficiente de variación se utiliza para comparar la variabilidad de dos o mas
series de datos que tengan medias iguales o diferentes o que tengan unidades de
medida iguales o diferentes (una serie en metros y otra en kilogramos).
A menor valor de CV decimos que la serie de datos tiene menos variabilidad.
Desigualdad de Chebyshev
Cualquiera sea la forma de la distribución de frecuencias (simétrica o asimetrica), el intervalo

𝒙 − 𝒌𝒔𝑿, ഥ
𝒙 + 𝒌𝒔𝑿 , 𝒌 > 𝟏 contiene por lo menos el
𝟏
𝟏− en % de los datos.
𝒌𝟐

El porcentaje de datos que se halla fuera del intervalo es menor que el

𝟏
𝒌𝟐
𝒆𝒏 %.

Ejercicio
Los puntajes obtenidos en una prueba de conocimientos tiene una media igual a 8. Si el
coeficiente de variación de los puntajes es igual a 0.25.
a. Determine el porcentaje de evaluados cuyos puntajes estén comprendidos en el
intervalo [04, 12].
USO DE LA MEDIDAS DE DISPERSIÓN
Recordar que la varianza es expresada en unidades cuadráticas de los datos. La desviación
estándar viene expresada en las mismas unidades que los datos. El CV se expresa en
números abstractos (se suprimen sus unidades).
1. Si dos o más series de datos tienen medias iguales o casi iguales es mas dispersa la
serie que tenga mayor medida de dispersión: Rango o RI o 𝑠 2 o 𝑠 o CV. Si hay marcada
asimetría es preferible comparar con el RI.

2. Si dos o mas series de datos, no tiene medias iguales (o casi iguales), o no tienen las
mismas unidades de medición, entonces, es mas dispersa las serie de mayor CV.

NOTA:
• Cuando se necesiten comparar valores observados que pertenecen a diferentes
distribuciones de dos o mas muestras, que difieren en su 𝑥ҧ o 𝑠 2 o difieren en el tipo de
unidades de medición, entonces se usa el valor estandar 𝑍 que se define
DEMUESTRA LO APRENDIDO

AHORA TE TOCA A TI. REVISA Y DESARROLLA LOS SIGUIENTES


EJERCICIOS. TÚ PUEDES.
EJERCICIO
EJERCICIO
Los siguientes datos muestran los calificativos de 20 personas sometidos a
una prueba de aptitud. Los estudiantes fueron divididos en dos grupos, al
grupo 1 se califico de 0 a 100 y al grupo 2 de 0 a 20.
Grupo 1 86 81 79 73 95 86 94 90 86 88
Grupo 2 16 19 13 20 14 16 19 18 17 15

a) Calcule la media y la desviación estándar en cada grupo, ¿Cuál de los


grupos es más homogéneo?
b) Se puede aceptar que el estudiante con 73 puntos del grupo 1 tiene mayor
aptitud que el estudiantes con 13 puntos del grupo 2
Solución:
EJERCICIO
Los sueldos de 100 empleados de una empresa tienen una media de $300 y
una desviación estándar de $ 50. Se proponen dos alternativas de aumento: i)
$ 75 a cada uno, ii) 15% del sueldo más $20 a cada uno. ¿Cuál alternativa es
más conveniente?
a) Si la empresa dispone sólo de $37 000 para pagar sueldos?
b) Si la empresa quiere homogenizar los sueldos?
Solución:

También podría gustarte