Sesión 04
Sesión 04
Sesión 04
La estadística es la rama de la
matemática que utiliza grandes
conjuntos de datos numéricos para
obtener inferencias basadas en calculo
de probabilidades.
Introducción
Involucra una serie de procesos que tiene como
finalidad lograr un mayor conocimiento de una
realidad desconocida y sobre la cual se toman
decisiones confiables.
Definiciones
Estadística:
Experimento Resultado
Variables no – controladas
(componente aleatorio)
Por ejemplo:
•Un proceso embotella bebidas gaseosas en envases de 500ml, sin embargo
por las fluctuaciones naturales en el proceso, el volumen de embotellado
varia en torno al valor nominal de 10 ml.
Variable Aleatoria: Es una variable que toma valores numéricos
determinados por el resultado de un experimento aleatorio, esta puede ser
discreta o continua.
Estadístico
Es una medida descriptiva que resume una
característica de la muestra.
– La media (X)
– la varianza (S²).
Estimación de parámetros (1/2)
▪ Estimador puntual:
• Es un estadístico que produce un solo valor numérico como
estimación del parámetro desconocido. Ejemplo:
♦ La media muestral x es el estimador puntual de la media
poblacional μ
♦ La varianza muestral S2 es el estimador puntual de la varianza
poblacional σ2
Variación
▪ Descripción de la variación:
• Representación visual de:
• Diagrama de tallo y hoja • La forma de la distribución
•La tendencia central de los
datos
• Distribución de frecuencia y el histograma • La dispersión y variabilidad de
los datos.
♦ Promedio muestral
i =1
n
Media o promedio aritmético muestral X =
1
n
X i
i =1
donde:
(
iX − )2
=varp()
Varianza poblacional 2= i=1
N
n
(X − X)
2
Varianza muestral
i =var()
S2 = i=1
n −1
La desviación estandar
Es la raíz cuadrada positiva de la varianza, la
desviación estandar se encuentra en las mismas
unidades que la media.
=
Desviación estandar
poblacional
2 =desvestp()
1 x− 2
1 − ·( )
f (x) = ·e 2
2
Características
• Simétrica y forma de campana.
• Medidas de tendencia central coinciden.
• Se extiende de - a +.
Estandarización
Se toma como referencia una distribución normal estándar
con media = 0 y = 1. Se trabaja con la distancia entre
x y en función de la desviación estándar, tal como se
muestra.
x −
Z =
Función de Densidad
Área bajo la curva = 1 La fórmula de la función densidad de
=1 probabilidad es …
=0
−z2
Cualquier distribución normal 1
puede convertirse en una f (z) = e 2
distribución normal estándar. 2
Teorema del Límite Central: Para casi todas las poblaciones, la distribución de
las medias de muestras (de las mismas) puede ser suficientemente aproximada
por una distribución normal, siempre que el tamaño de la muestra sea lo
suficientemente grande.
Teorema del Límite Central (TLC)
Observaciones Individuales Medias de muestra
representan la distribución de la población; e.j. valores representan la distribución de las medias;
reales de todas las observaciones en todos los subgrupos e.j. valores medios para los subgrupos
Ejemplo:
• Haga una muestra de 5 piezas cada hora durante
20 horas y mida una dimensión. Distribución de
• Calcule la media de la dimensión para las 5 piezas Observaciones
muestreadas cada hora. Distribución de Individuales
• Realice una gráfica con las 100 mediciones (5 x 20)
Medias de Muestra
y observe la distribución de todas ellas (éstas son
“observaciones individuales”)
• Realice una gráfica con las 20 medias (que se
calcularon basadas en cada hora de producción) y
observe la distribución de las 20 medias (estas son
“medias de muestra”)
• El resultado debe parecerse al diagrama siguiente
Teorema del Límite Central
Observaciones individuales Medias de muestra
Representan la distribución de la población, e.j. valores Representan la distribución de las medias, e.j.
reales de todas las observaciones en todos los valores medios para los subgrupos
subgrupos
Distribución de
medias de muestra Distribución de
observaciones individuales
Puntos significativos:
u La curva de medias de muestra es más estrecha (los valores extremos “se acercan”)
u La curva de medias de muestra tiende a ser normal, independientemente de la forma
de la distribución de observaciones individuales
u Podemos normalmente aproximar “distribuciones de media” con una distribución
normal
Desviación estándar de medias
x = x
n
x Desviación estándar de la distribución de
medias de muestra, X
x Desviación estándar de Xs individuales
Frecuencia
Frecuencia
60
50
(exponencial)
40 50
30
20
10
0 0
0 10 20 30 40 50 60 70 80
0 10 20 30 40 50 60 70 80 Muestras de
Exp1 Media 10
distribución
exponencial
30
150
n = 20 n=50
Frecuencia
20
Frecuencia
100
10
50
0
0
0 10 20 30 40 50 60 70 80 90
0 10 20 30 40 50 60 70 80
Media 50
Media 20
3.5 El control Estadístico de Procesos
(SPC)
♦ De atributos
▪ El gráfico de Control:
• Es la representación grafica de una característica de la
calidad que se ha medido o calculado a partir de una
muestra contra el número de muestra o tiempo.
3.6 Técnica del gráfico de Control
Objetivos
-Prueba de Anderson-Darling
-Prueba de Kolmogorov-Smirnov
-Prueba de Smirnov-Cramér von Mises
Xi − X
Yi =
s
Prueba de normalidad A-D
4. Se procede a calcular A2 de la siguiente manera:
n
1
A = −n − (2i −1)(ln (Yi ) + ln(1− (Yn+1−i )))
2
n i=1
0.75 2.25
+ 2
A 2*
= A 1 +
2
n n
Si el P Value es
mayor a 0.05
entonces se
puede concluir
que los datos
son normales
Estadísticas > Grafica de probabilidad…
Si el P Value es
mayor a 0.05
entonces se
puede concluir
que los datos
son normales
Sub grupos Racionales
• Datos aleatorios no son sub grupos racionales
• Seleccionar subgrupos o muestras de manera
que si hay causas atribuibles, la posibilidad de
diferencia entre subgrupos sea máxima,
mientras que la probabilidad dentro del
subgrupo sea mínima.
• Base: Orden de producción
• Tener en cuenta diferencias entre turnos
Sub grupos Racionales
• Normalmente unidades consecutivas.
• Tienen que provenir de una población simple
y definida.
• El subgrupo necesita representar la población
definida.
• Establezca el tamaño mínimo del subgrupo
para reflejar la variación dentro.
Leer: Besterfield (pp 111-114) Escoja el subgrupo racional
Limites de control
• Los límites de control, para cualquier gráfica, se
calculan de la siguiente manera:
x − 3 x + 3
Grafico de Control (medias)
Limite Superior de
Línea Central Control
Tiempo
Limite Inferior de
Control Limites de
especificación
¿Por qué cada 2 horas? Esto depende principalmente de la sensibilidad del proceso y de la
capacidad que tengamos de formar subgrupos racionales.
7:00 a.m. – 9:00 a.m. 9:00 a.m. – 11:00 a.m. 11:00 a.m. – 1:00 p.m.
Total
producido
Cada uno de
Muestra estos valores
representa
característica de la
media de una
calidad del
producto (pero
¿Por qué en puede ser
grupos? también del
proceso)
¿Por qué 3?
m m
x i R i
x= i=1 R= i=1
m m
Gráfico x - R
Procedimiento:
LCS x = x + 3
R LCS x = x + A2 R
= n
d2 LCI x = x − 3
LCI x = x − A2 R
n
ˆR = d 3
R LCS R = R + 3ˆR = R + 3d 3
R
d2
LCS R = D 4 R
d2
R LCI R = D3 R
LCI R = R − 3ˆR = R − 3d 3
d2
Factores para el calculo de las líneas centrales y limites de control por variables
Observaciones en
la muestra A A2 A3 c4 1/c4 B3 B4 B5 B6 d2 1/d2 d3 D1 D2 D3 D4
2
2.1210 1.8806 2.6586 0.7979 1.2533 0 3.2664 0 2.6063 1.1280 0.8865 0.8530 0 3.6870 0 3.269
3
1.7320 1.0231 1.9545 0.8862 1.1284 0 2.5684 0 2.2761 1.6930 0.5907 0.8880 0 4.3570 0 2.574
4
1.5000 0.7285 1.6281 0.9213 1.0854 0 2.2662 0 2.0879 2.0590 0.4857 0.8800 0 4.6990 0 2.282
5
1.3420 0.5768 1.4273 0.9400 1.0638 0 2.0889 0 1.9635 2.3260 0.4299 0.8640 0 4.9180 0 2.114
6
1.2250 0.4833 1.2872 0.9515 1.0510 0.0300 1.9700 0.0286 1.8744 2.5340 0.3946 0.8480 0 5.0780 0 2.004
7
1.1340 0.4193 1.1819 0.9594 1.0423 0.1180 1.8820 0.1133 1.8055 2.7040 0.3698 0.8330 0.2050 5.2030 0.0758 1.924
8
1.0610 0.3726 1.0991 0.9650 1.0363 0.1847 1.8153 0.1783 1.7517 2.8470 0.3512 0.8200 0.3870 5.3070 0.1359 1.864
9
1.0000 0.3367 1.0317 0.9693 1.0317 0.2390 1.7610 0.2317 1.7069 2.9700 0.3367 0.8080 0.5460 5.3940 0.1838 1.816
10
0.9490 0.3082 0.9753 0.9727 1.0281 0.2843 1.7157 0.2765 1.6689 3.0780 0.3249 0.7970 0.6870 5.4690 0.2232 1.777
11
0.9050 0.2851 0.9273 0.9754 1.0252 0.3220 1.6780 0.3141 1.6367 3.1730 0.3152 0.7870 0.8120 5.5340 0.2559 1.744
12
0.8660 0.2658 0.8859 0.9776 1.0229 0.3541 1.6459 0.3462 1.6090 3.2580 0.3069 0.7780 0.9240 5.5920 0.2836 1.716
13
0.8320 0.2494 0.8496 0.9794 1.0210 0.3815 1.6185 0.3736 1.5852 3.3360 0.2998 0.7700 1.0260 5.6460 0.3076 1.692
14
0.8020 0.2353 0.8173 0.9810 1.0194 0.4067 1.5933 0.3990 1.5630 3.4070 0.2935 0.7630 1.1180 5.6960 0.3281 1.672
15
8.7750 0.2231 0.7886 0.9823 1.0180 0.4279 1.5721 0.4204 1.5442 3.4720 0.2880 0.7560 1.2040 5.7400 0.3468 1.653
Ejercicio 3.1
En la tabla siguiente se presentan 10 sub grupos
de tres mediciones de la dimensión critica de una
pieza producida en el proceso de maquinado.
a) Establecer las cartas de control x – R
b)Si los limites de especificación son [150,90]
calcular la fracción de elementos no conformes.
1 138.1 110.8 138.7
2 149.3 142.1 105.0
3 115.9 135.6 124.2
4 118.5 116.5 130.2
5 108.2 123.8 117.1
6 102.8 112.0 135.0
7 120.4 84.3 112.8
8 132.7 151.1 124.0
9 136.4 126.2 154.7
10 135.0 115.4 149.1
x
R 27.9
= = = 16.47
d2 1.693
16.46
LCS x = 125.5 + 3 = 154.05
3
16.46
LCI x = 125.5 − 3 = 97
3
Fracción de no
conformes
Estadísticas > Gráficas de Control > Graficas de variables para subgrupos >Xbarra-R…
Relación entre el grafico de control y la
prueba de hipótesis.
H0 : = 125.53
H1 : ≠ 125.53
Análisis de los gráficos
Variación uniforme
Predecible, todos los puntos dentro de los límites y
distribuidos proporcionalmente a ambos lados de la línea
central. Representa al proceso ideal (baja dispersión).
65
Peso de las piezas (Gr.)
60
55
50
45
1
13
11
15
17
19
Nº de pieza
Análisis de los gráficos
Puntos fuera de los límites
Situación no controlada, con "saltos", incremento notable de
la dispersión, posiblemente por fallas "locales" o causas
fortuitas
65
Lím. Superior
Peso de las piezas (Gr.)
60
55 Valor Central
Punto fuera de control
50
Lím. Inferior
45
21
23
25
27
29
31
33
35
37
39
Nº de pieza
Análisis de los gráficos
Carrera, corrida o mal de rachas
Cambio de nivel repentino, corrimiento o sesgo del valor de
la media:
• De 7 a 8 puntos sucesivos a un lado de la línea media.
• 11 de 12 ó 13 de 15 puntos consecutivos / alternados.
Análisis de los gráficos
Tendencia
Cambio progresivo, gradual, inclinación hacia un
límite (tendencia ascendente o descendente).
Análisis de los gráficos
Ciclo
Cambio estacional, de patrón repetido
Análisis de los gráficos
Inestabilidad
Serie/conjunto de puntos erráticos, presencia de
fluctuaciones muy saltantes o "anchas". Alta dispersión.
Hay:
¿Puntos fuera?
¿Carrera?
¿Tendencia?
¿Ciclo?
¿Inestabilidad?
Dónde?
Zonas de una gráfica de control
LSC
A
B
C
C LC
B
A
LIC
tiempo
Gráficas de control
Prueba # 2: Prueba # 3:
LSC
LSC
A
A
B
B
C
C LC
C LC C
B
B
A
A
LIC
LIC
tiempo
tiempo
Gráficas de control
Prueba # 4: Prueba # 5:
LSC
LSC
A
A
B
B
C
C LC
C LC C
B
B
A
A
LIC
LIC
tiempo
tiempo
Gráficas de control
Prueba # 6: Prueba # 7:
LSC
LSC
A
A
B
B
C
C LC
C LC C
B
B
A
A
LIC
LIC
tiempo
tiempo
Gráficas de control
Prueba # 8:
LSC
A
B
C
C LC
B
A
LIC
tiempo
Algunas reglas de sensibilidad para las cartas
de control
1. Uno o mas puntos fuera de los límites de control
2. Dos de tres puntos consecutivos fuera de los límites de
advertencia dos sigma pero aun dentro de los limites de control
3. Cuatro de cinco puntos consecutivos fuera de los límites una Reglas de Western
sigma Electric
4. Una corrida de ocho puntos consecutivos en el mismo lado de
la línea central
5. Seis puntos seguidos que se incrementan o se decrementan
de manera sostenida
6. Quince puntos seguidos en la zona C (tanto arriba como abajo
de la línea central)
7. Catorce puntos seguidos alternandose arriba y abajo
8. Ocho puntos seguidos en ambos lados de la línea central pero
ninguno de ellos en la zona C
9. Un patron inusual o no aleatorio de los datos
10. Uno o mas puntos cerca de un límite de control o de
advertencia
Causas típicas de situaciones fuera
de control
Puntos fuera
• Error de cálculo.
• Error de medición.
• Error en graficar.
• Cambio de escala.
• Procesamiento incompleto u omitido.
• Alteración aislada de un factor del proceso.
.
Causas típicas de situaciones fuera
de control
Tendencias - Para X-barra
• Error de operario.
• Envejecimiento del equipo.
• Deterioro de instrumentos de medición.
• Cambio de parámetros estacionales o temporales.
• Cambio gradual de estándares.
• Cambio gradual de los lotes.
Causas típicas de situaciones fuera
de control
Tendencias - Para R
Ascendente:
• Desgaste gradual del equipo o herramienta.
• Pérdida gradual de alguna propiedad del material.
Descendente:
• Mejora de métodos y tecnologías.
• Mejora del mantenimiento.
• Mejor resultado de las operaciones precedentes.
• Cambio gradual de estándares.
Causas típicas de situaciones fuera
de control
Carreras, corridas o rachas
• Nuevo elemento, recurso o parámetro.
• Operario: cambio de ánimo, de ritmo, de atención,
fatiga.
• Máquina: desajuste, descalibración, máquina reparada.
• Especificaciones: error, cambio.
Causas típicas de situaciones fuera
de control
Ciclos – Para Xbarra
• Fatiga de materiales.
• Fatiga del operario.
• Rotación del personal.
• Efec
Ciclos – Para R
• Horarios de mantenimiento.
• Desgaste.
Causas típicas de situaciones fuera
de control
Inestabilidad – Para Xbarra
• Ajuste excesivo/frecuente del equipo.
• Diferentes lotes de materiales mezclados.
• Piezas mezcladas en la línea.
Inestabilidad – Para R
• Operario sin capacitación.
• Equipo averiado.
• Equipo descalibrado.
• Efecto de controles en otras áreas.
Revisión de los límites de control
Identificadas las causas "especiales o
asignables", se realiza la mejora del
proceso, se descartan las muestras
involucradas, se completan las 25
muestras, se calculan los “nuevos” límites.
• Carreras.
• Tendencias.
• Ciclos.
• Inestabilidad marcada.
Gráfico de lecturas individuales
Características:
• Se observa dato a dato, no se trabaja con muestras.
• EI tamaño de muestra: n = 1 (individuo)
• EI número de lecturas: m ≥ 20
Inconvenientes:
• TLC no es aplicable (datos individuales).
• Es válido si la variable presenta una distribución normal.
Ejemplos:
• pH de soluciones
• Temperatura de sustancias
• Ensayo de resistencia a la tracción
• Procesos administrativos: ventas/semana, reclamos/mes
Gráfico de lecturas individuales
Justificación:
• Altos costos de inspección y/o ensayo.
• Ensayos destructivos.
• Alto consumo de tiempo para las mediciones.
• Producto de tipo uniforme o continuo.
• Producción en escala reducida (bajo volumen).
• Procesos administrativos.
• Entre otros ...
Gráfico de lecturas individuales
Cálculos:
• Estadísticos: X –barra, R-barra, S
• R: rango móvil (Ri = Xi - X¡-1 , i = 2, 3, ... m)
• Lecturas: m
• Rangos: m – 1
• Límites: µ +/- 3σ
• LIR = 0 (ya que n = 1).
Ejercicio
Índice de cuentas por cobrar
En días equivalentes
ICC = (Monto adeudado)/(monto de venta promedio por día)
Gráfico x - S
1. Si tenemos "m" muestras de "n" unidades cada
una:
S
n
(x i − x) 2
i
S= i=1 S= i=1
n −1 m
Gráfico x - S
Calcular los limites de control:
S
E (S ) = S = c 4 . =
ˆ
c4
Var(S 2 ) = (1− c 4 2 ) . 2
Para el grafico X barra: Para el grafico S:
LCS x = x + 3
LCSS = S + 3
S
1 − c 24
n c4
LC I x = x − 3
S
LCI S = S − 3 1 − c 24
n c4
Gráfico x - S
LCS x = x + A3 S LCS S = B 4 S
LCI x = x − A3 S LCI S = B3 S
Ejemplo:
a) Halle los límites de control.
xi Si
1 138.1 110.8 138.7 129.2 15.9
2 149.3 142.1 105.0 132.1 23.8
3 115.9 135.6 124.2 125.2 9.9
4 118.5 116.5 130.2 121.7 7.4
5 108.2 123.8 117.1 116.4 7.8
6 102.8 112.0 135.0 116.6 16.6
7 120.4 84.3 112.8 105.8 19.0
8 132.7 151.1 124.0 135.9 13.8
9 136.4 126.2 154.7 139.1 14.4
10 135.0 115.4 149.1 133.2 16.9
125.5 14.6
x = 125,5 S= 14,6
Distribución Chi - cuadrado
Así como la media sigue una distribución normal, la desviación estándar sigue una
distribución Chi - cuadrado
(n −1)s 2
n2−1 =
2
Estadística de las gráficas de control
• Prueba de hipótesis:
•Ho: El proceso está bajo control vs
Ha: El proceso no está bajo control
• Fórmulas:
x − x
Z =
x
x =
n
Estadística de las gráficas de
control
LSC
La media cambia
LIC
0,8
0,6
0,4
0,2
0
0 20 40 60 80 100
valor de la media
Curva OC
• Denominaremos Pa = probabilidad de que el punto caiga dentro de los límites de
control
• Fórmula alterna:
•
Pa = = P{LCL x UCL = 1 = o + r }
Donde:
Pa = = ( K − r n ) − (−K − r n )
K: Numero de desviaciones a los cuales se han establecido los limites de control, generalmente toma el valor de
3.
r: Numero de desviaciones estándar que se corre la media.
n: Tamaño de subgrupo (o tamaño de muestra)
Curva OC
1.2
1 n=1
0.8 n=1
n=2
n=3
β 0.6
n=4
n=5
0.4
n=10
n=15
0.2
n=20
n=20
0
0 1 2 3 4 5 6
r
β=P(no detectar un corrimiento de rσ en la media en la primera muestra despues del corrimiento)
ARL (Average Run Length)
La longitud de corrida promedio es el número de
muestras necesarias que se tomarán hasta darnos
cuenta de que el proceso se encuentra fuera de control,
es decir hasta que tengamos una señal de fuera de
control. La fórmula para calcular el valor del ARL esta
dada por:
1
El ARL fuera de control es: ARL =
1−
1
ARL o =
El ARL en control es:
ARL
400
350
300
250
n=1 n=1
ARL
200 n=2
n=3
150
n=5
n=10
100
50
0
0 0.5 1 1.5 2 2.5 3
n=10 r
Toma de muestras
a) Del instante o momento justo.
Los items de c/muestra se toman de forma
consecutiva, al tiempo o en breve lapso, de
la producción en curso.
• Variaciones dentro de muestras: mínimas.
• Variaciones entre muestras: máximas.
Toma de muestras
b) Del lapso o intervalo.
Los items de cada muestra se toman al
azar de un conjunto o lote producido (o
almacenado) durante el intervalo de
muestreo (predefinido).
• Variaciones dentro de muestras: máximas.
• Variaciones entre muestras: mínimas.
Tamaño de muestra (n)
Pautas:
• A mayor "n", mayor sensibilidad del gráfico, los límites se
"acercan".
• A mayor "n" mayor costo de inspección.
• Ensayos destructivos: "n" menor.
• Cálculos: con “n” = 5.
• X~ Normal si “n” ≥ 4.
• Si "n" ≥ 10, aplicar gráfico "s" en vez de "R".
• Para gráficos de control por variables: "n" = 4 ó 5.
• Para gráficos de control por atributos: "n" ≥ 20.
• Opción: cálculo estadístico (CO y ARL) y evaluación de
impactos económicos.
Beneficios de los gráficos
de control de procesos
• Registro histórico (datos útiles).
• Predictibilidad (características del proceso),
• Confiabilidad (proceso estable?).
• Determinar causas especiales (evitables).
• Acciones correctivas (evitar puntos fuera).
• Acciones preventivas (evitar tendencias).
• Mejoras (causas de "rachas" convenientes).
• Diagnóstico, evaluación y toma de decisiones.
• Autocontrol, control en las fuentes.
• Respuesta rápida (durante el proceso, no al terminar).
Ejercicios