Probabilidad y Estadistica II PDF
Probabilidad y Estadistica II PDF
Probabilidad y Estadistica II PDF
U NIVERSITARIO
A ERONAUTICO
D I S TA N C I A
EDUCACION A
PROBABILIDAD Y
ESTADÍSTICA II
Ricardo, Ingaramo
INGENIERIA DE SISTEMAS
GUIA DE ESTUDIO
DISEÑO GRAFICO
IMPRESION Y ARMADO
DEPARTAMENTO SISTEMAS
Directora Lic. Susana Barrionuevo de Bustos Acuña
DEPARTAMENTO PEDAGOGICO
Directora Lic. Maria Beatriz Rossa de Riaño
3
PROBABILIDAD Y ESTADISTICA II
CORRECCIÓN DE ESTILO:
REVISIÓN DE CONTENIDOS:
4
Estimado Alumno:
5
INDICE
INDICE
1. Análisis de correlación
2. Análisis de regresión
3. Regresión múltiple
1. Control de la calidad
2. Control estadístico de procesos
2.1 Cartas de control por variables
2.2 Cartas de control por atributos
6
INDICE
7
INTRODUCCION GENERAL
ORIENTADORA
INTRODUCCION
SINTESIS DE LA TEMATICA
8
INTRODUCCION
Es importante destacar que buena parte de las técnicas que vamos a emplear en
esta materia son demasiado complejas o laboriosas como para ser implementadas
en forma manual. Por lo tanto, una de las características de esta nueva etapa será el
uso frecuente de paquetes estadísticos de computación, por lo que será necesario
que incorpore su uso y adquiera habilidad para interpretar correctamente las salidas
de los mismos.
Bien, con los contenidos vistos en Probabilidad y Estadística I, más los que incorpore
con esta nueva materia, Usted tendrá la formación necesaria como para encarar en
forma independiente los siguientes aspectos de un estudio estadístico: plantear con
claridad el problema, seleccionar las herramientas adecuadas, ejecutar los
procedimientos necesarios, e interpretar los resultados obtenidos, aprovechando la
información obtenida para facilitar la toma de decisiones dentro de su actividad
profesional.
9
INTRODUCCION
OBJETIVOS
Objetivos del
Aprendizaje
10
INTRODUCCION
Esquema
Conceptual
11
INTRODUCCION
BIBLIOGRAFIA
Bibliogafía Obligatoria
Este texto ha sido elegido como material de base para el seguimiento de la materia
por su comprobada eficacia para el proceso de aprendizaje de la misma, su formato
actualizado, el uso de un lenguaje claro y didáctico, una presentación muy “amigable”,
y un contenido temático muy amplio. Además, incorpora el uso de la computadora
como herramienta auxiliar, por lo que se adapta a los requerimientos actuales en
cuanto a la aplicación de las técnicas estadísticas a problemas de la vida real.
Bibliografía Complementaria
12
INTRODUCCION
13
INTRODUCCION
14
INTRODUCCION
• Cada tema finaliza en la Guía con una revisión de los conceptos desarrollados
y una lista de recomendaciones prácticas, que resumen los principales
conceptos tratados y hacen algunas aclaraciones útiles para facilitar su
aplicación.
SISTEMA DE EVALUACION
Las instancias de evaluación que usted deberá sortear son las siguientes:
La Guía incluye claves de respuesta a las actividades sugeridas para que usted
pueda constatar los resultados correctos.
15
INTRODUCCION
Cronograma
1 25
2 15
Actividad Obligatoria Nº 1
3 20
4 15
5 25
Actividad Obligatoria Nº 2
EXAMEN
16
PRUEBAS DE
HIPOTESIS
UNIDAD
1
UNIDAD
1
UNIDAD 1
ORIENT A C I ” N DEL
RIENTA
A PRENDIZAJE
18
UNIDAD 1
19
UNIDAD 1
Esquema
Tema Conceptual
Pruebas de Hipótesis
Objetivo
General
Comprobar las principales
propiedades de una
variable aleatoria
Objetivos
Específicos
Comprobar el Comprobar la
valor de los distribución de
parámetros probabilidades
Herramientas
usadas
Pruebas Pruebas sobre Pruebas de
sobre los los parámetros bondad de
parámetros de dos ajuste
de una poblaciones
población
20
UNIDAD 1
Objetivos del
Aprendizaje
Realizar pruebas de hipótesis sobre los parámetros de una población.
21
UNIDAD 1
MODALIDAD DE TRABAJO
22
UNIDAD 1
Bibliografía Obligatoria
23
UNIDAD 1
Una forma de encarar ese análisis es formulando hipótesis sobre los valores de los
parámetros de interés, y tomando muestras de la población en estudio para decidir
si las hipótesis efectuadas son razonables.
24
UNIDAD 1
muestras es muy reducido como para obtener una estimación confiable. Además,
necesita especificar algún criterio para decidir hasta qué punto pueden considerarse
satisfactorios los resultados del muestreo, en otras palabras, si el diámetro medio
de los resortes se aproxima razonablemente o no al valor objetivo.
Por lo tanto, si rechaza H0, el ingeniero habrá comprobado que el nivel medio de la
producción de los resortes A tiene un diámetro significativamente distinto al valor
objetivo de la especificación, y en consecuencia deberá realizar ajustes en el proce-
so para corregir esa situación.
Las características principales de una prueba para la media, para el caso en que la
varianza poblacional es desconocida, y se trabaja con muestras pequeñas, son las
siguientes:
Formulación de Hipótesis
μ μ0 Prueba bilateral
Hipótesis Alternativa H1: μ > μ0 Prueba unilateral derecha
μ < μ0 Prueba unilateral izquierda
25
UNIDAD 1
Estadístico de Prueba
Valor Distribución
x
Tˆ t de Student con (n-1) grados de libertad
S/ n
Resuelva los ejercicios pares que están al final de este tema, y compare sus resulta-
dos con las respuestas del Texto.
26
UNIDAD 1
El Ingeniero de Proceso desea aprovechar los datos del muestreo para controlar no
solo el centrado del proceso - a través del diámetro medio -, sinó también su dis-
persión.
En este caso se plantea como objetivo obtener un desvío estándar para los diáme-
tros no superior a 1 mm., valor con el que asegura un elevado índice de capacidad
de su proceso, cumpliendo ampliamente con los requerimientos del cliente.
Las características de esta prueba son las siguientes son las siguientes:
Formulación de Hipótesis
Estadístico de Prueba
Valor Distribución
2
S
Yˆ (n 1) 2 Chi-cuadrado con (n-1) grados de libertad
27
UNIDAD 1
Para el ejemplo que estamos analizando, las hipótesis serían las siguientes:
El estadístico de esta prueba tiene distribución chi-cuadrado ( 2) con (n-1) gra-
dos de libertad. Es otra distribución para variable continua ampliamente usada en
inferencia, definida sólo para valores positivos. Viene tabulada en función del nivel
de significación y de los grados de libertad. De acuerdo al valor de los g.l. tene-
mos una familia de curvas: cuando el valor del parámetro es pequeño la distribución
tiene asimetría positiva, pero a medida que los g.l. crecen la distribución se va ha-
ciendo cada vez más simétrica.
REVISION DE CONCEPTOS DESARROLLADOS
28
UNIDAD 1
RECOMENDACIONES PRACTICAS
29
UNIDAD 1
1
El empleado encargado de controlar el diámetro de los resortes tipo A, sacó
una muestra de 10 resortes, que arrojó los siguientes valores:
En la mayoría de las técnicas de inferencia desarrolladas hasta aquí existía una su-
posición implícita: que la variable en estudio tiene distribución Normal. ¿Cómo sa-
bemos si este supuesto realmente se cumple?
Por ejemplo, el responsable de medir los diámetros de los resortes tipo A, tiene que
determinar periódicamente si la variable que controla efectivamente tiene distribu-
ción Normal, antes de realizar cualquier análisis de inferencia.
30
UNIDAD 1
Para resolver este tipo de problemas, es necesario emplear alguna de las denomi-
nadas pruebas de bondad de ajuste.
Distribución
observada
Distribución
esperada
Gráfico Nº 1
31
UNIDAD 1
Formulación de Hipótesis
Estadístico de Prueba
Valor Distribución
32
UNIDAD 1
Dado que el estadístico de prueba es una suma de desvíos cuadráticos -entre las
frecuencias observadas y esperadas-, si ese valor es muy alto quiere decir que las
diferencias entre los valores calculados con el modelo teórico y los datos observa-
dos en la realidad son significativas. En ese caso hay suficiente evidencia como para
concluír que el modelo elegido no explica correctamente la distribución de la varia-
ble aleatoria, y por lo tanto se debe rechazar la hipótesis nula.
Revise los ejercicios propuestos en el Texto, y resuelva al menos uno para variable
discreta y uno para variable continua, para familiarizarse con las características de
implementación propias de cada caso.
REVISION DE CONCEPTOS DESARROLLADOS
33
UNIDAD 1
RECOMENDACIONES PRACTICAS
< 149.25 5
149.25 - 149.50 15
149.50 - 149.75 20
149.75 - 150.00 25
150.00 - 150.25 28
150.25 - 150.50 18
150.50 - 150.75 16
> 150.75 8
34
UNIDAD 1
Las máquinas provienen de dos proveedores distintos, pero como él debe garanti-
zar a sus clientes una calidad homogénea más allá del equipamiento que usa, nece-
sita estar seguro de que las máquinas trabajen en forma parecida, produciendo
resortes similares en cuanto al nivel medio y a la dispersión de sus diámetros.
Formulación de Hipótesis
35
UNIDAD 1
Estadístico de Prueba
Valor Distribución
Si se rechaza H0, se estará comprobando que las dos máquinas funcionan con
distinta variabilidad, y por lo tanto se deberán efectuar los ajustes necesarios como
para revertir esta situación.
Importante: para analizar con mayor detalle los conceptos referidos a la distribu-
ción F, sus parámetros, y el cálculo de probabilidades con esta distribución, busque
dentro de este mismo Capítulo el tema Análisis de Varianza, en el apartado "La
distribución F".
36
UNIDAD 1
3.2 Pruebas de comparación de medias
Formulación de Hipótesis
μ1 μ2 Prueba bilateral
Hipótesis Alternativa H1: μ1 > μ2 Prueba unilateral derecha
μ1 < μ2 Prueba unilateral izquierda
Si se rechaza H0, se habrá comprobado que las dos máquinas producen un diá-
metro medio distinto, por lo que se deberán implementar acciones correctivas
sobre el proceso para eliminar esa falta de uniformidad.
Muestras dependientes
37
UNIDAD 1
Estadístico de Prueba
Valor Distribución
ˆ
x 1 x 2
Normal estandarizada N(0,1)
2
2
1
2
n1 n 2
Cuando el tamaño de las dos muestras es pequeño, digamos menor a las 30 obser-
vaciones, no se puede usar el mismo estadístico de prueba del caso anterior. Para
encontrar el estadístico de prueba apropiado, es necesario verificar si las varianzas
de las dos poblaciones son iguales, lo que se puede realizar a través de una
prueba de comparación de varianzas.
Estadístico de Prueba
Valor Distribución
Tˆ
x 1 x2
1 1
ˆ c
n1 n 2
T de Student con (n1+ n2-2) grados de libertad
( n1 1) S 12 ( n 2 1) S 22
ˆ c
n1 n 2 2
En este caso, para calcular el error estándar de la diferencia de medias se utiliza una
estimación conjunta de la varianza poblacional, denominada varianza combinada
que es un promedio ponderado de las varianzas de las dos muestras.
38
UNIDAD 1
Formulación de Hipótesis
d D0 Prueba bilateral
Hipótesis Alternativa H1: d > D0 Prueba unilateral derecha
d < D0 Prueba unilateral izquierda
Estadístico de Prueba
Valor Distribución
Tˆ
d
d
39
UNIDAD 1
Resuelva los ejercicios pares incluidos al final de cada tema, y compare sus resulta-
dos con los del Texto.
RECOMENDACIONES PRACTICAS
40
UNIDAD 1
3
Para controlar el funcionamiento de dos Máquinas -1 y 2- que producen el
resorte tipo A, el empleado encargado de controlar el diámetro de esos re-
sortes, sacó una muestra de cada máquina, procesó los datos y obtuvo los
siguientes resultados:
Explique qué tipo de prueba debe usar para decidir si las dos máquinas tra-
bajan igual en cuanto al nivel medio, y efectúe la comprobación para un nivel
de significación del 5%.
41
UNIDAD 1
Asumiendo que las varianzas poblacionales son iguales, explique qué tipo de
prueba debe usar para probar si las dos máquinas producen el mismo diáme-
tro medio, y efectúe la comprobación para un nivel de significación del 10%.
Explique qué tipo de prueba debe usar para verificar si la apreciación del
ingeniero es correcta, y compuébelo usando un nivel de significación del 5 %.
42
UNIDAD 1
Conclusiones
El análisis del tema comenzó en PyE I, con la prueba sobre la media de una pobla-
ción con varianza conocida, y la prueba de Kolmogorov-Smirnov sobre el modelo.
En esta oportunidad hemos incorporado el resto de las pruebas más importantes:
El manejo de estos procedimientos, que sirven para estimar propiedades muy im-
portantes de una población, implica un avance considerable en su formación esta-
dística, ya que el uso de esta herramienta es fundamental dentro de cualquier estu-
dio estadístico, como podrá comprobarlo a través del resto de las Unidades.
Las pruebas de hipótesis serán referenciadas con mucha frecuencia cuando veamos
las técnicas "explicativas" de la estadística, como el análisis de regresión y correla-
ción o el análisis de varianza, dentro de las técnicas inferenciales usadas en el con-
trol de calidad, y en cualquier estudio estadístico donde sea necesario estimar los
parámetros de una población o comprobar la distribución de una variable aleatoria.
43
UNIDAD
1
SOLUCIONES A LAS
A CTIVIDADES DE PROCESO
UNIDAD 1
44
UNIDAD 1
45
UNIDAD
1
UNIDAD 1
A CTIVIDADES DE
A UTOEV
UTOEV ALUACION
OEVALUACION
4. ¿Qué elementos de juicio hay que tener en cuenta al comparar dos medias
poblacionales?
Se saca una muestra de 125 resortes producidos en una cierta jornada. El muestreo
comienza desde que se inicia la producción. Las piezas se miden y se registran en
orden consecutivo. Los diámetros registrados son los siguientes:
46
UNIDAD 1
b. Para que el proceso tenga una dispersión aceptable, el ingeniero opina que la
varianza de los diámetros no debe ser superior a 0.01 mm2. En base a los mismos
datos del punto anterior, pruebe si se cumple esa condición, para un nivel de signi-
ficación del 5 %.
c. Efectúe una prueba Chi-cuadrado de bondad de ajuste con todos los datos,
para verificar la normalidad de la variable.
47
ANALISIS DE
REGRESION Y
CORRELACION
UNIDAD
2
UNIDAD
2
UNIDAD 2
ORIENTACIÓN DEL
APRENDIZAJE
Gráfico Nº 1
52
UNIDAD 2
Esquema
Tema
Conceptual
Análisis de Correlación
y Regresión
Objetivo
General
D e t e r m i n a r t ip o y g r a d o d e r e la c ió n
e n tr e d o s o m á s v a r i a b le s
Objetivos
Específicos
Determinar el Identificar la
nivel de relación funcional
asociación entre entre dos o más
dos variables variables
Herram ientas
usadas
Análisis de Un solo factor: Varios
correlación Regresión factores:
simple Regresión
múltiple
53
UNIDAD 2
Objetivos del
Aprendizaje
Estudiar la relación entre dos variables
Contenidos
1. Análisis de correlación.
2. Análisis de regresión.
3. Regresión múltiple.
54
UNIDAD 2
MODALIDAD DE TRABAJO
Bibliografía Obligatoria
LEVIN, Richard y RUBIN, David. Estadística para Administradores. Sexta Edición. Editorial
Prentice-Hall. México.1996.
55
UNIDAD 2
1. ANALISIS DE CORRELACION
Para explorar la posible vinculación entre dos variables, el primer paso consiste en
dibujar el diagrama de dispersión de los datos, que es un gráfico bidimensional en
el cual se vuelcan los resultados de la observación conjunta de ambas variables.
Gráfico Nº 2
56
UNIDAD 2
Hrs. de Sueño
Gráfico Nº 3
Como se puede apreciar en los diagramas anteriores, en el primer caso existe una
clara correspondencia entre las dos variables, cosa que no es tan evidente en el
segundo gráfico. ¿Cómo es posible determinar en forma analítica el grado de aso-
ciación que existe entre las variables analizadas en los ejemplos anteriores?
57
UNIDAD 2
Cov(x,y)
_______________
r=
SxSy
Es decir que se divide la covarianza por el producto de los desvíos de ambas varia-
bles, obteniéndose un índice adimensional, que varía entre -1 y +1. Si el coeficiente
de correlación tiende a uno en valor absoluto, indica un fuerte grado de asociación
lineal entre las variables. En cambio, cuando el coeficiente tiende a cero, existe un
débil grado de asociación lineal.
58
UNIDAD 2
(a)
y
x
Gráfico Nº4
(b)
x
Gráfico Nº5
59
UNIDAD 2
(c)
y
x
Gráfico Nº6
(d)
y
Gráfico Nº7
60
UNIDAD 2
y = 10 - 2 x
x 1 2 3
y 8 6 4
x =2 Sx = 1
y =6 Sy = 2
Cov(x,y) = [32 - 3x2x6] / (3-1) = -2
r = -2 / (1 x 2) = -1
Este resultado indica una asociación lineal perfecta -de tipo inversa- entre x e y,
lo cual es lógico pues los puntos fueron generados a partirde la ecuación de una
recta.
61
UNIDAD 2
Ahora bien, en un caso real es poco probable que el coeficiente de correlación sea
exactamente igual a uno. También sería muy raro que el r valga cero, indicando total
ausencia de asociación lineal entre las variables. Cuando el coeficiente de correla-
ción da un valor muy bajo, se plantea la necesidad de decidir hasta qué punto se
puede pensar que el r no es significativamente distinto de cero, y por lo tanto que las
variables no están relacionadas.
H0: ρ=0
H1: ρ1≠ 0
r
T=
(1 − r 2 )
(n − 2)
tc = t1-a/2;n-2
62
UNIDAD 2
Por ejemplo, para los 10 datos del ejemplo de la Figura (c), se obtuvo un coeficien-
te de correlación de 0.181 Para decidir si existe o nó asociación lineal entre las
variables, hacemos la prueba de hipótesis sobre p:
H0: r=0
H1: r¹0
0.181
T= = 0.52
(1 − 0.1812 )
(10 − 2)
Conclusión: y por lo tanto no se rechaza H0 -es decir que las variables son
linealmente independientes-.
63
UNIDAD 2
RECOMENDACIONES PRACTICAS
64
UNIDAD 2
1
Una empresa necesita decidir acerca de la conveniencia o no de publicitar
sus servicios mediante el envío de facsímiles. Para ello ha dispuesto analizar
la relación entre el "Número de Fax enviados" y la "Cantidad de Servicios
Vendidos". Una muestra con los resultados de las últimas cinco semanas per-
mitió relevar los siguientes valores:
2. ANALISIS DE REGRESION
El análisis de regresión tiene como objetivo estimar la relación funcional que vincula
a una variable dependiente con una o varias variables independientes. En este
caso debe existir una relación de causalidad entre las variables -cosa que no
necesariamente debe ocurrir en el análisis de correlación-.
65
UNIDAD 2
Tº
Hora
Gráfico Nº 8
Como se puede apreciar, existe una clara relación -dependencia- entre la tempe-
ratura del aceite y la hora del día. Si se pudiera modelar esa relación, el Supervisor
contaría con una herramienta muy útil para administrar el proceso. Se podría, por
ejemplo, conocer de antemano la evolución de la temperatura, estimar el valor de la
temperatura en diferentes momentos del día, determinar los períodos más críticos
debido a altas o bajas temperaturas, etc., y aprovechar esa información para ope-
rar el proceso de la mejor manera posible.
66
UNIDAD 2
Veamos brevemente en qué consiste cada una de estas etapas, y las herramientas
estadísticas que se utilizan:
67
UNIDAD 2
Lo primero que hay que hacer en cualquier análisis de relación entre variables es
dibujar el diagrama de dispersión de los datos, para inspeccionar visualmente el
comportamiento conjunto de las variables analizadas. Puede ocurrir que no se aprecie
ningún tipo de vinculación entre las variables, por lo que no tiene sentido continuar
con el análisis de regresión, o por el contrario el gráfico puede ser útil para eviden-
ciar el tipo de relación existente, y facilitar la identificación del modelo más apropia-
do.
A este análisis preliminar hay que agregar toda otra información que pueda ser de
utilidad para medir la relación entre las variables, como por ejemplo el coeficiente
de correlación, que da una idea del grado de asociación lineal entre las mismas.
Una vez elegido el modelo, hay que estimar sus parámetros. Para el caso de un
modelo lineal simple, el modelo general es el siguiente:
y=α+βx
donde a y b son los parámetros poblacionales, y deben ser estimados a partir de los
datos de una muestra representativa.
y=a+bx
68
UNIDAD 2
El uso de todas estas herramientas de análisis permite establecer con bastante cla-
ridad si el modelo elegido es útil o no.
69
UNIDAD 2
• Introducción
En este apartado se ven conceptos básicos muy importantes como el análisis de
relación entre variables, el significado de regresión, los tipos de relaciones
entre variables, y el uso de los diagramas de dispersión. Resuelva los ejercicios
que propone el Texto al final del tema.
70
UNIDAD 2
Ejemplo:
Para demostrar el procedimiento de cálculo en un análisis de regresión, vamos a
retomar el ejemplo de la recta usada en el análisis de correlación:
y = 10 - 2 x
x 1 2 3
y 8 6 4
x =2 Sx2 = 1
y =6
Cov(x,y) = [32 - 3x2 x6] / (3-1) = -2
Cov ( x, y ) − 2
b= = = −2
S x2 1
a = y − b x = 6 − (−2 ∗ 2) = 10
71
UNIDAD 2
72
UNIDAD 2
RECOMENDACIONES PRACTICAS
73
UNIDAD 2
74
UNIDAD 2
2
Volvemos al ejemplo de la Actividad N°1, donde se analizaba la relación
entre el
"Número de Fax enviados" y la "Cantidad de Servicios Vendidos":
75
UNIDAD 2
3
Se estudia la relación entre el número de personas ocupadas en una tarea, y
la duración de esa tarea. Una muestra arrojó los siguientes resultados:
3. REGRESION MULTIPLE
El Jefe de Producción de la firma Campeón S.A. desea analizar el funcionamiento
de un proceso de rectificado de varillas. Pide información al Grupo de Trabajo
responsable del proceso, el cual ha estado estudiando el comportamiento del diá-
metro de las varillas a la salida de la rectificadora.
¿Cómo puede determinar el Jefe si todos estos factores son realmente significati-
vos, es decir si tienen un efecto considerable sobre el diámetro de las piezas recti-
76
UNIDAD 2
ficadas?
Por otro lado, al Jefe le interesaría predecir el diámetro de las varillas rectificadas
para distintos valores de los factores considerados, a fin de optimizar el proceso a
su cargo.
Una alternativa sería estimar un modelo lineal simple para cada uno de los factores
considerados. Sin embargo, intuitivamente el Jefe advierte que si encuentra una
herramienta capaz de concentrar toda la información disponible sobre el proceso
de rectificado, seguramente va a poder lograr mejores predicciones de la variable
de respuesta.
Una técnica que permite alcanzar ese objetivo es la regresión múltiple. Hablamos
de regresión múltiple cuando tratamos de explicar el comportamiento de la variable
dependiente en base al conocimiento de varias variables independientes.
Para estimar los parámetros del modelo, nuevamente se utiliza el método de míni-
mos cuadrados, usando los datos de una muestra y minimizando la siguiente suma:
Σ ei2 = Σ (yi - yi )2
donde yi son los valores observados e yi los valores estimados por el modelo. Los
ei se denominan errores o residuos.
77
UNIDAD 2
Pero en regresión múltiple es muy importante el análisis adicional de los residuos ei,
que deben cumplir con los siguientes supuestos para que el modelo sea válido:
• Deben tener distribución Normal, con media cero y varianza constante.
• Deben tener un comportamiento totalmente aleatorio -no deben existir patrones-
Por lo tanto, después de ver en el Texto los conceptos básicos sobre el tema, le
sugiero resolver la parte práctica usando la computadora como herramienta auxi-
liar.
Vamos a retornar al Texto, pero antes de buscar este tema específico, le sugiero
78
UNIDAD 2
repasar un par de puntos que vimos en el Capítulo anterior, y que le que le van a
servir de base para interpretar correctamente las salidas de la computadora, cual-
quiera sea el programa estadístico que use. Los temas en cuestión son los siguien-
tes:
REGRESION MULTIPLE
79
UNIDAD 2
Ejemplo
Vamos a volver al problema que está analizando el Jefe de Producción sobre el
diámetro de rectificado de una pieza.
Se dispone de los siguientes datos:
80
UNIDAD 2
5.80 1200 70 22 33
8.53 2300 75 15 24
8.45 1800 80 27 39
7.84 1900 85 20 29
8.23 2300 90 16 25
8.60 2400 80 14 21
7.40 1600 70 26 38
7.78 1400 75 32 46
5.12 1000 65 23 35
4.50 1100 85 12 17
Vamos a seguir todos los pasos necesarios para ajustar el modelo, verificar la cali-
dad del ajuste, y seleccionar el esquema más conveniente.
En primer lugar se realiza el ajuste incluyendo todas las variables independientes,
cuyos resultados se muestran a continuación:
Model fitting results
---------------------------------------------------------------------------------------------------
Independent variable coefficient std. error t-value sig.level
---------------------------------------------------------------------------------------------------
Constante -0.156288 0.609376 -0.2565 0.8013
Velocidad 0.003131 0.000085 36.6684 0.0000
Temperatura -0.00482 0.005474 -0.8805 0.3935
Cantidad de Piezas 0.094592 0.050601 1.8694 0.0826
Tiempo 0.014159 0.035337 0.4007 0.6947
---------------------------------------------------------------------------------------------------
R-SQUARED = 0.9893
Esta Tabla indica que el resultado del ajuste es satisfactorio, ya que el coeficiente de
determinación es alto -el modelo explica un 98,93 % de la variación del diámetro-
.
81
UNIDAD 2
Analizando las pruebas sobre los coeficientes, se ve que solamente el factor "velo-
cidad" es altamente significativo.
La prueba sobre el modelo global dio los siguientes resultados:
Analysis of Variance for the Full Regression
---------------------------------------------------------------------------------------------------
Source Sum of Squares DF Mean Square F-Ratio P-value
---------------------------------------------------------------------------------------------------
Model 66.3771 4 16.5943 418.265 .0000
Error 0.555437 14 0.0396741
---------------------------------------------------------------------------------------------------
Total (Corr.) 66.9325 18
Esta prueba permite confirmar que el modelo globalmente es satisfactorio, pues el
índice F es altamente significativo, lo que indica que al menos uno de los factores es
significativo.
Finalmente, analizamos la matriz de correlaciones cruzadas:
Correlation matrix for coefficient estimates
---------------------------------------------------------------------------------------------------
Constante Velocidad Temperatura Cant.Piez.
Constante 1.0000 -.6495 -.9190 .0093
Velocidad -.6495 1.0000 .4031 -.0009
Temperatura -.9190 .4031 1.0000 .0230
Cantidad de Piezas .0093 -.0009 .0230 1.0000
Tiempo -.1237 .0670 .0537 -.9868
---------------------------------------------------------------------------------------------------
En esta matriz se advierte que la "constante" está fuertemente correlacionada con la
"temperatura", y en menor medida con la velocidad; por lo tanto se puede intentar
descartar la constante. Igualmente existe una alta correlación entre "cantidad de
piezas desde el último diamantado" y "tiempo desde el último diamantado", lo cual
intuitivamente es lógico, ya que ambas miden más o menos el mismo efecto; por lo
tanto hay que descartar alguna de las dos, dejando la variable más fácil de medir,
que en este caso es la "cantidad de piezas".
El siguiente paso es el análisis de los residuos del modelo.
82
UNIDAD 2
Residuals
Gráfico Nº 9
Por último, se analiza la gráfica de los residuos vs. los valores predichos de la
variable:
Residuals
Predicted
Gráfico Nº 10
83
UNIDAD 2
84
UNIDAD 2
Se ve que las dos variables que permanecen en el modelo se hacen todavía más
significativas, mientras que el coeficiente de determinación prácticamente no varía.
La prueba sobre el modelo bajo estas condiciones produce los siguientes resulta-
dos:
85
UNIDAD 2
Dado que todas las evidencias confirman que los resultados son satisfactorios, se
adopta en definitiva el siguiente modelo:
y = 0.003 x1 + 0.103 x2
86
UNIDAD 2
RECOMENDACIONES PRACTICAS
87
UNIDAD 2
o del error estándar de estimación; realizar las pruebas de hipótesis sobre los
parámetros del modelo, y sobre el modelo en general; determinar la correla-
ción cruzada entre las variables independientes; efectuar el análisis de los
residuos, verificando que tengan un comportamiento aleatorio, distribución
Normal, media cero y varianza constante.
4
Se desea encontrar un modelo que permita predecir la variable y:"indice de
productividad de un operario" en función de las variables independientes x1:
"cantidad de horas de entrenamiento del operario" y x2: "antigüedad del ope-
rario en su función". Una muestra de 25 operarios produjo los siguientes
resultados:
36.70 15 20
34.74 14 20
22.95 12 18
46.76 18 31
61.26 24 56
21.35 9 16
50.32 22 30
33.67 14 23
65.19 25 52
88
UNIDAD 2
48.76 21 29
24.68 11 20
25.33 11 19
24.08 12 17
23.37 10 18
45.87 19 28
27.29 12 19
32.89 14 22
28.01 13 19
32.64 13 23
34.54 15 20
17.41 7 16
20.36 9 17
15.78 6 14
41.68 16 24
28.00 11 19
Utilizando un programa estadístico, identifique el modelo apropiado.
89
UNIDAD 2
Conclusiones
Una de las aplicaciones más comunes de este análisis consiste en predecir el valor
de una variable difícil de medir, o cuya evaluación es muy costosa, en base al cono-
cimiento de otras variables conocidas o fáciles de determinar.
Después de explorar esta Unidad se espera que usted sea capaz de:
Los temas desarrollados en esta Unidad forman parte de las técnicas explicativas
de la estadística, ya que se busca explicar el comportamiento de una variable aleatoria
en base a la modelación de la relación con los factores que la afectan.
90
UNIDAD
2
SOLUCIONES A LAS
ACTIVIDADES DE PROCESO
UNIDAD 2
2. a. y = -5 + 0.88 x
b. Se = 25.83
c. r2 = 0.35 Un 35 % de la variación en las ventas es explicado por el modelo
estimado.
d. Testimado = 1.27 Tcrítico = ±3.182
Conclusión: la pendiente de la recta de regresión no es significativa.
e. No corresponde.
91
UNIDAD 2
ficativos.
Prueba sobre el modelo: el modelo es satisfactorio.
Matriz de correlaciones cruzadas: existe un fuerte grado de aso-
ciación lineal entre las dos variables independientes.
Segundo Paso: Se elimina del ajuste la variable menos significativa -antigüedad
del operario-.
Modelo estimado: y = 2.41 x1
r2 = 0.9951 Baja muy poco con respecto al ajuste anterior,
y el modelo resultante es más simple.
Pruebas sobre los coefic.: el único parámetro resulta más signi-
ficativo aún.
Prueba sobre el modelo: el modelo es satisfactorio.
Análisis de los residuos: residuos normales, independientes, con
media cero y varianza constante.
Conclusión: se adopta el modelo y = 2.41 x1
92
UNIDAD
2
ACTIVIDADES DE
AUTOEVALUACION
UNIDAD 2
93
UNIDAD 2
21. Explique qué es una regresión múltiple, y cuáles son sus ventajas. Escriba el
modelo general.
22. ¿Cómo se realiza el ajuste de un modelo lineal múltiple?
23. Explique qué herramientas se usan para verificar la consistencia del modelo
ajustado.
24. Especifique cuáles son las precauciones que hay que tener en cuenta en un
análisis de relación entre variables.
25. Considerando los valores de diámetro del resorte tipo "RRR" usados en las
Actividades de Autoevaluación de la Unidad Nº1, se sospecha que durante el pri-
mer tramo de la producción los diámetros aumentan como consecuencia de la dila-
tación del mandril de enrollamiento. Para comprobar si esto es cierto, tomar los
primeros 40 datos de la serie como variable dependiente, y el tiempo como variable
independiente, y efectuar el siguiente análisis:
94
SERIES DE
TIEMPO
UNIDAD
3
UNIDAD
3
UNIDAD 3
ORIENTACIÓN DEL
APRENDIZAJE
Demanda de Resortes
1.6
1.4
1.2
1
Unidades
Pedidas 0.8
[en mill.]
0.6
0.4
0.2
0
I II III IV I II III IV I II III IV I II III IV I II III IV
Trimestre
Gráfico Nº 1
98
UNIDAD 3
Esquema
Tema
Conceptual
Series de Tiempo
Objetivo
General
Describir el comportamiento
de una serie cronológica de datos
Objetivos
Específicos
Efectuar el Efectuar un
análisis clásico análisis
de una serie avanzado
mediante el uso
de software
estadístico
est estadístico
Herramientas
usadas
Descomposición y Identificación de la
modelación de las estructura de la
componentes básicas serie mediante el
de la serie uso de funciones
estadísticas
avanzadas
99
UNIDAD 3
Objetivos del
100
UNIDAD 3
MODALIDAD DE TRABAJO
Bibliografía Obligatoria
LEVIN, Richard y RUBIN, David. Estadística para Administradores. Sexta Edición. Editorial
Prentice-Hall. México.1996.
101
UNIDAD 3
Demanda de Resortes
1.6
1.4
1.2
1
Unidades
Pedidas 0.8
[en mill.]
0.6
0.4
0.2
0
I II III I I II III I I II III I I II III I I II III I
Trimestre
1.4
1.2
Unidades 0.8
Pedidas
[en mill.] 0.6
0.4
0.2
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Año
102
UNIDAD 3
0.8
0.7
0.6
0.5
Unidades 0.4
0.3
0.2
0.1
0
I II III IV
Trimestre
Demanda
0.7
0.6
0.5
0.4
Unidades
0.3
0.2
0.1
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Año
103
UNIDAD 3
a. Análisis de la Tendencia
1.6
1.4
1.2
1
Unidades
0.8
Pedidas
0.6
0.4
0.2
0
I II III IV I II III IV I II III IV I II III IV I II III IV
Trimestre
0.8
0.7
0.6
0.5
Unidades
0.4
Pedidas
0.3
0.2
0.1
0
I II III I I II III I I II III I I II III I I II III I
Trimestre
104
UNIDAD 3
Si la tendencia no es lineal, se pueden aplicar otros modelos, como por ejemplo una
ecuación de segundo grado, del tipo: y = a + bx + cx2. El ajuste se realiza igual-
mente por mínimos cuadrados.
Demanda
1.4
1.2
0.8
Unidades
0.6
0.4
0.2
0
1 2 3 4 5
Año
Este análisis resulta apropiado para datos no inferiores al año. Una parte de la
variación de la serie es explicada por la tendencia, y el resto por las componentes
cíclica e irregular. Para aislar e identificar la componente cíclica, se pueden calcular
los residuos cíclicos, como diferencia entre el valor observado y el valor estimado
por el modelo de tendencia: ei = yi - i
El signo de los residuos indica el tipo de ciclo que presenta la serie -cresta o valle-
mientras que su valor representa la magnitud o importancia del ciclo. Una forma de
facilitar su interpretación es calculando un índice relativo: (yi - i) / yi Cuando
el índice es nulo, significa que el valor observado coincide con el estimado por el
modelo de tendencia, lo que indica ausencia de variación cíclica. Cuanto más se
aleja este índice de cero -positiva o negativamente-, más acentuado es el ciclo
presente en los datos. Este índice se puede volcar en un gráfico que pone rápida-
mente en evidencia el comportamiento de la serie después de remover la tendencia.
105
UNIDAD 3
D em anda de R esortes
0. 3
0. 2
0. 1
R e sid u o s
0
C í cl ic o s
1 2 3 4 5 6 7 8 9 1 0 1 1 12 13 1 4 1 5 16 17 1 8 1 9 20
-0. 1
-0. 2
-0. 3
Año
Este análisis se puede realizar para datos semanales, mensuales, trimestrales, etc.,
es decir siempre menores a un año.
Una técnica muy útil en este caso es el cálculo de promedios móviles, que permite
suavizar las fluctuaciones de la serie, y facilitar la identificación de la componente
estacional. El número de términos considerados para el cálculo del promedio puede
variar, pero a medida que su valor aumenta, las irregularidades de la serie van des-
apareciendo, poniendo más en evidencia las componentes presentes en la serie.
0.8
0.7
0.6
0.5
Unida de s
0.4
P e did a s
0.3
0.2
0.1
0
I III I III I III I III I III
T rim e stre
106
UNIDAD 3
Finalmente, tanto el Gerente General como el Administrativo saben que, aún cuan-
do hayan podido modelar adecuadamente las componentes anteriores, lo mismo va
a quedar una variación irregular como resultado de la acción de diversos factores
aleatorios, que no son fáciles de representar. Cuando alguno de estos factores tiene
una incidencia determinante sobre el comportamiento de la serie -provocando un
brusco pico o caída-, resulta importante identificar el punto y asignar la causa de la
variación, para facilitar la interpretación del comportamiento de la serie, y tener en
cuenta la ocurrencia de estos imponderables al efectuar un pronóstico.
SERIES TEMPORALES
• Introducción
• Tipos de variación
• Análisis de tendencia
• Variación cíclica
• Variación temporal
• Variación irregular
Al final de los dos primeros temas, y de los dos últimos, figuran una serie de pregun-
tas conceptuales, que le conviene analizar y responder, ya que le facilitarán la
internalización de los conceptos presentados.
107
UNIDAD 3
REVISION DE CONCEPTOS DESARROLLADOS
108
UNIDAD 3
RECOMENDACIONES PRACTICAS
• Durante este análisis preliminar de la serie, puede ser útil identificar las
variaciones irregulares muy pronunciadas, a las que se pueda asignar una
causa concreta.
109
UNIDAD 3
1
La siguiente serie representa las ventas anuales de un electrodoméstico, du-
rante el período 1980-1996:
b. Modele la tendencia.
110
UNIDAD 3
2
La siguiente serie representa las ventas de otro electrodoméstico, discrimina-
das mes a mes, durante el período 1990-1994:
Año 1990 Año 1991 Año 1992 Año 1993 Año 1994
Mes Venta Mes Venta Mes Venta Mes Venta Mes Venta
a. Dibuje la serie.
111
UNIDAD 3
a. Función de Autocorrelación
Para determinar la Función de Autocorrelación (FAC) hay que seguir los siguientes
pasos:
Una serie con tendencia tiene una FAC con la siguiente forma:
Gráfico Nº 2
112
UNIDAD 3
Función de Autocorrelación
1
0.8
0.6
0.4
0.2
r 0
1 2 3 4 5 6 7 8 9 10 11 12 13 14
-0.2
-0.4
-0.6
-0.8
-1
Retardo
Gráfico Nº 3
Función de Autocorrelación
0.8
0.6
r 0.4
0.2
0
1 2 3 4 5 6 7 8 9 10
-0.2
Retardo
Gráfico Nº 4
Una serie que tiene autocorrelación hasta retardo de orden 3, tendría una FAC
113
UNIDAD 3
aproximadamente así:
Función de Autocorrelación
0.8
0.6
r 0.4
0.2
0
1 2 3 4 5 6 7 8 9 10
-0.2
Retardo
Gráfico Nº 5
Una serie con una estructura totalmente aleatoria, es decir que no está afectada por
la acción de ninguna componente, tiene una FAC muy particular, en la cual los
coeficientes de correlación para diferentes retardos son todos parecidos, y sus va-
lores no son significativos -la autocorrelación es prácticamente nula-:
Función de Autocorrelación
0.5
0.4
0.3
0.2
0.1
r 0
-0.1 1 2 3 4 5 6 7 8 9 10
-0.2
-0.3
-0.4
-0.5
Retardo
Gráfico Nº 6
114
UNIDAD 3
H0: ρτ = 0
H1: ρτ ≠ 0
Una serie con tendencia concentra las varianzas en la frecuencia cero, como se ve
en la siguiente figura:
Función de Densidad Espectral
0.01
0.009
0.008
0.007
0.006
Var 0.005
0.004
0.003
0.002
0.001
0
0.02 0.06 0.1 0.14 0.18 0.22 0.26 0.3 0.34 0.38
Fecuencia
115
UNIDAD 3
0.01
0.009
0.008
0.007
0.006
Var 0.005
0.004
0.003
0.002
0.001
0
0.02 0.06 0.1 0.14 0.18 0.22 0.26 0.3 0.34 0.38
Fecuencia
Gráfico Nº 7
0.01
0.009
0.008
0.007
0.006
Var 0.005
0.004
0.003
0.002
0.001
0
0.02 0.06 0.1 0.14 0.18 0.22 0.26 0.3 0.34 0.38
Fecuencia
Gráfico Nº 8
116
UNIDAD 3
RECOMENDACIONES PRACTICAS
117
UNIDAD 3
Ejemplos:
a. Gráfica de la serie:
25
20
15
Ventas
10
0
1 6 11 16 21
Años
118
UNIDAD 3
b. Función de Autocorrelación:
0.9
0.8
0.7
0.6
0.5
r
0.4
0.3
0.2
0.1
0
1 2 3 4 5 6 7 8 9
retardo
2000
1500
Var 1000
500
0
0 0.1 0.2 0.3 0.4 0.5
Frecuencias
Año
Mes 1989 1990 1991 1992 1993
1 11.2 12.5 12.6 13.2 13
2 11 12 12 12.5 12.7
3 12.7 13.9 14.2 14.4 14.8
4 14.3 15.4 15.6 15.8 15.9
5 16.2 17 17.1 17.1 17.1
6 17.7 18.2 18.3 18.1 17.7
7 18.4 18.6 18.9 18.7 17.9
8 18.6 18.8 19.3 18.9 18
9 18.1 18.4 18.7 18.1 16.8
10 18 18.2 18.7 17.8 16.3
11 16.7 17.1 17.7 16.7 14.7
12 14.2 14.5 15 14 12.2
119
UNIDAD 3
a. Gráfica de la serie:
21
19
17
Gastos
15
13
11
9
1 11 21 31 41 51
Mes
b. Función de Autocorrelación:
1
0.5
r 0
1 10 19
-0.5
-1
retardo
300
250
200
Var 150
100
50
0
0 0.0833 0.1667 0.25 0.3333 0.4167 0.5
Frecuencias
120
UNIDAD 3
121
UNIDAD 3
a. Gráfica de la serie:
133.6
133.4
Diámetro
133.2
133
132.8
132.6
1 21 41 61 81 101 121
Tiempo
b. Función de Autocorrelación:
0.5
0.3
0.1
r
-0.1 1 11 21
-0.3
-0.5
retardo
122
UNIDAD 3
Conclusiones
Los principales aspectos abordados sobre el tema han sido los siguientes:
123
UNIDAD
3
SOLUCIONES A LAS
ACTIVIDADES DE PROCESO
UNIDAD 3
2. b. Cálculo del índice estacional para cada uno de los 12 meses del año:
Mes 1 2 3 4 5 6
Media Modif. 105.53 105.90 114.17 105.55 115.32 111.28
Media Ajustada 105.1 105.4 113.7 105.1 114.8 110.8
Mes 7 8 9 10 11 12
Media Modif. 79.22 54.86 101.05 113.86 110.44 88.22
Media Ajustada 78.9 54.6 100.6 113.3 109.9 87.8
124
UNIDAD 3
3. Tanto la FAC como la FDE indican con claridad la existencia de una tendencia
en la serie ananlizada.
4. La FAC de la serie indica la existencia de ciclos. La FDE indica que los ciclos
se repiten en períodos de longitud L=1/0.0833=12 intervalos - cada 12 me-
ses-, poniendo de manifiesto que se trata de ciclos estacionales.
125
UNIDAD
3
ACTIVIDADES DE
AUTOEVALUACION
UNIDAD 3
1. Explique qué es una serie de tiempo, y cuáles son los objetivos de su análisis.
2. ¿Qué tipos de variaciones están presentes en una serie temporal, y qué repre-
senta cada una?
14. ¿Qué precauciones hay que tener al utilizar los resultados del análisis de una
serie?
15. En base a los valores de diámetro del resorte tipo "RRR" usados en las Activi-
dades de Autoevaluación de la Unidad Nº1, efectúe un análisis convencional de la
serie, desde la observación Nº 30 hasta la Nº 60. Identifique y modele las compo-
nentes presentes.
16. Considerando los últimos 60 datos de la serie de diámetros del resorte tipo
"RRR", realice el análisis de la serie empleando la FAC y la FDE. Elabore un bre-
ve informe especificando el comportamiento de la serie.
126
CONTROL DE L A
CALIDAD
UNIDAD
4
UNIDAD
4
UNIDAD 4
ORIENT A C I ” N DEL
RIENTA
A PRENDIZAJE
Si bien existen numerosas definiciones de calidad, una que está muy en boga y que
de alguna manera expresa la idea básica es la siguiente: "calidad es cumplir con
los requisitos del cliente".
¿Cómo se puede determinar si un producto cumple con los requisitos del cliente?
Para ello es necesario controlar sus principales propiedades.
Para garantizar la calidad del producto, no basta con utilizar la mejor materia prima
posible, tener mano de obra capacitada, buena maquinaria, etc., sino que es nece-
sario medir periódicamente los resultados del trabajo realizado para establecer
fehacientemente si se ajustan a lo esperado.
126
UNIDAD 4
Es conveniente remarcar que el enfoque moderno de la calidad va más allá del mero
control: la calidad se "planifica", se "controla", y se "mejora", es decir que debe
entenderse como un proceso continuo. Por lo tanto, si bien en esta Unidad nos
vamos a ocupar principalmente de la etapa de control, la calidad empieza mucho
antes, en la planificación y aplicación de políticas de calidad, se retroalimenta con
los controles, y continúa con la implementación de acciones que tiendan a un mejo-
ramiento continuo de los procesos.
127
UNIDAD 4
Esquema
Tema
Conceptual
Control de la Calidad
Objetivo
General Controlar la calidad de productos y
servicios, evaluar la variabilidad de
procesos y mejorar continuamente
su rendimiento.
Objetivos
Específicos
Planificar y Estudiar y
administrar controlar la
eficientemente la variabilidad de un
calidad proceso
Herramientas
usadas
Calidad total, grupos Cartas de control
de trabajo, por variables y por
herramientas para atributos
trabajo en grupo
(Pareto, espina de pez,
etc.)
128
UNIDAD 4
Objetivos del
Conocer la filosofía moderna de la calidad Aprendizaje
Contenidos
1. Control de la calidad.
129
UNIDAD 4
MODALIDAD DE TRABAJO
Bibliografía Obligatoria
130
UNIDAD 4
1. CONTROL DE LA CALIDAD
50
Frec. [%]
40
30
20
10
0
Diámetro Altura
Diámetro Pintura Embalaje Otros
Pintura Otros
Reclamos
Gráfico Nº 1
Según se desprende del gráfico, las dos principales causas de reclamos son el diá-
metro y la altura de los resortes. Estas dos variables se denominan en la jerga
industrial características de calidad, ya que miden propiedades relevantes del
producto que condicionan su correcto desempeño.
El grupo de trabajo decide encarar primero el análisis del diámetro de los resortes.
131
UNIDAD 4
Máquina Materiales
Horno
Rodillo
Mandril Proveedor Dureza
Diámetro
Experiencia Puesta a Punto
Capacitación Turbulencias
Velocidad
Mantenimiento
El grupo identifica los factores que considera relevantes para estudiarlos con mayor
profundidad, y simultáneamente comienza a elaborar alternativas de acciones a corto
y mediano plazo tendientes a mejorar el proceso de fabricación.
Por su parte el estadístico del grupo descarga toda la batería de herramientas útiles
para este tipo de análisis:
132
UNIDAD 4
133
UNIDAD 4
dad total. En estos dos apartados usted va a encontrar información general sobre
los principales conceptos relativos a la calidad: definición, gestión de la calidad,
herramientas usuales, estudio de la variabilidad, e importancia del mejoramiento
continuo de la calidad. Resuelva la ejercitación propuesta al final de ambos temas.
REVISION DE CONCEPTOS DESARROLLADOS
134
UNIDAD 4
RECOMENDACIONES PRACTICAS
135
UNIDAD 4
La fábrica está por lanzar un nuevo modelo de resortes, así es que se decide apro-
vechar el mismo para efectuar un estudio piloto sobre los diámetros. Las especifi-
caciones de ingeniería establecen que el diámetro de estos nuevos resortes debe
oscilar entre los 132 y 134 mm.
136
UNIDAD 4
Una vez finalizada la prueba, se procesan sus resultados y se analizan en una re-
unión grupal.
133.6
133.4
DIAMETRO
133.2
133.0
132.8
132.6
1 8 15 22 29 36 43 50 57 64 71 78 85 92 99 106 113 120
Número de Observación
DIAMETRO
1.0
FAC
.5
0.0
-.5
Confidence Limits
-1.0 Coefficient
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Lag
137
UNIDAD 4
133.6
133.4
133.2
133.0
132.8
132.6
N = 125
DIAM ETRO
Las principales medidas analíticas calculadas para la serie disponible son las si-
guientes:
Gráfico Nº 2
138
UNIDAD 4
Tipos de variación
Por lo tanto, las causas especiales de variación pueden ser eliminadas tomando
acciones locales, dispuestas por el responsable del proceso, inmediatamente des-
pués que han sido detectadas. En cambio, las causas comunes de variación no son
tan fáciles de identificar, y para lograr su reducción es necesario tomar acciones a
nivel de sistema, que resultan más complejas y costosas, por lo que requieren
generalmente la intervención de la Dirección.
139
UNIDAD 4
140
UNIDAD 4
Cartas de Control
Si ninguna de las hipótesis nulas se rechaza, significa que, para el nivel de significa-
ción elegido y para los datos disponibles, no hay evidencia como para rechazar que
la media y el desvío del proceso sean iguales a los valores objetivos.
Una de las ventajas de esta forma de control es que, como se basa en el uso de
muestras, en general requiere pocas mediciones. La frecuencia de muestreo y el
tamaño de las muestras depende del tipo de proceso y de la característica de cali-
dad que se controla, pero generalmente conviene trabajar con muestras pequeñas
141
UNIDAD 4
lo más frecuentes posibles. Otra ventaja del método es que brinda información
sobre la evolución de las principales propiedades del proceso.
Sin embargo, se puede objetar el hecho de que resulta una forma de control un
tanto compleja, ya que exige efectuar una prueba de hipótesis con los datos de
cada muestra, algo difícil de realizar por un operador al pie de la máquina. Por este
motivo, Walter Shewart, un estadístico americano, ideó en la década del '30 una
forma gráfica de realizar estas pruebas: las cartas de control.
Las cartas son diagramas que se usan para controlar el comportamiento de varia-
bles cuantitativas o cualitativas -atributos-.
Como cada tipo de carta presenta sus propias reglas de tratamiento, desarrollamos
las principales características de cada una.
Vamos a analizar los gráficos más usados en la práctica, que son las cartas de
control de medias-rangos.
Los diagramas x-R son dos gráficos, uno de los cuales controla la media del proce-
so, y el otro la dispersión. Son fáciles de construir e interpretar, por lo que pueden
ser manipulados directamente por el operador del proceso.
133.25
DIA M E TRO
UCL = 133.4019
Average = 133.2109
142
UNIDAD 4
.8
.6
Range
.4
DIA M E TRO
.2 UCL = .7003
A verage = .3312
Usted debe estar haciéndose la siguiente pregunta: ¿cómo sabe el operador si el proceso
está estable?
Primero hay que aclarar que Shewart planteó el método con el supuesto de que la caracte-
rística controlada tiene distribución Normal. Por lo tanto, antes de implementar las cartas de
control hay que hacer la verificación de normalidad.
Shewart propuso utilizar como regla de decisión, para aceptar o rechazar la hipótesis nula,
un cierto intervalo alrededor del valor objetivo. Para el caso de la media, la cantidad gene-
ralmente utilizada son 3 desvíos alrededor de la media, y a los valores ubicados a esa
143
UNIDAD 4
0.4
0.3
0.2
0.1
0
95 97 99 101 103 105
media
Gráfico Nº 5
144
UNIDAD 4
Por lo tanto, la carta de control sirve para identificar la acción de causas especiales
de variación que tornan al proceso inestable. Esto obliga al operador a reaccionar
en forma inmediata, investigando la causa de la inestabilidad, y tomando acciones
correctivas para eliminar su efecto. Una vez logrado esto, se puede continuar traba-
jando normalmente, es decir solamente bajo la acción de las causas comunes de
variación.
¿Por qué se trabaja con un nivel de significación tan bajo - sólo el 0.26 % -?
Recordemos que el nivel de significación mide la probabilidad de rechazar una hi-
pótesis verdadera, y en la carta de control eso significa rechazar que el proceso esté
estable cuando en realidad lo está. Si la carta indica que el proceso está inestable,
hay que reaccionar, generalmente parando el proceso y buscando la causa de la
inestabilidad. Esto lleva tiempo, y la parada puede resultar muy costosa. Si las
señales de inestabilidad son frecuentes, y en muchos casos las alarmas resultan
injustificadas, se termina provocando un sentimiento de desconfianza hacia el méto-
do, e inclusive el personal dejará de reaccionar cuando existan puntos fuera de
control. Para evitar esta situación, se trabaja con un nivel de significación muy bajo,
tratando de minimizar la probabilidad de dar alarmas falsas.
Señales de inestabilidad
145
UNIDAD 4
Una de las ventajas fundamentales de las cartas de control es que permiten identifi-
car la acción de causas especiales de variación, inclusive antes de encontrar puntos
fuera de los límites de control.
Otra de las ventajas reside en el hecho de que los diagramas permiten hacer un
seguimiento del proceso en el tiempo, pudiéndose analizar la evolución de la media
y de la dispersión. En los gráficos resulta fácil visualizar de qué manera repercuten
todos los cambios y modificaciones realizados, y en especial el impacto de las
acciones tomadas con el propósito de mejorar el funcionamiento del proceso
Para interpretar las cartas de control, conviene proceder del siguiente modo: prime-
ro se analiza la carta de rangos. Si los rangos están inestables, significa que la dis-
persión está fuera de control, y en ese caso también la carta de medias va a acusar
problemas. Si la carta de rangos está bajo control, se observa la carta de medias. Si
las dos cartas no muestran señales de inestabilidad, significa que el proceso está
estable. Si los rangos están estables, pero no así las medias, significa que hay pro-
blemas con el centrado del proceso.
Gráfico Nº 6
146
UNIDAD 4
Ejemplo:
Vamos a usar las cartas de control con los 125 datos de diámetro de resortes
obtenidos en la producción experimental del nuevo tipo de resortes. Agrupamos las
observaciones consecutivas en subgrupos de 5 elementos. Posteriormente calcula-
mos la media general y el rango medio de los 25 subgrupos que quedan, y final-
mente calculamos los límites de control. Las cartas de control resultantes de medias
y rangos son las que se muestran al principio de este apartado.
147
UNIDAD 4
2.2 Cartas de control por atributos
Los atributos toman valores no numéricos, y por lo tanto no es posible aplicar las
cartas por variables. Pero en el caso planteado, se puede calcular la fracción de
productos no conformes, y llevar un control periódico de esta cantidad.
H0: p = p0
H1 : p p 0
148
UNIDAD 4
Si el tamaño del lote es constante, los límites de control permanecen fijos. En cam-
bio, si el número de unidades considerados cambia en cada nuevo control, los
límites de control son variables, complicando un poco el trazado -y a veces la inter-
pretación- de la carta.
Ventajas y desventajas
La principal desventaja de las cartas p es que como los atributos son datos no
numéricos, su tratamiento es mucho más restringido que el de una variable, y por lo
tanto el análisis y las conclusiones son bastante menos "jugosas". Además, como se
requiere trabajar con lotes relativamente grandes, generalmente pasa mucho tiempo
entre punto y punto, limitando la capacidad de reacción en base a la información
brindada por las cartas.
149
UNIDAD 4
Ejemplo:
Generalmente se producen lotes de entre dos mil y tres mil resortes. Para tener una
idea si las condiciones del proceso son adecuadas, se toma una muestra de los
primeros trecientos resortes, se cuenta el número de piezas no conformes -bajas de
carga-, y se calcula la fracción de piezas rechazadas en cada muestra. Este valor se
vuelca en la carta de control.
.04
Proportion Nonconforming
.03
.02 RE CH
UCL = .0352
.01
Center = .0145
Lote N°4: punto por encima del límite de control superior. Revisando las
anotaciones, se pudo determinar que ese día trabajó en el puesto de carga un ope-
rador no experimentado, lo que justifica el elevado nivel de piezas no conformes. El
Supervisor del proceso dispuso entrenar en esa tareas a varios operadores, de
manera que se puedan efectuar relevos necesarios sin afectar la calidad de la pro-
ducción
150
UNIDAD 4
Lotes N°10 al 16: racha de puntos por encima de la media. Después de analizar
la información disponible, el Supervisor determinó que durante esos días el respon-
sable del proceso de revenido había seteado incorrectamente la temperatura del
Horno, lo que afectó en forma negativa la carga de los resortes. Como medida
preventiva, se dispuso mantener una comunicación fluida entre los responsables de
los distintos procesos para evitar en el futuro estos inconvenientes.
151
UNIDAD 4
RECOMENDACIONES PRACTICAS
Antes de implementar una carta por variables del tipo propuesto por Shewart,
es necesario verificar la normalidad de la característica a controlar.
152
UNIDAD 4
Los límites de control " 3 " no son los únicos posibles. Se pueden utilizar
límites más estrictos o más flexibles, dependiendo de varios factores, princi-
palmente la importancia de la característica a controlar, y del riesgo que re-
presenta una no conformidad en una unidad que llegue a manos del cliente. Al
modificar el ancho de los límites varía el nivel de significación de la prueba,
pero en general se tiende a trabajar con valores bajos para evitar dar alarmas
injustificadas.
Las herramientas del CEP son unos de los mejores aliados con que cuenta
un grupo de trabajo interesado en la mejora continua de los procesos a su
cargo.
153
UNIDAD 4
2
El Grupo de Trabajo responsable del lanzamiento del nuevo modelo de re-
sortes, tiene que controlar también la "dureza de revenido" de los resortes.
Después de analizar el tema, ha decidido implementar una carta de control de
medias-rangos, tomando muestras de 3 piezas cada 2 horas de producción.
Durante la primer semana de trabajo, los valores registrados fueron los si-
guientes:
154
UNIDAD 4
3
El nuevo modelo de resortes producidos por la firma Campeón presenta
problemas de pintura, especialmente con algunos detalles de terminación. En
forma preventiva, y hasta evaluar la verdadera magnitud del problema, el
ingeniero de proceso decide implementar una carta p. Durante esta etapa de
estudio se inspeccionan visualmente el 100 % de los resortes pintados. La
producción se encuentra estabilizada en alrededor de 2500 piezas por día.
Al final de cada jornada de trabajo se cuenta el número de resortes con fallas
en la pintura. Los resultados durante los últimos 21 días fueron los siguientes:
155
UNIDAD 4
1 105 8 110 15 99
2 140 9 125 16 102
3 98 10 98 17 102
4 125 11 115 18 89
5 125 12 108 19 103
6 110 13 95 20 97
7 132 14 112 21 99
156
UNIDAD 4
Conclusiones
El control de la calidad es una de las actividades más importantes dentro del enfo-
que moderno de la calidad, ya que tiende a garantizar que los bienes y servicios
producidos cumplan con las expectativas del cliente, y facilita el comienzo de un
proceso de mejoramiento continuo.
Definición de calidad
Significado del control de la calidad
Diferencia entre detección y prevención de problemas
Herramientas de diagnóstico: diagrama de Pareto, espina de pez
Fuentes de variación
Uso de las especificaciones, y concepto de no conformidad
Concepto de mejoramiento continuo de procesos
Otro de los aspectos relevantes de esta Unidad fue el estudio de la variabilidad, que
resulta de fundamental importancia para entender el comportamiento de un proce-
so, determinar cuando se está trabajando correctamente, y evaluar los resultados
de las acciones tomadas en pos del mejoramiento continuo. Los principales con-
ceptos abordados fueron los siguientes:
157
UNIDAD
4
UNIDAD 4
SOLUCIONES A LAS
A CTIVIDADES DE PROCESO
1. a. Fijar claramente los objetivos del grupo, definir sus integrantes y la responsa-
bilidad de cada uno, y evaluar los recursos disponibles. Usar todas las herra-
mientas disponibles para identificar los problemas de la línea, por ejemplo el
diagrama de Pareto. Establecer inmediatamente controles en los procesos
con problemas. Definir las características de calidad que van a ser medidas.
Armar o revisar la espina de pez de las características controladas, para iden-
tificar los factores que la afectan. Identificar todas las oportunidades de me-
jora del proceso, proponiendo alternativas concretas de solución.
b. Dado que se trata de un proceso nuevo, lo razonable es implementar inicial
mente un control sobre el 100 % de la producción para verificar los diáme-
tros de las piezas, hasta tanto se compruebe que el proceso es capaz de
cumplir con las especificaciones del cliente.
c. Utilizando alguna técnica explicativa de la estadística, como por ejemplo el
análisis de regresión.
d. El grupo debe fijarse como objetivo la reducción permanente de la variabili-
dad del proceso. La espina de pez puede facilitar la individualización de los
factores a considerar: capacitar mejor al personal de operación, aumentar la
frecuencia de mantenimiento de los equipos, plantear mayores exigencias a
los proveedores, optimizar los parámetros de puesta a punto del proceso,
etc.
158
UNIDAD 4
159
UNIDAD
4
A CTIVIDADES DE
A UTOEV
UTOEV ALUACION
OEVALUACION
UNIDAD 4
160
UNIDAD 4
proceso de enrollamiento, atribuible a una mala puesta a punto del proceso. Para
verificar las condiciones de la puesta a punto, se toma regularmente una muestra de
los primeros 100 resortes fabricados desde el comienzo de la producción, y se
cuenta el número de resortes con deformaciones. Los resultados registrados duran-
te las últimas 25 jornadas de producción son los siguientes:
4 7 4 9 5 9 5 7 4 3 5 8 5 6 6 10 7 4 3 3 3 0 5 5 3
Con estos datos confeccionar una carta de control p para la proporción de resortes
con deformaciones, e interpretar el diagrama obtenido.
161
DISEÑO DE
EXPERIMENTOS
UNIDAD
5
UNIDAD
5
UNIDAD 5
ORIENTACIÓN DEL
APRENDIZAJE
La firma tiene dos proveedores de varillas de acero, así que el Ingeniero de Proce-
so decide tomar una muestra aleatoria de varillas de cada uno, y realizar una prueba
de comparación de medias poblacionales, para comprobar si existen diferencias
significativas en el diámetro obtenido con las dos fuentes de materia prima. Aplican-
do esta técnica se puede determinar el efecto de la materia prima sobre los diáme-
tros producidos.
164
UNIDAD 5
REPETICIONES
TEMPERATURA 1 2 3 4 5 Media Desvío
Baja 132.52 132.75 132.46 132.31 132.59 132.53 0.0726
Media 132.70 132.51 132.45 132.57 132.31 132.51 0.0645
Alta 133.02 132.78 133.06 133.20 132.94 133.0 0.0693
¿Existen diferencias importantes entre los diámetros obtenidos para las tres tempe-
raturas de calentamiento? Una forma expeditiva de analizar los resultados obteni-
dos es graficando el diámetro medio obtenido para cada una de las condiciones de
trabajo del horno.
133.5
133.25
133
Diámetro
132.75
132.5
132.25
132
0 1 2 3 4
Tem peratura
165
UNIDAD 5
El diagrama parece sugerir que efectivamente los diámetros son diferentes. ¿Cómo
se puede comprobar en forma objetiva si esto realmente es así? Utilizando la técni-
ca denominada análisis de varianza, que permite comparar varias medias
poblacionales simultáneamente.
Esta técnica también se puede utilizar para comparar varios factores simultánea-
mente – dos o más –. Para ello debemos realizar un experimento donde intervengan
todos los factores de interés.
Además, uno de los integrantes del grupo, muy perspicaz, hace la observación
de que, combinando distinta materia prima a diferentes temperaturas de calenta-
miento, es probable que se produzcan interacciones entre ambos factores que in-
troduzcan efectos adicionales de variación
133
132.75
Diámetro
132.5
Pr ove e dor A
Pr ove e dor B
132.25
132
0 1 2 3
Te m pe r atur a
166
UNIDAD 5
133
132.75
Diámetro
132.5
Proveedor A
Proveedor B
132.25
132
0 1 2 3
Tem peratura
Bien, todo parece muy interesante, pero … ¿existe alguna forma sistematizada de
encarar este tipo de estudios? Efectivamente, se puede diseñar un experimento
estadístico, planificando en forma adecuada la experiencia a realizar en función de
los objetivos del estudio.
167
UNIDAD 5
• Optimizar el valor de los factores, de manera que la respuesta esté lo más cerca
posible del valor objetivo, y que su dispersión sea mínima.
Los factores a los que hicimos referencia en esta descripción inicial son factores
controlables, ya que sus valores pueden ser fijados a voluntad. Pero existen otros
factores no controlables, cuyos valores son difíciles o imposibles de manejar, y
que también inciden sobre la respuesta. Por ejemplo, en el caso de la fabricación de
resortes, la temperatura ambiente es una variable muy difícil de controlar -ya que
sería muy costoso implementar en la planta un sistema que garantice una temperatu-
ra uniforme-, pero indudablemente mucho frío o calor ambiente producirán un im-
pacto sobre el proceso de fabricación. Una ventaja adicional del diseño es que
permite optimizar el valor de los factores controlables, de modo de minimizar los
efectos de los factores no controlables.
168
UNIDAD 5
Diseño de Experimentos
Objetivo
General
Identificar los factores de variación que
afectan la respuesta de un proceso, y
optimizar el funcionamiento del mismo
Objetivos
Específicos
Herramientas
usadas
Diseños a un solo Análisis de varianza
factor, y diseños
multifactoriales
169
UNIDAD 5
El diseño experimental es un tema muy vasto, así que vamos a acotar su tratamiento
a los aspectos fundamentales, organizando el desarrollo del siguiente modo:
Objetivos del
Aprendizaje
Conocer los principios del diseño de experimentos
170
UNIDAD 5
MODALIDAD DE TRABAJO
Bibliografía Obligatoria
LEVIN, Richard y RUBIN, David. Estadística para Administradores. Sexta Edición. Editorial
Prentice-Hall. México. 1996.
171
UNIDAD 5
Factores Controlables
x1 x2 … xp
z1 z2 … zq
Factores No Controlables
172
UNIDAD 5
Los factores son las fuentes de variación que actúan sobre el sistema, cuyos valo-
res se cambian en forma deliberada para observar su impacto sobre la respuesta.
Los distintos valores que se asignan a un factor se denominan niveles del factor. A
su vez, en un diseño se puede comprobar el efecto de uno o varios factores,
dando lugar a experimentos unifactoriales o multifactoriales. Estos últimos tam-
bién se denominan simplemente diseños factoriales.
En el ejemplo del grupo responsable del lanzamiento del nuevo modelo de resortes,
el sistema en estudio está representado por el proceso de fabricación de los resor-
tes. La variable de respuesta es el diámetro de los resortes, y los factores conside-
rados son el proveedor de materia prima y la temperatura del horno de calenta-
miento. El factor “proveedor” se trabaja a dos niveles: Proveedor A y Proveedor
173
UNIDAD 5
Una de las etapas claves dentro de este proceso, es la selección del diseño apro-
piado. Por un lado, hay que asegurar que el modelo no excluya ningún factor que
sea de importancia para explicar el comportamiento de la variable de respuesta.
174
UNIDAD 5
Por otro lado, hay que tratar de elegir el modelo más simple posible, acorde a los
objetivos del estudio, para evitar complicaciones de cálculo innecesarias. El mejor
modelo no es el más complejo, sino el que aporta mayor información sobre el
comportamiento de la variable dependiente.
Este es el caso más simple, en que se considera un solo factor, a dos o más niveles.
El modelo general es el siguiente:
Uno de los supuestos básicos del modelo es que los errores εij son variables
aleatorias, independientes entre sí, normalmente distribuidas, con media cero y
varianza σ2 constante para todos los niveles del factor.
Bajo estas condiciones, el método consiste en poner bajo prueba las siguientes
hipótesis:
H0: α1 = α2 = … = αk = 0
H1: al menos un αi es distinto de cero
175
UNIDAD 5
Ahora bien, cada observación individual se puede escribir como la suma de la me-
dia propia de cada tratamiento, más el error aleatorio:
En estas condiciones, las hipótesis anteriores se pueden expresar del siguiente modo:
Si en cambio se rechaza H0, significa que hay uno ó más tratamientos que producen
un efecto significativo, y por ende que las medias no son todas iguales. Esto se
puede esquematizar de la siguiente manera:
176
UNIDAD 5
177
UNIDAD 5
133.4
133.2
133.0
DIAMETRO
132.8
132.6
132.4
132.2
N= 5 5 5
1.00 2.00 3.00
NIVELES
• Los niveles 1 y 2 del factor producen una respuesta muy parecida, mien-
tras que el nivel 3 produce resultados significativamente mayores al resto.
178
UNIDAD 5
El resto de los términos tienen el mismo significado que para el modelo a un solo
factor. Los supuestos básicos del modelo son también los mismos que en el caso
anterior.
Como existen a niveles del primer factor, b niveles del segundo, y n repeticiones de
cada tratamiento, en total hay axbxn observaciones.
Factor 1
H0: α1 = α2 = … = αa = 0
H1: al menos un αi es distinto de cero
Factor 2
H0: β1 = β2 = … = βb = 0
H1: al menos un βj es distinto de cero
Interacciones
H0: (αβ)ij = 0 para todo i, j
H1: al menos una (αβ)ij es distinta de cero
179
UNIDAD 5
También en este caso el procedimiento que se utiliza para realizar las pruebas es el
Análisis de la Varianza -ANOVA a dos factores-.
Para completar esta visión inicial del tema, puede volver al Texto, y buscar el si-
guiente Capítulo:
DISTRIBUCIONES DE MUESTREO
• Diseño de experimentos
REVISION DE CONCEPTOS DESARROLLADOS
180
UNIDAD 5
181
UNIDAD 5
RECOMENDACIONES PRACTICAS
182
UNIDAD 5
1
Se estudian cuatro circuitos digitales diferentes de computadora, a fin de
comparar el nivel de ruido presente. Los resultados obtenidos fueron los
siguientes:
1 23 20 15 30 8
2 80 61 73 56 80
3 47 26 25 35 50
4 95 46 83 78 97
2. ANALISIS DE VARIANZA
donde εij~N(0, σ2) es la componente aleatoria que refleja los errores de experi-
mentación.
183
UNIDAD 5
niveles diferentes, el objetivo del análisis es probar la igualdad entre las medias de
los k tratamientos:
H0: μ1 = μ2 = … = μk
H1: al menos un μi es distinto
donde
STotal =Suma de cuadrados total, que contempla todas las fuentes de variación
STrat =Suma de cuadrados entre tratamientos, que considera la variación
introducida por los tratamientos
SError =Suma de cuadrados dentro de cada tratamiento, que contempla la varia-
ción debida al error experimental
Para probar la hipótesis nula de que las medias de los k tratamientos son iguales, se
comparan estos cuadrados medios. Si no hay diferencias entre las medias de los
tratamientos, las dos estimaciones de σ2 deben ser parecidas. En cambio, si ambas
184
UNIDAD 5
F = CMTrat / CM Error
Completada esta introducción, ahora puede volver al Texto para ver el tema
con mayor detalle, particularmente lo que se refiere al cálculo de las estimacio-
185
UNIDAD 5
nes de varianza a las que hemos hecho referencia, el uso del estadístico F y de la
tabla de la distribución F, la ejecución del procedimiento, y la interpretación de los
resultados.
• Análisis de varianza
Estudie el tema, siga con atención los ejemplos planteados, y deténgase el tiempo
necesario para entender con claridad el origen y el significado de las expresiones
utilizadas.
2.1. Tabla de anova
La Tabla que aparece en todos los Textos y salidas de programas estadísticos, para
el caso de un solo factor tiene la siguiente estructura:
Las fórmulas de cálculo originales, así como las “fórmulas de trabajo” simplificadas
están ampliamente desarrolladas en la literatura especializada. Su aplicación manual
es bastante laboriosa, ya que hay que manipular muchos datos y operaciones. Como
los cálculos de ANOVA están disponibles en cualquier software estadístico, vamos
186
UNIDAD 5
Source of variation Sum of Squares d.f. Mean square F-ratio Sig. level
Total 1.0630400 14
187
UNIDAD 5
f(F)
Fcrítico Fobservado
Como en este caso el valor prob es mucho menor que el nivel de significación, el
estadístico F cae claramente en zona de rechazo de la hipótesis nula. Por lo tanto se
rechaza H0, lo que equivale a decir que las medias de los tratamientos no son todas
iguales.
Table of means
188
UNIDAD 5
Vamos a incluir ahora otro gráfico parecido, en este caso dibujando los intervalos
de confianza para las medias de cada uno de los tratamientos, cuyos valores apare-
cen en la tabla anterior:
189
UNIDAD 5
Si bien en este ejemplo concreto resulta evidente que se cumplen todos los supues-
tos básicos del modelo, es conveniente incluir su verificación como parte del análi-
sis, para comprobar que el modelo usado sea apropiado y evitar interpretaciones
erróneas sobre el problema analizado.
donde yij es el valor observado y yij el valor estimado por el modelo. Fíjese que
para poder hacer estos cálculos es necesario ajustar el modelo -estimar sus
parámetros-, operación que hace automáticamente el software estadístico por el
método de mínimos cuadrados, cosa que sería muy laboriosa de realizar a mano.
——————————————————————————————
Estimated overall statistic DN = 0.126759
Approximate significance level = 0.969449
——————————————————————————————-
190
UNIDAD 5
Como el valor prob es mucho mayor que cualquiera de los niveles de significación
usados habitualmente -1, 5 ó 10 %-, significa que el estadístico de prueba cae en
zona de aceptación, y por lo tanto no se rechaza la hipótesis de que los datos
provienen de una población Normal.
.3
RESIDUOS
.2
.1
.0
-.1
-.2
-.3
0 2 4 6 8 10 12 14 16
ORDEN
191
UNIDAD 5
.3
RESIDUOS
.2
.1
.0
-.1
-.2
-.3
.5 1.0 1.5 2.0 2.5 3.0 3.5
En este diagrama se puede comprobar que la dispersión es similar para los tres
niveles del factor. Otra forma de verificar la igualdad de varianzas es mediante el
empleo de pruebas estadísticas del siguiente tipo:
Veamos los resultados de dos de tales pruebas que incluye un programa estadístico
convencional:
Nuevamente analizando los valores prob de las dos pruebas, vemos que en ambos
casos son mucho mayores que cualquiera de los niveles de significación convencio-
nales -1, 5 ó 10 %-, y por lo tanto se concluye que el estadístico de prueba cae en
zona de aceptación de la hipótesis nula, esto es, se comprueba la igualdad de
varianzas para los distintos tratamientos.
192
UNIDAD 5
Resumiendo: hemos verificado que se cumplen todos los supuestos básicos del
modelo, y por lo tanto podemos aceptar como válidas las conclusiones del análisis
de varianza.
193
UNIDAD 5
RECOMENDACIONES PRACTICAS
194
UNIDAD 5
2
Vamos a retomar el ejemplo de los cuatro circuitos digitales presentado en la
Actividad de Proceso Nº1. Recordamos que los niveles de ruido para cada
circuito eran:
1 23 20 15 30 8
2 80 61 73 56 80
3 47 26 25 35 50
4 95 46 83 78 97
195
UNIDAD 5
Conclusiones
Un aspecto interesante de este tema es que hemos utilizado prácticamente todas las
herramientas estadísticas desarrolladas hasta aquí, desde la parte descriptiva, pa-
sando por los conceptos de probabilidad y distribuciones de probabilidad, hasta
llegar por fin a lo relativo a la inferencia estadística.
196
UNIDAD
SOLUCIONES A LAS
ACTIVIDADES DE PROCESO 5 UNIDAD 5
Tabla de Medias:
—————————————————————————————
95 Percent Confidence
Level Count Average Stnd. Error intervals for mean
—————————————————————————————
1 5 19.200000 3.7067506 6.256683 32.143317
2 5 70.000000 4.9295030 57.056683 82.943317
3 5 36.600000 5.1826634 23.656683 49.543317
4 5 79.800000 9.1727858 66.856683 92.743317
—————————————————————————————
197
UNIDAD 5
así que habría que verificar su origen. De odas maneras, los tests analíticos
confirman la igualdad de varianzas para todos los niveles del factor. Por últi-
mo, hay que tener en cuenta que se ha trabajado con muy pocas repeticiones
de cada tratamiento, cuestión que influye sobre los resultados obtenidos.
198
UNIDAD
ACTIVIDADES DE
AUTOEVALUACION 5 UNIDAD 5
199
UNIDAD 5
PROGRAMAS
I II III IV
66 72 61 63
74 51 60 61
82 59 57 76
75 62 60 84
73 74 81 58
97 64 55 65
87 78 70 69
78 63 71 80
200
ACTIVIDAD
OBLIGATORIA
Nº2
UNIDAD 5
CRITERIOS DE EVALUACION
201
Nº1 ACTIVIDAD
OBLIGATORIA
ACTIVIDAD OBLIG.
Contenidos
( 1) 177 ( 19) 124 ( 37) 160 ( 55) 106 ( 73) 140 ( 91) 132
( 2) 110 ( 20) 110 ( 38) 137 ( 56) 104 ( 74) 68 ( 92) 92
( 3) 118 ( 21) 122 ( 39) 133 ( 57) 136 ( 75) 138 ( 93) 122
( 4) 125 ( 22) 123 ( 40) 183 ( 58) 141 ( 76) 114 ( 94) 140
( 5) 120 ( 23) 112 ( 41) 120 ( 59) 140 ( 77) 124 ( 95) 110
( 6) 117 ( 24) 117 ( 42) 107 ( 60) 143 ( 78) 102 ( 96) 179
( 7) 122 ( 25) 122 ( 43) 127 ( 61) 167 ( 79) 104 ( 97) 145
( 8) 137 ( 26) 151 ( 44) 95 ( 62) 106 ( 80) 76 ( 98) 139
( 9) 151 ( 27) 135 ( 45) 135 ( 63) 81 ( 81) 137 ( 99) 134
( 10) 152 ( 28) 140 ( 46) 116 ( 64) 136 ( 82) 143 (100) 122
( 11) 175 ( 29) 150 ( 47) 130 ( 65) 116 ( 83) 142
( 12) 179 ( 30) 145 ( 48) 172 ( 66) 99 ( 84) 98
( 13) 170 ( 31) 144 ( 49) 177 ( 67) 144 ( 85) 156
( 14) 158 ( 32) 137 ( 50) 166 ( 68) 144 ( 86) 100
( 15) 117 ( 33) 112 ( 51) 139 ( 69) 114 ( 87) 147
( 16) 148 ( 34) 117 ( 52) 114 ( 70) 115 ( 88) 69
( 17) 142 ( 35) 161 ( 53) 125 ( 71) 113 ( 89) 99
( 18) 118 ( 36) 155 ( 54) 103 ( 72) 171 ( 90) 112
202
ACTIVIDAD OBLIG.
P (precipitaciones)
Río
V (escurrimiento)
Del total de lluvia caída, una parte escurre directamente al río, y otra se infiltra en el
suelo. El agua infiltrada se mueve lentamente por el suelo y el subsuelo, alimentando
el almacenamiento subterráneo, que a su vez aporta agua al río.
Vt = a Pt + b Vt-1 + c Pt -1
donde:
Vt es el volumen de escurrimiento para un cierto mes
Pt es la cantidad de lluvia caída durante ese mes
Vt-1 es el volumen escurrido durante el mes anterior
Pt-1 es la precipitación del mes anterior
203
ACTIVIDAD OBLIG.
El suelo permite mayor o menor infiltración, según esté seco o húmedo. Esto a su
vez depende de la época del año, ya que en invierno el suelo está muy seco, y en
verano se humedece con las lluvias. Por lo tanto en invierno hay mucha absorción
de las lluvias y poco escurrimiento directo al río, mientras que en verano el proceso
se invierte.
En el modelo planteado para V, cada uno de los términos implica una demora o
retardo en el recorrido del agua hasta llegar al lago. Si el primer término de la
ecuación es importante, significa que el retardo es bajo y la llegada al lago es cues-
tión de horas. Si el segundo término es importante, entonces la demora es de varios
días o semanas. Finalmente, si el tercer término es importante hay un retardo supe-
rior a un mes.
204
ACTIVIDAD OBLIG.
205
ACTIVIDAD OBLIG.
206
ACTIVIDAD
OBLIGATORIA
Nº2
ACTIVIDAD OBLIG.
a) Función de autocorrelación.
207
ACTIVIDAD OBLIG.
Los resultados del muestreo se muestran en las tablas siguientes. La cota deseada
para el diámetro es de 67 mm, y los datos registrados representan la diferencia
entre el diámetro real de la pieza y la cota deseada, expresando esa diferencia en
centésimas de milímetro.
Realice lo siguiente:
b) En base al análisis anterior, formule una opinión acerca del origen del au-
mento de la variabilidad de los diámetros.
208
ACTIVIDAD OBLIG.
209
UNIDAD
CLAVES DE
RESPUESTAS 1
Claves de Resp.
1. Poner bajo prueba una afirmación sobre el valor de un parámetro de una pobla-
ción, o sobre la distribución de una variable aleatoria.
211
UNIDAD
2
Claves de Resp.
CLAVES DE
RESPUESTAS
5. No.
10. Establecer la relación funcional entre una variable dependiente, y una o varias
variables independientes.
13. Es un modelo que vincula a la variable dependiente con una sola variable
independiente, mediante la ecuación de una recta: y = a + b x
212
Claves de Resp.
14. En forma intuitiva, procurando identificar la recta que represente lo mejor po-
sible a los puntos del diagrama de dispersión, o en forma analítica, mediante el
método de mínimos cuadrados.
213
Claves de Resp.
23. Se hacen diferentes análisis para evaluar la calidad del ajuste: error estándar de
la estimación, varianza residual, y coeficiente de determinación; análisis de correla-
ción entre los parámetros del modelo; análisis de inferencia: prueba sobre el modelo
global, prueba sobre los parámetros del modelo; análisis de los residuos: verifica-
ción de normalidad e independencia, media cero y varianza constante.
24. No extrapolar resultados mucho más allá del rango de valores disponibles
sobre las variables; investigar el origen de todos los datos sospechosos; no forzar la
existencia de relaciones, cuando éstas realmente no existen; verificar la existencia
de una vinculación física real entre las variables en un análisis de regresión; no usar
los resultados del análisis numérico para justificar relaciones que no existen entre las
variables.
25. b. r = 0.255
El valor del coeficiente de correlación sugiere que existe un débil grado de
asociación lineal entre las variables.
c. y = 99.73 + 0.0038 x
d. Se = 0.172
e. r2 = 0.0651 Significa que la recta ajustada explica sólamente un 6.51 % de la
variación de los diámetros al variar el tiempo.
214
UNIDAD
CLAVES DE
RESPUESTAS 3
Claves de Resp.
8. Los promedios móviles permiten suavizar las irregularidades de una serie, po-
niendo más en evidencia las componentes presentes en la serie.
215
Claves de Resp.
12. La FDE es una función que distribuye la varianza total de la muestra sobre el
rango de frecuencias de aparición de cada valor.
13. Para analizar la estructura de una serie temporal, e identificar las principales
componentes que están presentes en la serie.
15. Analizando la serie se advierte una suave tendencia creciente en los datos. Se
ajusta un modelo lineal simple, que queda de la siguiente forma:
y = 99.83 + 0.009 x
216
UNIDAD
CLAVES DE
RESPUESTAS 4
Claves de Resp.
1. Calidad es cumplir con los requisitos del cliente, en tiempo y forma, y al menor
costo.
5. Trabajar en todos los niveles de una organización, y sobre los diferentes proce-
sos de producción, para lograr la satisfacción del cliente, y tratar de mejorar per-
manentemente.
11. Las causas comunes son los factores de variación permanente, de carácter
aleatorio, que actúan sobre un proceso. Las causas especiales son fuentes intermi-
tentes que introducen una variación excesiva en el proceso, y a las que se puede
asignar con facilidad su origen.
217
Claves de Resp.
13. Un proceso se dice que está estable, o bajo control estadístico, cuando solo
actúan las causas comunes de variación. Si operan también causas especiales, el
proceso está inestable o fuera de control.
15. Se puede hacer una diferenciación básica entre cartas de control por variables,
que sirven para controlar parámetros numéricos, y cartas por atributos, que se usan
para controlar variables categóricas.
16. Son dos diagramas que permiten controlar el centrado y la dispersión de una
característica de calidad de tipo numérica.
19. Pueden ser valores estándar, impuestos por el cliente o el responsable del
proceso. Por lo general lo que se hace es poner en marcha el proceso, medir duran-
te un cierto tiempo, y calcular esos valores en base a la información relevada.
20. Para disminuir la probabilidad del error tipo II, con el fin de evitar dar alarmas
injustificadas.
218
Claves de Resp.
b. x = 99.987 R = 0.375
Diagrama de Medias: LCsup = 100.203 Línea Central = 99.987
LCinf = 99.770
Diagrama de Rangos: LCsup = 0.375 Línea Central = 0.793
Los dos diagramas están estables, lo que significa que, después del ajuste
realizado, el proceso opera únicamente bajo la acción de causas comunes de
variación.
219
Claves de Resp.
220
UNIDAD
CLAVES DE
RESPUESTAS 5
Claves de Resp.
3. Los factores son las variables de proceso, y están asociadas a las condi-
ciones bajo las cuales se desarrolla el mismo, como por ejemplo la materia
prima, la mano de obra, el método de trabajo, etc. La respuesta es la salida
del proceso.
4. Identificar cuáles son los factores que tienen una influencia considerable
sobre la respuesta, y determinar los mejores valores de los factores contro-
lables de modo tal que la respuesta esté cerca del valor nominal, que la varia-
ción de la respuesta sea pequeña, y que se minimice el efecto de los factores
no controlables.
9. Significa asignar por sorteo los tratamientos a las distintas unidades expe-
rimentales. Es fundamental para no introducir un sesgo en los resultados,
especialmente cuando las unidades no son demasiado uniformes.
221
Claves de Resp.
13. No. Para que el análisis y las conclusiones sean válidas, hay que verificar ade-
más que se cumplan todos los supuestos del modelo.
222
Claves de Resp.
b. El análisis de los residuos permite comprobar que son normales, tienen media
cero y varianza constante. Por otra parte, no presentan ningún patrón extraño de
comportamiento, así que pueden suponerse independientes. Por lo tanto se puede
afirmar que no se ha violado ninguno de los supuestos del modelo, tomándose
como válidos los resultados del ANOVA.
223