Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Probabilidad y Estadistica II PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 218

I NSTITUTO

U NIVERSITARIO
A ERONAUTICO

D I S TA N C I A
EDUCACION A

PROBABILIDAD Y
ESTADÍSTICA II

Ricardo, Ingaramo

INGENIERIA DE SISTEMAS

GUIA DE ESTUDIO
DISEÑO GRAFICO

PRODUCCION: Lic. María Elena Ciolli


Mauro A. Martínez Almeyra

CONTROL DE CALIDAD: Lic. María Pía Monguillot


Lic. María de los Reyes Constenla

IMPRESION Y ARMADO

COORDINACION: Ing. Dante López

PRODUCCION: Jorge Peralta


Oscar Passarelli

Este libro es propiedad del Instituto Universitario Aeronáutico


Prohibida su reproducción total o parcial
Segunda Edición. Diciembre de 1998.
INSTITUTO UNIVERSITARIO AERONAUTICO
Rector: Brigadier (R) Raúl Juan Carlos Camussi

FACULTAD DE EDUCACION A DISTANCIA


Decano Ing. Javier Enrique Etchegoyen

DEPARTAMENTO SISTEMAS
Directora Lic. Susana Barrionuevo de Bustos Acuña

DEPARTAMENTO ADMINISTRACION DE EMPRESAS


Directora Contadora Catalina Rosa Tinari

DEPARTAMENTO PEDAGOGICO
Directora Lic. Maria Beatriz Rossa de Riaño

DEPARTAMENTO ADMINISTRACION ACADEMICA


Directora Estela Fernandez de Casú Gómez

3
PROBABILIDAD Y ESTADISTICA II

Autor: Ricardo Ingaramo

· Ingeniero. Universidad Nacional del Litoral.


· Profesor Adjunto de la Cátedra de Probabilidad y Estadística. F.C.E.F. y N. -
U.N. de Córdoba.

· Profesor Adjunto de la Universidad Blas Pascal.

· Profesor de Estadística del I.U.A.

· Asesor de empresas en aplicaciones estadísticas.

PROCESAMIENTO DIDÁCTICO Y EVALUACIÓN


PEDAGÓGICA:

Lic. Mónica Gallino de Pensa


Lic. María Beatriz Rossa de Pensa

CORRECCIÓN DE ESTILO:

Lic. Raquel Ortega

REVISIÓN DE CONTENIDOS:

Ing. José Luis Zanazzi

4
Estimado Alumno:

Después de nuestro contacto inicial en Probabilidad


y Estadística II, nos volvemos a encontrar, ahora con un panorama más
claro sobre la importancia de la Estadística para su formación profesional.

En esta nueva etapa vamos a profundizar el análisis


y la aplicación de herramientas estadísticas, partiendo de la base adquirida
en la materia anterior, completando en esta oportunidad los conocimientos
básicos necesarios como para que Usted pueda manejarse con criterio e
independencia frente a problemas relacionados con esta temática.

Vale la pena recalcar que esta Guía de Estudios es el


resultado del esfuerzo personal de su autor, pero también del aporte de un
gran equipo de gente, quienes tratamos de elaborar un material que se ajuste
lo mejor posible a las necesidades de nuestros lectores. En ese sentido, hemos
tenido en cuenta las sugerencias que los alumnos de una u otra forma nos
han hecho llegar, procurando satisfacer sus expectativas.

Bueno, en este proceso que proseguiremos juntos,


usted es el protagonista, así que, junto con mis deseos de que sea esta un
experiencia positiva, le recomiendo realizar todo el esfuerzo necesario como
para alcanzar los objetivos planteados.

Ing. Ricardo Ingaramo

5
INDICE
INDICE

Introducción General Orientadora........................................8

Unidad 1: Pruebas de Hipótesis...........................................17

1. Pruebas sobre los parámetros de una población


1.1 Prueba sobre la media con muestras pequeñas
1.2 Prueba sobre la varianza
2. Pruebas sobre el modelo
2.1 Prueba Chi-cuadrado de bondad de ajuste
3. Pruebas de comparación de dos poblaciones
3.1 Prueba de comparación de varianzas
3.2 Prueba de comparación de medias con muestras grandes y
pequeñas y para muestras dependientes e independientes

Unidad 2: Análisis de Regresión y Correlación...................49

1. Análisis de correlación
2. Análisis de regresión
3. Regresión múltiple

Actividad Obligatoria Nº 1...................................................93

Unidad 3: Series de Tiempo.................................................95

1. Análisis clásico de una serie de tiempo


2. Técnicas de análisis avanzadas

Unidad 4: Control de la Calidad........................................125

1. Control de la calidad
2. Control estadístico de procesos
2.1 Cartas de control por variables
2.2 Cartas de control por atributos

6
INDICE

Unidad 5: Diseño de experimentos....................................................................163

1. Principios del diseño de experimentos


1.1 Diseños a un solo factor
1.2 Diseño factoriales
2. Análisis de varianza
2.1 Tabla de ANOVA
2.2 Verificación de la idoneidad del modelo

Actividad Obligatoria Nº 2.................................................................................233

7
INTRODUCCION GENERAL
ORIENTADORA
INTRODUCCION

SINTESIS DE LA TEMATICA

¿Qué propone esta nueva asignatura sobre Estadística?

Después de la experiencia realizada en Probabilidad y Estadística I, Usted ya conoce


cuáles son los objetivos generales de la Estadística, ha visto las técnicas más usuales,
sus aplicaciones, y debe tener una idea más clara sobre la utilidad de las mismas
dentro de su formación profesional. De todas maneras, en aquella oportunidad
aclaramos que con esa materia no se agotaba el tratamiento de los conceptos y
herramientas necesarios como para desarrollar estudios estadístico de cierta
envergadura.

En Probabilidad y Estadística II vamos a terminar de incorporar los elementos


básicos de la estadística, y vamos a incursionar en el uso de algunas herramientas
avanzadas.

En la Unidad 1 ampliaremos el análisis de las herramientas de la inferencia estadística


iniciado en la materia anterior. En este caso vamos a retomar las pruebas de hipótesis,
completando el desarrollo de las principales pruebas sobre los parámetros de una y
dos poblaciones, y sobre la distribución de una variable aleatoria.

En la Unidad 2 introduciremos el uso de las técnicas explicativas de la estadística. El


objetivo es estudiar la posible relación entre dos ó más variables, en forma
exploratoria mediante el uso de diagramas de dispersión, evaluando el grado de
asociación entre dos variables, o analizando la relación funcional entre dos o más
variables.

Un problema muy frecuente dentro del campo de las aplicaciones técnicas, es el


análisis de un proceso a lo largo del tiempo, con el objeto de describir su
comportamiento, identificar los mecanismos de generación, y efectuar pronósticos
que faciliten la toma de decisiones respecto de hechos futuros. En la Unidad 3
veremos precisamente el tratamiento de series temporales, utilizando herramientas
clásicas y avanzadas de análisis.

Otra cuestión dominante en estos tiempos, es el tema de la calidad. Un mercado


competitivo como el actual exige a empresas y particulares el mayor empeño posible
en la producción de bienes y servicios de alta calidad y bajo costo. En la Unidad 4
repasaremos la nueva filosofía de la calidad, veremos los principales conceptos en
boga, y profundizaremos el estudio de la variabilidad de procesos y su control
mediante técnicas estadísticas de amplia aplicación práctica.

8
INTRODUCCION

Una herramienta esencial dentro de un programa moderno de calidad, es la


experimentación. En la Unidad 5 introduciremos el diseño de experimentos, con la
finalidad mejorar el rendimiento de procesos, y optimizar el diseño de nuevos
productos y procesos. Paralelamente estudiaremos las herramientas estadísticas
necesarias para interpretar los resultados de un experimento.

Es importante destacar que buena parte de las técnicas que vamos a emplear en
esta materia son demasiado complejas o laboriosas como para ser implementadas
en forma manual. Por lo tanto, una de las características de esta nueva etapa será el
uso frecuente de paquetes estadísticos de computación, por lo que será necesario
que incorpore su uso y adquiera habilidad para interpretar correctamente las salidas
de los mismos.

Bien, con los contenidos vistos en Probabilidad y Estadística I, más los que incorpore
con esta nueva materia, Usted tendrá la formación necesaria como para encarar en
forma independiente los siguientes aspectos de un estudio estadístico: plantear con
claridad el problema, seleccionar las herramientas adecuadas, ejecutar los
procedimientos necesarios, e interpretar los resultados obtenidos, aprovechando la
información obtenida para facilitar la toma de decisiones dentro de su actividad
profesional.

9
INTRODUCCION

OBJETIVOS
Objetivos del
Aprendizaje

Formular con precisión un problema de naturaleza estádistica

Seleccionar la herramienta estadística más apropiada para cada


caso.

Interpretar correctamente los resultados del análisis, y tomar


decisiones con fundamento estadístico.

Usar la computadora como herramienta auxiliar.

Manejar las técnicas inferenciales usuales

Realizar análisis de relaciones entre variables

Analizar el comportamiento de una serie de tiempo

Utilizar técnicas estadísticas dentro de programas de calidad

Conocer los elementos del muestreo

Emplear el análisis de varianza

10
INTRODUCCION

Esquema
Conceptual

11
INTRODUCCION

BIBLIOGRAFIA

Bibliogafía Obligatoria

•LEVIN, Richard y RUBIN, David. Estadística para Administradores.


Sexta Edición. Editorial Prentice-Hall. México. 1996.

Este texto ha sido elegido como material de base para el seguimiento de la materia
por su comprobada eficacia para el proceso de aprendizaje de la misma, su formato
actualizado, el uso de un lenguaje claro y didáctico, una presentación muy “amigable”,
y un contenido temático muy amplio. Además, incorpora el uso de la computadora
como herramienta auxiliar, por lo que se adapta a los requerimientos actuales en
cuanto a la aplicación de las técnicas estadísticas a problemas de la vida real.

Bibliografía Complementaria

•BERENSON, M. y LEVINE, D. Estadística Básica en Administración.


Editorial Prentice-Hall. México. 1996.

Es un material muy actualizado, sumamente didáctico, con muchas aplicaciones


prácticas, y con énfasis en el uso de programas estadísticos como herramienta auxiliar
de trabajo.

• MILLER, I. - FREUND, J. - JOHNSON, R. - Probabilidad y Estadística


para Ingenieros. Editorial Prentice-Hall. 1996.

Es un texto ampliamente utilizado en aplicaciones técnicas, especialmente en


estadística industrial, por el uso de un lenguaje claro y preciso, un buen sustento
matemático, ejercitación basada en casos reales, y su compromiso con la filosofía
del mejoramiento de la calidad.

• MONTGOMERY, D. Control Estadístico de la Calidad. Grupo Editorial


Iberoamérica. 1991.

El contenido de este libro aborda de manera muy clara y completa el estudio de la


variabilidad, y en especial el tema del Control Estadístico de Procesos, los métodos
convencionales y especiales de control, y sus principales aplicaciones.

• JURAN, J.M. y GRYNA, F.M. Análisis y Planeación de la Calidad.


Editorial Mc Graw-Hill. 1995.

12
INTRODUCCION

Es un clásico dentro del tema calidad, abarcando aspectos de planificación, control


y administración de la calidad. Es un material de consulta obligado para quienes
deben desempeñar funciones relacionadas con la calidad.

Bibliografía Consultada por el Autor

• FERRAN ARANAZ,M. SPSS para Windows: Programación y Análisis


Estadístico. Editorial Mc Graw Hill. 1996.

• GRANT,E. y LEAVENWORTH,R. Control Estadístico de Calidad.


Compañía Editorial Continental. 1990.

• JURAN, J.M. y GRYNA, F.M. Análisis y Planeación de la Calidad. Editorial


Mc Graw-Hill. 1995.

• MENDENHALL,W. y REINMUTH, J. Estadística para Administración y


Economía. Grupo Editorial Iberoamérica. 1996.

• SCHEAFFER,R., MENDENHALL,W. y OTT,L. Elementos de muestreo.


Grupo Editorial Iberoamérica. 1987.

13
INTRODUCCION

SUGERENCIAS PARA EL ESTUDIO

El Material Instruccional de esta materia tiene básicamente la misma estructura que


el usado en PyE I. De todas maneras, vamos a recordar sus principales
características, sin explayarnos demasiado:

•El material básico está constituído por la Guía de Estudios y la Bibliografía


Obligatoria, pudiendo incorporar otros textos sugeridos en la Bibliografía
Complementaria, o cualquier otro material relacionado con la especialidad.

• Cada nuevo tema es introducido inicialmente en la Guía, luego se lo deriva al


Texto para su tratamiento en detalle, y finalmente se hace un cierre en la Guía, con
una revisión de conceptos y la aplicación práctica de los mismos.

• La Guía de Estudios no es un material autocontenido. Constituye un elemento de


apoyo para simplificar el seguimiento de la materia, facilitar su vinculación con el
Texto, revisar periódicamente los conceptos presentados, y relacionarlos con la
realidad. La estructura general de la Guía de Estudios es la siguiente:

• Está organizada por unidades temáticas.

• Cada unidad comienza con una Orientación del Aprendizaje, donde se


anticipa el temario a tratar, los objetivos, sus aplicaciones, y su inserción en la
materia, información que se resume en el Esquema Conceptual.
En una tabla especial se describe la modalidad de trabajo en cada unidad,
donde se resumen las actividades propuestas, el material utilizado, los
conceptos desarrollados, y la ejercitación sugerida.

• Cada unidad está dividida en un número reducido de temas específicos,


que son introducidos inicialmente en la Guía.

• Cada tema se introduce tratando de resaltar su importancia práctica,


esbozando algunos conceptos generales sobre el mismo, y posteriormente la
Guía lo deriva al Texto para ver su desarrollo en detalle. Cada vez que
encuentre en la Guía el símbolo , usted está recibiendo la sugerencia de
dirigirse al texto.

• Las derivaciones al texto van acompañadas de instrucciones sobre los


temas que debe buscar, y recomendaciones tendientes a optimizar el
aprovechamiento de la Bibliografía Obligatoria.

14
INTRODUCCION

• Cuando se termina de ver un tema en el texto, la Guía le propone realizar


una serie de Actividades de Proceso, para afirmar la aplicación de los
conocimientos adquiridos.

• Algunas veces la Guía incluye conceptos adicionales sobre los temas


considerados, tendiente a complementar su desarrollo.

• Cada tema finaliza en la Guía con una revisión de los conceptos desarrollados
y una lista de recomendaciones prácticas, que resumen los principales
conceptos tratados y hacen algunas aclaraciones útiles para facilitar su
aplicación.

SISTEMA DE EVALUACION

Las instancias de evaluación que usted deberá sortear son las siguientes:

• Resolución de las Actividades de Proceso, que están en la Guía de Estudios al


final de cada tema.

•Resolución de las Actividades de Autoevaluación, que incorpora la Guía al final


de cada unidad.

Dentro de estas actividades usted va a encontrar ejercicios teórico-prácticos,


preguntas de reflexión y casos de la vida real muy importantes para afirmar los
conocimientos adquiridos, y visualizar la importancia de la estadística como
herramienta auxiliar de un profesional.

Es fundamental que resuelva en forma completa las actividades propuestas, a fin de


que pueda medir el grado de avance logrado en el proceso de aprendizaje, y pueda
efectuar los ajustes necesarios como para arribar sin contratiempos a las evaluaciones
formales.

La Guía incluye claves de respuesta a las actividades sugeridas para que usted
pueda constatar los resultados correctos.

Las evaluaciones formales previstas son las siguientes:

• Actividad Obligatoria Nº1, al final de las Unidades 1 y 2.


• Actividad Obligatoria Nº2, al final de las Unidades 3, 4 y 5.
• Evaluación Final: se trata de un examen escrito, de carácter teórico-práctico,

15
INTRODUCCION

donde se evalúa el nivel de conocimientos alcanzado en la materia, y la habilidad


para interpretar un problema dado, plantear las técnicas estadísticas necesarias para
su resolución, aplicarlas y analizar adecuadamente sus resultados.

Cronograma

UNIDAD Porcentaje de Tiempo estimado


Tiempo estimado (hs)

1 25

2 15

Actividad Obligatoria Nº 1

3 20

4 15

5 25

Actividad Obligatoria Nº 2

EXAMEN

16
PRUEBAS DE
HIPOTESIS

UNIDAD

1
UNIDAD

1
UNIDAD 1
ORIENT A C I ” N DEL
RIENTA
A PRENDIZAJE

En la asignatura Probabilidad y Estadística I presentamos el concepto de


inferencia estadística, sus alcances, las herramientas utilizadas, y sus apli-
caciones prácticas.

Una de las técnicas inferenciales más utilizadas en la práctica es la prueba


de hipótesis. Los conceptos más importantes relacionados con el tema se
pueden resumir de la siguiente manera:

 Una prueba de hipótesis sirve para confirmar o rechazar una afir-


mación acerca del valor de un parámetro poblacional, o sobre la distribu-
ción de probabilidad de una variable aleatoria.

 La formulación de hipótesis se basa en el objetivo del problema


bajo análisis, y en el conocimiento que se tiene sobre la población en estu-
dio.

 Una prueba no es absolutamente concluyente. Se pueden come-


ter dos tipos de errores: rechazar una hipótesis verdadera, o aceptar una
hipótesis falsa, cuyas probabilidades se denominan respectivamente a y b.

 La decisión -rechazar o no la hipótesis bajo prueba- se basa en


una cantidad denominada estadístico de prueba, cuyo valor depende de
los resultados del muestreo de la población en estudio.

Los distintos tipos de pruebas se muestran en el siguiente esquema:

18
UNIDAD 1

De todas las alternativas mostradas anteriormente, en Probabilidad y Estadística I


hemos visto las siguientes pruebas:

 Prueba sobre la media poblacional m de una variable con distribución


Normal, con varianza conocida o muestras grandes.

 Prueba de bondad de ajuste de Kolmogorov-Smirnov.

A lo largo de la presente Unidad vamos a abordar el resto de las pruebas más


usadas en la práctica.

La implementación de una prueba de hipótesis se realiza en base al siguiente proce-


dimiento general:

1. Identificación de la variable aleatoria en estudio, y determinación de su distribu-


ción de probabilidades.

2. Formulación de hipótesis -hipótesis nula e hipótesis alternativa-.

3. Selección del estadístico de prueba.

4. Determinación del nivel de significación de la prueba, y cálculo de los valores


críticos -límites entre zona de aceptación y de rechazo en la distribución del estadís-
tico de prueba-.

5. Selección de una muestra aleatoria, y determinación de las cantidades necesa-


rias para calcular una estimación del estadístico de prueba.

6. Comparación entre la estimación del estadístico de prueba y los valores críti-


cos, y decisión acerca de las hipótesis planteadas.

La etapa clave del problema es la identificación del estadístico de prueba apro-


piado para el problema analizado y para los datos disponibles. El resto de la meto-
dología es común a todas las pruebas.

19
UNIDAD 1

Esquema
Tema Conceptual

Pruebas de Hipótesis

Objetivo
General
Comprobar las principales
propiedades de una
variable aleatoria

Objetivos
Específicos

Comprobar el Comprobar la
valor de los distribución de
parámetros probabilidades

Herramientas
usadas
Pruebas Pruebas sobre Pruebas de
sobre los los parámetros bondad de
parámetros de dos ajuste
de una poblaciones
población

20
UNIDAD 1

El desarrollo de este tema sigue los siguientes lineamientos generales:

Objetivos del
Aprendizaje
Realizar pruebas de hipótesis sobre los parámetros de una población.

Comprobar la distribución de una variable aleatoria.

Comparar los parámetros de dos poblaciones.

1. Pruebas sobre los parámetros de una población. Contenidos

1.1 Prueba sobre la media con muestras pequeñas.


1.2 Prueba sobre la varianza.
2. Pruebas sobre el modelo.
2.1 Prueba Chi-cuadrado de bondad de ajuste.
3. Pruebas de comparación de dos poblaciones.
3.1 Prueba de comparación de varianzas.
3.2 Pruebas de comparación de medias con muestras grandes y
pequeñas, y para muestras dependientes e independientes.

21
UNIDAD 1

MODALIDAD DE TRABAJO

El desarrollo de esta Unidad se realiza en base al siguiente esquema:

ACTIVIDAD MATERIAL CONCEPTOS EJERCITACION


UTILIZADO DESARROLLADOS PROPUESTA
Introducción al Tema 1: GUIA Ejemplo introductorio
Prueba sobre los
parámetros de una
Población
Prueba sobre la Media
con muestras pequeñas
Lectura de la bibliografía TEXTO  Distribución t. Ejercitación del Texto
obligatoria: Prueba  Prueba sobre la media con
sobre la Media muestras pequeñas.
Introducción al Tema GUIA Ejemplo introductorio
Prueba sobre la
Varianza
Lectura de la bibliografía TEXTO  Distribución Chi-cuadrado. Ejercitación del Texto
obligatoria: Prueba  Prueba sobre la varianza.
sobre la Varianza
Revisión de conceptos GUIA
desarrollados
Actividades de proceso GUIA Ejemplos prácticos
Introducción al Tema 2: GUIA Ejemplo introductorio
Pruebas sobre el Modelo
Lectura de la bibliografía TEXTO  Prueba chi-cuadrado de Ejercitación del Texto
obligatoria: Prueba de Bondad de ajuste.
bondad de ajuste
Revisión de conceptos GUIA
desarrollados
Actividades de proceso GUIA Ejemplo práctico
Introducción al Tema 3: GUIA Ejemplo introductorio
Pruebas de comparación
de dos Poblaciones
Lectura de la bibliografía TEXTO  Distribución F. Ejercitación del Texto
obligatoria: Prueba de  Prueba de comparación de
comparación de Dos varianzas poblacionales.
varianzas
Introducción al Tema: GUIA Ejemplos
Pruebas de comparación introductorios
de Medias con muestras
grandes y pequeñas,
independientes y
dependientes
Lectura de la bibliografía TEXTO  Muestras independientes - Ejercitación del Texto

22
UNIDAD 1

Revisió n de conceptos GUIA


desarrollados
Actividades de proceso GUIA Ejemplo s prácticos
Conclusio nes GUIA
Actividades de GUIA Ejercitación
Autoevaluació n teórico-práctica

Bibliografía Obligatoria

LEVIN, Richard y RUBIN, David. Sexta Edición. Editorial Prentice-Hall. México.1996.

23
UNIDAD 1

1. PRUEBAS SOBRE LOS PARAMETROS DE UNA POBLACION

El objetivo de cualquier análisis de inferencia consiste en estimar las principales


propiedades de la población, y específicamente es bastante común tener que calcu-
lar medidas representativas del centrado y de la dispersión de la variable en estudio.

Una forma de encarar ese análisis es formulando hipótesis sobre los valores de los
parámetros de interés, y tomando muestras de la población en estudio para decidir
si las hipótesis efectuadas son razonables.

Para evaluar el centrado se utilizan pruebas sobre la media poblacional, y para


evaluar la dispersión se usan pruebas sobre la varianza poblacional.

1.1 Prueba sobre la media con muestras pequeñas

Un empleado del Area de Producción de la firma metalmecánica Campeón S.A. es


responsable de controlar periódicamente que el diámetro de los resortes se man-
tenga dentro de las especificaciones establecidas por el cliente, y lo más cerca
posible del valor nominal.

Un tipo de resorte denominado A tiene un diámetro especificado por ingeniería de


150 mm. ± 10 mm.. Esto significa que el valor ideal es de 150 mm., el diámetro
máximo admitido es de 160 mm., y el mínimo es de 140 mm.

Para verificar si toda la producción de resortes cumple con esas condiciones, el


encargado de control toma cada hora una muestra de 10 resortes, y verifica que
todos estén dentro de las tolerancias.

El ingeniero responsable del proceso en cuestión desea aplicar sus conocimientos


estadísticos para aprovechar al máximo la información relevada por el hombre de
control. Mas allá de que la pieza inspeccionada cumpla con las especificaciones, el
ingeniero se fija como meta que todos los resortes producidos tengan un diámetro
lo más cerca posible del valor nominal.

Para comprobar si el proceso cumple con el objetivo propuesto, lo primero que se


le ocurre al ingeniero es calcular el diámetro medio de cada muestra, y comparar los
resultados obtenidos con el valor objetivo - de 150 mm. -

Si bien la media aritmética constituye un buen estimador puntual de la media


poblacional , el ingeniero enfrenta la dificultad práctica de que el tamaño de las

24
UNIDAD 1

muestras es muy reducido como para obtener una estimación confiable. Además,
necesita especificar algún criterio para decidir hasta qué punto pueden considerarse
satisfactorios los resultados del muestreo, en otras palabras, si el diámetro medio
de los resortes se aproxima razonablemente o no al valor objetivo.

Después de reflexionar sobre el problema, concluye que existen dos alternativas de


trabajo, más eficientes que la anterior:

 Calcular con los datos de cada muestra intervalos de confianza para la


media.

 Formular hipótesis sobre el verdadero valor del diámetro medio, y tomar


la decisión en base a los resultados observados.

La última alternativa parece más práctica de implementar, y consiste en poner bajo


prueba la siguiente hipótesis:

Hipótesis Nula H0: μ = 150

Como alternativa, para el caso en que H0 sea falsa, se plantea la siguiente


contrahipótesis:

Hipótesis Alternativa H¹: μ = 150

Por lo tanto, si rechaza H0, el ingeniero habrá comprobado que el nivel medio de la
producción de los resortes A tiene un diámetro significativamente distinto al valor
objetivo de la especificación, y en consecuencia deberá realizar ajustes en el proce-
so para corregir esa situación.

Las características principales de una prueba para la media, para el caso en que la
varianza poblacional es desconocida, y se trabaja con muestras pequeñas, son las
siguientes:

Formulación de Hipótesis

Hipótesis Nula H0: μ = μ0

μ  μ0 Prueba bilateral
Hipótesis Alternativa H1: μ > μ0 Prueba unilateral derecha
μ < μ0 Prueba unilateral izquierda

25
UNIDAD 1

Estadístico de Prueba

Valor Distribución

x
Tˆ  t de Student con (n-1) grados de libertad
S/ n

La t de Student es una distribución de probabilidades para variable aleatoria conti-


nua muy usada en inferencia, y está tabulada en la mayoría de los libros de estadís-
tica, en función del nivel de significación y de su único parámetro: los grados de
libertad -g.l.-.

La forma de la distribución es bastante similar a la Normal Estándar, ya que es


simétrica y con media cero. Los g.l. definen una familia de curvas, y cuando los g.l.
aumentan la t de Student tiende a la Normal Estandarizada.

Los grados de libertad representan el número de variables que se pueden elegir


libremente. Para una muestra de tamaño n, compuesta por las observaciones x1, x2,
… , xn, dada una cierta media - x - sólo se pueden elegir libremente (n-1) términos,
ya que el último queda determinado automáticamente por los demás. De ahí que el
estadístico de prueba tenga como parámetro (n-1) grados de libertad.

Mayores precisiones sobre la distribución t de Student, y sobre la prueba sobre la


media poblacional basada en esta distribución, las va a encontrar el Texto, dentro
del siguiente Capítulo:

Prueba de hipótesis de una sola muestra

Busque el siguiente tema:

 Prueba sobre la media cuando no se conoce la varianza poblacional

Resuelva los ejercicios pares que están al final de este tema, y compare sus resulta-
dos con las respuestas del Texto.

26
UNIDAD 1

Importante: Para profundizar sobre las características de la distribución t, el signi-


ficado de los grados de libertad, y el uso de la tabla correspondiente, vuelva al
Capítulo anterior del Texto, y busque dentro del tema Estimación el apartado refe-
rido a Estimaciones de intervalo mediante la distribución t.

1.2 Prueba sobre la varianza

El Ingeniero de Proceso desea aprovechar los datos del muestreo para controlar no
solo el centrado del proceso - a través del diámetro medio -, sinó también su dis-
persión.

En este caso se plantea como objetivo obtener un desvío estándar para los diáme-
tros no superior a 1 mm., valor con el que asegura un elevado índice de capacidad
de su proceso, cumpliendo ampliamente con los requerimientos del cliente.

Nuevamente va utilizar como herramienta de cálculo la prueba de hipótesis, en este


caso sobre la varianza poblacional - o sobre la desviación estándar -.

Las características de esta prueba son las siguientes son las siguientes:

Formulación de Hipótesis

Hipótesis Nula H0: 2 = 

2   Prueba bilateral


Hipótesis Alternativa H1: 2 >  Prueba unilateral derecha
2 <  Prueba unilateral izquierda

Estadístico de Prueba

Valor Distribución

2
S
Yˆ  (n  1) 2 Chi-cuadrado con (n-1) grados de libertad

27
UNIDAD 1

Para el ejemplo que estamos analizando, las hipótesis serían las siguientes:

Hipótesis Nula H0: 2 = 1

Hipótesis Alternativa H1: 2 > 1

Si se rechaza H0, el ingeniero estará comprobando que el desvío es significativamente


mayor a 1 mm., y por lo tanto deberá implementar acciones en el proceso tendien-
tes a reducir la variabilidad a valores admisibles.

El estadístico de esta prueba tiene distribución chi-cuadrado ( 2) con (n-1) gra-
dos de libertad. Es otra distribución para variable continua ampliamente usada en
inferencia, definida sólo para valores positivos. Viene tabulada en función del nivel
de significación y de los grados de libertad. De acuerdo al valor de los g.l. tene-
mos una familia de curvas: cuando el valor del parámetro es pequeño la distribución
tiene asimetría positiva, pero a medida que los g.l. crecen la distribución se va ha-
ciendo cada vez más simétrica.

Para profundizar respecto del empleo de esta distribución, y de las pruebas de


hipótesis sobre la varianza, diríjase al siguiente Capítulo del Texto:

JI-CUADRADA Y ANALISIS DE VARIANZA

Busque el siguiente tema:

 Inferencias acerca de la varianza de una población

En particular vea lo referido a pruebas de uno y dos extremos sobre la varianza.


Resuelva los ejercicios pares del Texto, y verifique que sus resultados sean correc-
tos.


REVISION DE CONCEPTOS DESARROLLADOS

 prueba sobre la media Prueba de hipótesis en que se pone bajo prueba


el valor medio de una variable aleatoria normal
 distribución t de Student Distribución de probabilidad de una variable
aleatoria continua, utilizada en el análisis de in-
ferencia sobre medias
 grados de libertad Cantidad de valores que se pueden elegir libre-

28
UNIDAD 1

mente, o que no dependen de los demás valo-


res de un conjunto

 prueba sobre la varianza Prueba de hipótesis en que se pone bajo prue-


ba el desvío o la varianza de una variable
aleatoria normal

 distribución Chi-cuadrado Distribución de probabilidad de una va-


riable aleatoria continua, empleada en la
inferencia sobre la varianza

RECOMENDACIONES PRACTICAS

 Para tamaños de muestra superiores a los 30 elementos, desde el punto


de vista práctico es indistinto utilizar el estadístico Z o el T para realizar la
prueba de hipótesis sobre la media. Para muestras con más de 120 datos,
se utiliza directamente el estadístico Z.

 La selección del tipo de prueba, si es de uno o de dos extremos, depen-


de del objetivo del estudio, pero es importante definirlo antes de relevar
los datos, para que el criterio usado sea independiente de las observacio-
nes realizadas.

 Es conveniente emplear los gráficos de la distribución del estadístico de


prueba, y ubicar sobre los mismos la o las zonas de rechazo, para facilitar
la interpretación de los resultados de la prueba.

 Es importante respetar todos los pasos del procedimiento general de


una prueba de hipótesis, para evitar errores de planteo. No olvide de
formular claramente las hipótesis del problema.

 Es fundamental interpretar correctamente el resultado de una prueba, y


traducir las conclusiones en términos del problema planteado.

29
UNIDAD 1

1
El empleado encargado de controlar el diámetro de los resortes tipo A, sacó
una muestra de 10 resortes, que arrojó los siguientes valores:

150.8 150.0 150.2 150.6 149.5 150.5 150.3 151.5


151.0 150.7

a) Pruebe la hipótesis de que el diámetro medio no difiere significativamente


del valor
objetivo -150 mm.- para un nivel de significación del 5 %.

b) ¿Cómo se interpreta formalmente el resultado de la prueba?

c) Compruebe si el desvío estándar del diámetro no es superior a 1 mm.,


para un nivel de confianza del 1 %.

d) En base a los resultados obtenidos en los puntos a) y b) comente como


está funcionando el proceso de fabricación de los resortes A, y eventualmen-
te que tipos de ajustes habría que hacer para mejorar su comportamiento.

Confronte con la Solución Nº 1

2. PRUEBAS SOBRE EL MODELO

En la mayoría de las técnicas de inferencia desarrolladas hasta aquí existía una su-
posición implícita: que la variable en estudio tiene distribución Normal. ¿Cómo sa-
bemos si este supuesto realmente se cumple?

Por ejemplo, el responsable de medir los diámetros de los resortes tipo A, tiene que
determinar periódicamente si la variable que controla efectivamente tiene distribu-
ción Normal, antes de realizar cualquier análisis de inferencia.

Otro caso es cuando se necesita modelar el comportamiento de una variable


aleatoria, y el primer paso consiste en seleccionar la distribución de probabilidades
apropiada, en base al tipo de variable y al fenómeno que se pretende modelar. Una
vez elegido el modelo ¿cómo se puede comprobar si es el más adecuado para el
caso en estudio?

30
UNIDAD 1

En síntesis, una situación que se da frecuentemente en la práctica es la de disponer


de una muestra de observaciones de una variable aleatoria, y se debe comprobar si
proviene de una población con tal distribución.

Para resolver este tipo de problemas, es necesario emplear alguna de las denomi-
nadas pruebas de bondad de ajuste.

En Probabilidad y Estadística I vimos una prueba de bondad de ajuste clasifica-


da dentro de los métodos no paramétricos: la prueba de Kolmogorov-Smirnov.
Se trata de un procedimiento que compara las distribuciones de frecuencias acumu-
ladas teóricas y observadas. Vimos que se trata de una prueba bastante simple de
implementar, y que da buenos resultados cuando las muestras son pequeñas y no se
pueden aplicar otras metodologías. Su principal inconveniente es que el estadístico
de prueba empleado no tiene una distribución conocida, lo que limita la precisión
del método.

Cuando disponemos de un mayor número de datos, conviene utilizar la denominada


prueba chi-cuadrado de bondad de ajuste.

2.1 Prueba Chi-Cuadrado de bondad de ajuste

Este procedimiento de cálculo compara las distribuciones de frecuencia observa-


da -calculada a partir de los datos reales- y esperada -calculada en base al mode-
lo propuesto-:

Distribución
observada

Distribución
esperada

Gráfico Nº 1

31
UNIDAD 1

Si las discrepancias entre el modelo teórico y la realidad no son grandes, se asume


que el modelo representa adecuadamente el comportamiento de la variable consi-
derada.

Las características de esta prueba son las siguientes:

Formulación de Hipótesis

Hipótesis Nula H0: La variable X tiene distribución F(1, 2,..,p)

Hipótesis Alternativa H1: La variable X no tiene esa distribución

F es una distribución cualquiera, y i son sus parámetros

Estadístico de Prueba

Valor Distribución

2 con (k-p-1) grados de libertad


( foi  fei ) 2
siendo k el número de categorías, y
Yˆ  
fei2 p el número de parámetros del modelo

Esta es una prueba de un solo extremo, específicamente una prueba unilateral


derecha, que se puede utilizar para verificar la distribución de variables discretas y
continuas.

El estadístico de prueba compara las frecuencias observadas fo -obtenidas en


base a una muestra de la población de la variable en estudio- con las frecuencias
esperadas fe -calculadas en base al modelo propuesto-. Si la diferencia entre
ambas distribuciones es muy evidente, la prueba tenderá a rechazar la hipótesis
nula.

El estadístico tiene distribución chi-cuadrado con (k-p-1) grados de libertad, donde


k representa el número de valores que toma la variable -si es discreta- o el número
de intervalos en que se agrupan los datos -si es continua-, mientras que p es el
número de parámetros del modelo, generalmente estimados en base a la muestra
disponible.

32
UNIDAD 1

Dado que el estadístico de prueba es una suma de desvíos cuadráticos -entre las
frecuencias observadas y esperadas-, si ese valor es muy alto quiere decir que las
diferencias entre los valores calculados con el modelo teórico y los datos observa-
dos en la realidad son significativas. En ese caso hay suficiente evidencia como para
concluír que el modelo elegido no explica correctamente la distribución de la varia-
ble aleatoria, y por lo tanto se debe rechazar la hipótesis nula.

Para abordar el desarrollo completo de esta prueba, le sugiero retornar al siguiente


Capítulo del Texto:

JI-CUADRADA Y ANALISIS DE VARIANZA

Busque el siguiente tema:

 Ji-cuadrada como prueba de bondad de ajuste

Revise los ejercicios propuestos en el Texto, y resuelva al menos uno para variable
discreta y uno para variable continua, para familiarizarse con las características de
implementación propias de cada caso.


REVISION DE CONCEPTOS DESARROLLADOS

 Pruebas de bondad de ajuste Pruebas de hipótesis referidas a la


distribución de probabilidades de
una variable aleatoria.

 Prueba chi-cuadrado de Prueba basada en la comparación de


bondad de ajuste frecuencias observadas y esperadas
de una variable.

 Frecuencia observada Frecuencia determinada en base al


procesamiento de una muestra de
la población de la variable en estu-
dio.

 Frecuencia esperada Frecuencia teórica, calculada en


base al modelo hipotetizado en la
prueba.

33
UNIDAD 1

RECOMENDACIONES PRACTICAS

 Siempre que sea posible reunir un buen número de datos, es preferible


aplicar esta prueba para verificar la consistencia del modelo propuesto.

 Es conveniente que la cantidad de términos de la suma no sea demasia-


do pequeña, para que los grados de libertad de la prueba no sea demasia-
do baja.

 El estadístico de prueba es muy sensible a los valores extremos -en las


"colas" de la distribución- por lo que es recomendable no trabajar con
con clases cuya frecuencia esperada sea menor a 5. Cuando esto ocurre,
se pueden agrupar clases contiguas.

 Los resultados de la prueba no se ven afectados por el uso de intervalos


o clases de distinta amplitud.

El ingeniero de proceso le pide al encargado de controlar el diámetro de los


resortes tipo A, que seleccione una muestra suficientemente grande, como
para poder usar una prueba chi-cuadrado de bondad de ajuste para verificar
si los datos provienen de una población con distribución Normal. Después
de extraer la muestra y agrupar convenientemente los datos, el encargado de
control eleva al ingeniero la siguiente información:

Intervalo Frecuencia Observada

< 149.25 5
149.25 - 149.50 15
149.50 - 149.75 20
149.75 - 150.00 25
150.00 - 150.25 28
150.25 - 150.50 18
150.50 - 150.75 16
> 150.75 8

34
UNIDAD 1

Compruebe la hipótesis de que el diámetro de estos resortes tiene distribu-


ción Normal, para un nivel de significación del 5 %.

Confronte con la Solución Nº 2

3. PRUEBAS DE COMPARACION DE DOS POBLACIONES

El ingeniero responsable de la fabricación de los resortes tipo A, se encuentra


abocado al estudio comparativo del funcionamiento de dos máquinas que producen
esa pieza.

Las máquinas provienen de dos proveedores distintos, pero como él debe garanti-
zar a sus clientes una calidad homogénea más allá del equipamiento que usa, nece-
sita estar seguro de que las máquinas trabajen en forma parecida, produciendo
resortes similares en cuanto al nivel medio y a la dispersión de sus diámetros.

Nuevamente la prueba de hipótesis es una herramienta apropiada para realizar un


análisis de este tipo.

3.1 Prueba de comparación de varianzas

El ingeniero necesita comprobar periódicamente que la dispersión de la producción


de las dos máquinas sea la misma, lo que se puede realizar comparando las varianzas
o los desvíos de ambas poblaciones.

Por lo tanto, el planteo del problema en este caso es el siguiente:

Formulación de Hipótesis

Hipótesis Nula H0: 2 = 

2   Prueba bilateral


Hipótesis Alternativa H1: 2 >  Prueba unilateral derecha
2 <  Prueba unilateral izquierda

35
UNIDAD 1

Estadístico de Prueba

Valor Distribución

S12 F con (n1-1) grados de libertad en el numerador,


Fˆ 
S 22 y (n2-1) grados de libertad en el denominador

Si se rechaza H0, se estará comprobando que las dos máquinas funcionan con
distinta variabilidad, y por lo tanto se deberán efectuar los ajustes necesarios como
para revertir esta situación.

El estadístico de prueba de este procedimiento tiene distribución F, que es una


distribución de probabilidad para variable continua usada en inferencia cuando se
deben comparar varianzas. Esta distribución está definida sólo para valores positi-
vos, y tiene dos parámetros: los grados de libertad en el numerador, y los grados de
libertad en el denominador. Está tabulada en función de sus dos parámetros, y del
nivel de significación de la prueba, por lo que existe una familia de curvas de acuer-
do a los g.l. usados. Para valores bajos, la distribución tiene una fuerte asimetría
positiva, pero a medida que los g.l. crecen la curva se va haciendo cada vez más
simétrica.

El desarrollo de la prueba de comparación de varianzas se encuentra en el Texto,


dentro del siguiente Capítulo:

JI-CUADRADA Y ANALISIS DE VARIANZA

Identifique allí el siguiente tema:

 Inferencias acerca de la varianza de dos poblaciones

Resuelva los ejercicios pares propuestos en el Texto. Practique en especial el caso


de la prueba bilateral -de dos extremos-, para ejercitar el uso de la tabla de la
distribución F cuando hay que determinar valores críticos superior e inferior.

Importante: para analizar con mayor detalle los conceptos referidos a la distribu-
ción F, sus parámetros, y el cálculo de probabilidades con esta distribución, busque
dentro de este mismo Capítulo el tema Análisis de Varianza, en el apartado "La
distribución F".

36
UNIDAD 1


3.2 Pruebas de comparación de medias

El ingeniero de proceso debe comprobar si existen diferencias significativas entre


el nivel medio de los diámetros de los resortes tipo A producidos por las dos
máquinas.

Empleando nuevamente la técnica de prueba de hipótesis, el planteo correspon-


diente a este caso es el siguiente:

Formulación de Hipótesis

Hipótesis Nula H0: μ1 = μ2

μ1  μ2 Prueba bilateral
Hipótesis Alternativa H1: μ1 > μ2 Prueba unilateral derecha
μ1 < μ2 Prueba unilateral izquierda

Si se rechaza H0, se habrá comprobado que las dos máquinas producen un diá-
metro medio distinto, por lo que se deberán implementar acciones correctivas
sobre el proceso para eliminar esa falta de uniformidad.

Para seleccionar el estadístico de prueba correspondiente a este análisis, hay que


determinar en cuál de los siguientes casos nos encontramos:

Tamaño de muestra pequeño


 Muestras independientes Tamaño de muestra grande

 Muestras dependientes

Para el caso de muestras independientes, la primera condición es que las mues-


tras sean extraídas de dos poblaciones diferentes. Además, si las dos muestras
tienen más de 30 elementos, el estadístico de prueba que se usa es el siguiente:

37
UNIDAD 1

Estadístico de Prueba

Valor Distribución

ˆ 
x 1  x 2 
Normal estandarizada N(0,1)
 2
 2
1
 2

n1 n 2

Si las varianzas poblacionales no son conocidas, se pueden usar estimaciones


muestrales de esos parámetros.

Cuando el tamaño de las dos muestras es pequeño, digamos menor a las 30 obser-
vaciones, no se puede usar el mismo estadístico de prueba del caso anterior. Para
encontrar el estadístico de prueba apropiado, es necesario verificar si las varianzas
de las dos poblaciones son iguales, lo que se puede realizar a través de una
prueba de comparación de varianzas.

Si el supuesto de igualdad de varianzas se cumple, el estadístico de prueba es el


siguiente:

Estadístico de Prueba

Valor Distribución

Tˆ 
x 1  x2 
1 1
ˆ c 
n1 n 2
T de Student con (n1+ n2-2) grados de libertad
( n1  1) S 12  ( n 2  1) S 22
ˆ c 
n1  n 2  2

En este caso, para calcular el error estándar de la diferencia de medias se utiliza una
estimación conjunta de la varianza poblacional, denominada varianza combinada
que es un promedio ponderado de las varianzas de las dos muestras.

Cuando la condición de independencia no se cumple, por ejemplo cuando compa-

38
UNIDAD 1

ramos el rendimiento de un grupo de operarios antes y después de un programa de


capacitación, o cuando medimos la misma propiedad de un producto mediante dos
técnicas diferentes, más que comparar las medias conviene comprobar la diferencia
entre los resultados obtenidos en ambas condiciones.

En estos casos, el planteo de la prueba es el siguiente:

Formulación de Hipótesis

Hipótesis Nula H0: d = D0 (caso particular: D0 = 0)

d  D0 Prueba bilateral
Hipótesis Alternativa H1: d > D0 Prueba unilateral derecha
d < D0 Prueba unilateral izquierda

Estadístico de Prueba

Valor Distribución

Tˆ 
d   
d

Sd / n T de Student con (n-1) grados de libertad

La Hipótesis Nula se lee de la siguiente manera: "la diferencia media es igual a


D0". Si no se rechaza H0 equivale a comprobar que las diferencias entre los resulta-
dos de dos procedimientos o tratamientos aplicados a la misma unidad de observa-
ción no es significativa.

Bien, después de esta introducción al tema, Ud. está en condiciones de profundizar


su tratamiento en el Texto. Busque el siguiente Capítulo:

PRUEBA DE HIPOTESIS: PRUEBAS DE DOS MUESTRAS

Estudie los siguientes temas:

 Pruebas para diferencias entre medias: Tamaños de muestras grandes


 Pruebas para diferencias entre medias: Tamaños de muestras pequeños

39
UNIDAD 1

 Prueba de diferencias entre medias con muestras dependientes

Resuelva los ejercicios pares incluidos al final de cada tema, y compare sus resulta-
dos con los del Texto.

 REVISION DE CONCEPTOS DESARROLLADOS


 prueba sobre comparación Prueba de hipótesis que sirve para com-
de varianzas probar la igualdad dos varianzas
poblacionales.

 distribución F Distribución de probabilidad de una va-


riable aleatoria continua, empleada en la
inferencia estadística .

 prueba sobre la igualdad Prueba de hipótesis usada para compro-


de medidas bar la igualdad entre las medias de dos
poblaciones.

 muestras independientes Muestras tomadas de dos poblaciones di-


ferentes

 muestras dependientes Muestras cuyos valores están equipara-


dos entre sí, o apareados

 varianza combinada Estimador de la varianza conjunta de dos


muestras, consistente en el promedio
ponderado de las varianzas muestrales.

RECOMENDACIONES PRACTICAS

 Antes de efectuar la comparación de las medias de dos poblaciones, para


el caso de muestras pequeñas e independientes, es conveniente verificar la
igualdad de varianzas poblacionales, usando la prueba correspondiente.

 El cálculo de la varianza combinada en pruebas de comparación de medias


con muestras pequeñas, tiene como objetivo aprovechar al máximo la infor-
mación contenida en las dos muestras sobre la dispersión de la variable ana

40
UNIDAD 1

lizada. Si las dos muestras tienen el mismo tamaño, se calcula directamente el


promedio de las varianzas muestrales.

3
Para controlar el funcionamiento de dos Máquinas -1 y 2- que producen el
resorte tipo A, el empleado encargado de controlar el diámetro de esos re-
sortes, sacó una muestra de cada máquina, procesó los datos y obtuvo los
siguientes resultados:

Máquina 1: n1 = 30 S12 = 0.59


Máquina 1: n2 = 25 S22 = 0.96

Explique qué tipo de prueba debe usar para comprobar si la variabilidad de


ambos equipos puede considerarse similar, y efectúe la verificación para un
nivel de significación del 10 %.
Confronte con la Solución Nº 3

Continuando con el análisis del funcionamiento de las dos Máquinas, el em-


pleado de control seleccionó nuevas muestras de cada máquina, obteniendo
los siguientes resultados:

Máquina 1: n1 = 50 x1 = 150.8 S12 = 0.88


Máquina 1: n2 = 75 x2 = 150.1 S22 = 0.67

Explique qué tipo de prueba debe usar para decidir si las dos máquinas tra-
bajan igual en cuanto al nivel medio, y efectúe la comprobación para un nivel
de significación del 5%.

Confronte con la Solución Nº 4

41
UNIDAD 1

Con el fin de chequear periódicamente si las Máquinas 1 y 2 producen el


mismo diámetro medio para los resortes A, el ingeniero de proceso dispuso
realizar un control diario de 15 piezas producidas en cada máquina. El prime-
ro de los controles realizados produjo los siguientes resultados:

Máquina 1: x1 = 149.3 S12 = 1.01


Máquina 1: x2 = 150.6 S22 = 0.90

Asumiendo que las varianzas poblacionales son iguales, explique qué tipo de
prueba debe usar para probar si las dos máquinas producen el mismo diáme-
tro medio, y efectúe la comprobación para un nivel de significación del 10%.

Confronte con la Solución Nº 5

Para mejorar el sistema de medición de los diámetros de resortes, se desea


incorporar un nuevo dispositivo de medición. A fin de verificar el funciona-
miento del nuevo dispositivo, se elige una muestra al azar de 8 resortes tipo
A, y se miden sus diámetros con el dispositivo viejo y con el nuevo. Los
valores resultantes fueron:

Viejo | 150.6 150.0 149.8 150.3 150.5 150.9 150.5 150.2


Nuevo | 150.1 149.6 150.1 150.0 150.0 150.7 150.5 149.8

El ingeniero cree advertir a través de estos datos que el dispositivo nuevo


tiende a producir Lecturas menores al dispositivo viejo.

Explique qué tipo de prueba debe usar para verificar si la apreciación del
ingeniero es correcta, y compuébelo usando un nivel de significación del 5 %.

Confronte con la Solución Nº 6

42
UNIDAD 1

Conclusiones

En esta Unidad hemos completado el tratamiento de las pruebas de hipótesis, una


de las herramientas estadísticas de mayor uso, desde la investigación básica hasta
las aplicaciones prácticas en todas las disciplinas. Es una técnica con una base
conceptual muy sólida, fácil de implementar, y sus resultados, correctamente inter-
pretados, proporcionan información de gran utilidad para la toma de decisiones.

El análisis del tema comenzó en PyE I, con la prueba sobre la media de una pobla-
ción con varianza conocida, y la prueba de Kolmogorov-Smirnov sobre el modelo.
En esta oportunidad hemos incorporado el resto de las pruebas más importantes:

 Pruebas sobre los parámetros de una población:

- Prueba sobre la media con varianza desconocida y muestras pequeñas


- Prueba sobre la varianza

 Pruebas sobre los parámetros de dos poblaciones:

- Prueba sobre comparación de varianzas


- Prueba sobre comparación de medias con muestras pequeñas e inde-
pendientes
- Prueba sobre comparación de medias con muestras grandes e inde-
pendientes
- Prueba sobre comparación de medias con muestras dependientes

 Pruebas sobre el modelo:

- Prueba Chi-cuadrado de Bondad de Ajuste

El manejo de estos procedimientos, que sirven para estimar propiedades muy im-
portantes de una población, implica un avance considerable en su formación esta-
dística, ya que el uso de esta herramienta es fundamental dentro de cualquier estu-
dio estadístico, como podrá comprobarlo a través del resto de las Unidades.

Las pruebas de hipótesis serán referenciadas con mucha frecuencia cuando veamos
las técnicas "explicativas" de la estadística, como el análisis de regresión y correla-
ción o el análisis de varianza, dentro de las técnicas inferenciales usadas en el con-
trol de calidad, y en cualquier estudio estadístico donde sea necesario estimar los
parámetros de una población o comprobar la distribución de una variable aleatoria.

43
UNIDAD

1
SOLUCIONES A LAS
A CTIVIDADES DE PROCESO
UNIDAD 1

1. x = 150.51 mm. s = 0.5547 mm.


a. Testimado = 2.907 Tcrítico = ±2.262

Conclusión: la media es significativamente diferente del valor objetivo.

b. Para el nivel de significación planteado, y los datos disponibles, existe


suficiente evidencia como para rechazar que la media sea igual a 150.

c. 2 estimado = 2.769 2 crítico = 21.666

Conclusión: el desvío no es superior a 1 mm.

d. La dispersión del proceso es adecuada, pero no así el centrado. Hay que


tomar acciones correctivas para llevar el nivel medio de los diámetros
más cerca del valor objetivo.

2. La muestra analizada efectivamente proviene de una población con distribución


Normal.

3. Prueba de comparación de varianzas.

Festimado = 0.61 FCrít.Inf. = 0.53 FCrít.Sup. = 1.92

Conclusión: las varianzas de ambos equipos no son significativamente dife-


rentes.

4. Prueba de comparación de medias con muestras grandes e independientes.

Zestimado = 3.99 Zcrítico = ±1,96

Conclusión: las dos máquinas producen un diámetro medio significativamente


diferente.

5. Prueba de comparación de medias con muestras pequeñas e independientes.

Testimado = -3.644 Tcrítico = ±1.701

Conclusión: las dos máquinas no producen el mismo diámetro medio.

6. Prueba sobre la diferencia con muestras dependientes.

44
UNIDAD 1

Testimado = 2.545 Tcrítico = 1.895

Conclusión: el dispositivo nuevo produce lecturas significativamente meno-


res que el viejo.

45
UNIDAD

1
UNIDAD 1
A CTIVIDADES DE
A UTOEV
UTOEV ALUACION
OEVALUACION

1. ¿Cuál es el objetivo de las pruebas de hipótesis?

2. ¿Qué pruebas conoce sobre la media de una población?

3. ¿Para qué sirven las pruebas de comparación de dos poblaciones?

4. ¿Qué elementos de juicio hay que tener en cuenta al comparar dos medias
poblacionales?

5. ¿Cuál es el objetivo de las pruebas sobre el modelo?

6. Explique en qué se basa la prueba Chi-cuadrado de bondad de ajuste.

7. El resorte tipo "RRR" tiene un diámetro exterior con la siguiente especificación


de ingeniería: 100 mm. ± 1 mm.

Se saca una muestra de 125 resortes producidos en una cierta jornada. El muestreo
comienza desde que se inicia la producción. Las piezas se miden y se registran en
orden consecutivo. Los diámetros registrados son los siguientes:

( 1) 99.80 ( 19) 99.83 ( 37) 100.10 ( 55) 100.45


( 2) 99.64 ( 20) 99.95 ( 38) 99.79 ( 56) 99.83
( 3) 99.76 ( 21) 99.91 ( 39) 99.94 ( 57) 99.95
( 4) 100.01 ( 22) 99.53 ( 40) 99.62 ( 58) 99.97
( 5) 99.83 ( 23) 99.60 ( 41) 99.95 ( 59) 100.07
( 6) 99.65 ( 24) 99.69 ( 42) 99.98 ( 60) 99.85
( 7) 99.51 ( 25) 99.72 ( 43) 99.81 ( 61) 100.11
( 8) 99.78 ( 26) 99.80 ( 44) 99.70 ( 62) 100.16
( 9) 99.87 ( 27) 99.84 ( 45) 99.94 ( 63) 100.10
( 10) 100.01 ( 28) 100.22 ( 46) 100.0 ( 64) 100.18
( 11) 99.52 ( 29) 99.55 ( 47) 100.13 ( 65) 100.12
( 12) 99.54 ( 30) 99.99 ( 48) 99.85 ( 66) 99.88
( 13) 99.87 ( 31) 99.92 ( 49) 100.04 ( 67) 99.93
( 14) 99.80 ( 32) 99.81 ( 50) 100.0 ( 68) 100.0
( 15) 99.84 ( 33) 99.69 ( 51) 100.21 ( 69) 99.75
( 16) 99.71 ( 34) 99.81 ( 52) 100.08 ( 70) 99.95
( 17) 99.82 ( 35) 99.85 ( 53) 100.27 ( 71) 100.21
( 18) 99.82 ( 36) 100.24 ( 54) 100.26 ( 72) 99.86

46
UNIDAD 1

( 73) 100.11 ( 91) 99.74 (109) 99.92


( 74) 99.88 ( 92) 99.97 (110) 99.96
( 75) 100.28 ( 93) 99.67 (111) 99.74
( 76) 100.16 ( 94) 100.05 (112) 99.99
( 77) 99.95 ( 95) 99.92 (113) 99.73
( 78) 100.16 ( 96) 100.19 (114) 100.0
( 79) 99.70 ( 97) 100.21 (115) 100.08
( 80) 99.97 ( 98) 99.96 (116) 99.90
( 81) 99.86 ( 99) 100.16 (117) 100.0
( 82) 99.98 (100) 100.16 (118) 100.14
( 83) 100.23 (101) 100.33 (119) 100.15
( 84) 100.19 (102) 99.98 (120) 99.90
( 85) 100.20 (103) 99.76 (121) 100.20
( 86) 100.05 (104) 99.88 (122) 100.14
( 87) 100.21 (105) 100.06 (123) 99.68
( 88) 99.75 (106) 99.86 (124) 100.04
( 89) 100.0 (107) 99.96 (125) 99.66
( 90) 99.78 (108) 100.06

a. Considerando los primeros 20 datos, compruebe para un nivel de significación


del 5 % si el diámetro medio coincide con el valor nominal de la especificación.

b. Para que el proceso tenga una dispersión aceptable, el ingeniero opina que la
varianza de los diámetros no debe ser superior a 0.01 mm2. En base a los mismos
datos del punto anterior, pruebe si se cumple esa condición, para un nivel de signi-
ficación del 5 %.

c. Efectúe una prueba Chi-cuadrado de bondad de ajuste con todos los datos,
para verificar la normalidad de la variable.

d. Después de tomar las primeras 45 piezas, se decide efectuar una corrección en


la puesta a punto, para mejorar el valor de los diámetros producidos. Realice la
prueba de comparación de varianzas entre los primeros 45 datos y los 80 restantes,
es decir antes y después de la modificación de la puesta a punto, para un nivel de
significación del 10 %. Si comprueba la igualdad de varianzas, efectúe la compara-
ción de medias antes y después del ajuste, para un nivel de significación del 5 %.
Interprete los resultados obtenidos.

47
ANALISIS DE
REGRESION Y
CORRELACION

UNIDAD

2
UNIDAD

2
UNIDAD 2
ORIENTACIÓN DEL
APRENDIZAJE

Las técnicas de regresión y de correlación permiten estudiar posibles relaciones


entre variables, por lo que son de enorme utilidad cuando se desea medir el grado
de asociación entre dos variables, o predecir el comportamiento de una variable
difícil de cuantificar en función de otra conocida.
Por ejemplo, un círculo de calidad formado dentro de la firma Campeón S.A. está
abocado al estudio de una cierta característica de calidad de los resortes que fabri-
can. En primer lugar, el grupo de trabajo se reúne y elabora la "espina de pez", que
resume todas las fuentes de variación que afectan a la característica.

Gráfico Nº 1

Al área de Producción le interesa determinar el efecto que tiene el "Estado del


Herramental" sobre la variación de la característica analizada, mientras que el Area
de Recursos Humanos desea conocer la influencia del "Entrenamiento del Opera-
rio" sobre la variable considerada.
Del análisis de la espina de pez se ve que existen muchos factores que actúan sobre
el proceso condicionando los valores de la variable de respuesta, por lo que resulta
sumamente interesante analizar el comportamiento conjunto de cada uno de los
factores con la respuesta obtenida.

Inmediatamente surgen preguntas como las siguientes:


¿Es correcto suponer que las dos cantidades analizadas - factor y respuesta
- están relacionadas?
En caso afirmativo ¿cuál es forma que adopta esa relación?

El análisis de correlación permite decidir si existe asociación entre las dos


variables.

52
UNIDAD 2

Esquema
Tema
Conceptual
Análisis de Correlación
y Regresión

Objetivo
General
D e t e r m i n a r t ip o y g r a d o d e r e la c ió n
e n tr e d o s o m á s v a r i a b le s

Objetivos
Específicos

Determinar el Identificar la
nivel de relación funcional
asociación entre entre dos o más
dos variables variables

Herram ientas
usadas
Análisis de Un solo factor: Varios
correlación Regresión factores:
simple Regresión
múltiple

53
UNIDAD 2

El análisis de regresión permite determinar cómo es la relación funcional entre


una variable dependiente -efecto- y una o varias variables independientes -causa-.

En esta Unidad se desarrollan las técnicas de correlación y regresión de acuerdo al


siguiente esquema general:

Objetivos del
Aprendizaje
Estudiar la relación entre dos variables

Medir el grado de asociación entre dos variables

Ajustar modelos de regresión lineal simple

Conocer el uso de modelos de regresión múltiple

Contenidos
1. Análisis de correlación.
2. Análisis de regresión.
3. Regresión múltiple.

54
UNIDAD 2

MODALIDAD DE TRABAJO

El desarrollo de esta Unidad se realiza en base al siguiente ordenamiento:

ACTIVIDAD MATERIAL CONCEPTOS EJERCITACION


UTILIZADO DESARROLLADOS PROPUESTA
Tema 1: GUIA „ Objetivos. Ejemplo introductorio
Análisis de Correlación „ Diagramas de dispersión.
„ Coeficiente de correlación.
„ Prueba sobre el coeficiente.
Revisión de conceptos GUIA
desarrollados
Actividades de proceso GUIA Ejercicio
Introducción al Tema 2: GUIA Ejemplo introductorio
Análisis de Regresión
Lectura de la bibliografía TEXTO „ Tipos de relaciones entre Ejercitación del Texto
obligatoria „ Variables
„ Modelo lineal simple.
„ Ajuste por mín. cuadrados.
„ Error estándar de la estimac.
„ Cooefic. de determinación
„ Inferencias sobre los
„ Parámetros del modelo.
Revisión de conceptos GUIA Ejemplo resuelto
desarrollados
Actividades de proceso GUIA Ejercicios
Introducción al Tema 3: GUIA Ejemplo introductorio
Regresión Múltiple
Lectura de la bibliografía TEXTO „ Conceptos generales. Ejercitación del Texto
obligatoria „ Modelo general.
„ Ajuste del modelo.
„ El uso de la computadora.
„ Inferencias sobre los
„ Parámetros del modelo.
„ Análisis de los residuos.
Revisión de conceptos GUIA Ejemplo resuelto
desarrollados
Actividades de proceso GUIA Ejercicio
Conclusiones GUIA
Actividades de GUIA Ejercitación
Autoevaluación teórico-práctica

Bibliografía Obligatoria
LEVIN, Richard y RUBIN, David. Estadística para Administradores. Sexta Edición. Editorial
Prentice-Hall. México.1996.

55
UNIDAD 2

1. ANALISIS DE CORRELACION

El objetivo del análisis de correlación es medir el grado de asociación que existe


entre dos variables.

Para explorar la posible vinculación entre dos variables, el primer paso consiste en
dibujar el diagrama de dispersión de los datos, que es un gráfico bidimensional en
el cual se vuelcan los resultados de la observación conjunta de ambas variables.

Por ejemplo, un círculo de calidad de la firma Campeón S.A. quiere estudiar la


relación que existe entre las Horas de Entrenamiento de un operario, y el Por-
centaje de Producción Defectuosa del mismo.
Una muestra de 7 operarios elegidos al azar, para los cuales se registró las horas de
capacitación recibidas y el porcentaje de piezas no conformes que producen, arro-
jó los resultados que se visualizan en el siguiente diagrama:

Gráfico Nº 2

Posteriormente, el Grupo de Trabajo dispuso analizar la relación entre el Porcenta-


je de Producción Defectuosa de un operador y las Horas de Sueño del mismo.

56
UNIDAD 2

Otra muestra de siete operarios permitió armar el siguiente gráfico:

Hrs. de Sueño

Gráfico Nº 3

Como se puede apreciar en los diagramas anteriores, en el primer caso existe una
clara correspondencia entre las dos variables, cosa que no es tan evidente en el
segundo gráfico. ¿Cómo es posible determinar en forma analítica el grado de aso-
ciación que existe entre las variables analizadas en los ejemplos anteriores?

Una alternativa es estudiar el grado de variación conjunta, o de covariación, que


existe entre las dos variables. Para ello se puede calcular una medida analítica de-
nominada covarianza entre x e y:
_ _
Σ (xi-x) (yi - y)
___________________
Cov(x,y) =
n-1
Una forma más simple de calcular la covarianza, es utilizando la fórmula de traba-
jo:
__
Σ xi-yi - nxy
Cov(x,y) = ___________________
n-1

57
UNIDAD 2

El signo de la covarianza indica el tipo de asociación entre las dos variables: un


resultado positivo indica covariación "directa" -a medida que aumenta x, aumenta
y-, mientras que un valor negativo expresa covariación "inversa" entre ambas varia-
bles. La magnitud de la covarianza representa el grado de asociación entre x e y: a
mayor valor de la covarianza -en valor absoluto- más fuerte asociación entre las
dos variables. Si la covarianza es nula, significa que las variables no covarían -
cuando una varía, la otra "no responde"-, es decir que son independientes entre sí.

En términos prácticos, la covarianza es una cantidad bastante difícil de interpretar,


ya que por un lado tiene las unidades de x e y, y por otro no es simple entender qué
expresa concretamente su valor.

Para salvar estos inconvenientes se calcula una cantidad denominada coeficiente


de correlación, que se denota como ρ. El estimador muestral de ρ se denomina r -
recuerde que se usa notación griega para los parámetros y latina para los
estimadores-, y se calcula de la siguiente manera:

Cov(x,y)
_______________
r=
SxSy

Es decir que se divide la covarianza por el producto de los desvíos de ambas varia-
bles, obteniéndose un índice adimensional, que varía entre -1 y +1. Si el coeficiente
de correlación tiende a uno en valor absoluto, indica un fuerte grado de asociación
lineal entre las variables. En cambio, cuando el coeficiente tiende a cero, existe un
débil grado de asociación lineal.

Para comprender cómo es el comportamiento de las variables para diferentes valo-


res de r, vamos a analizar las siguientes figuras:

58
UNIDAD 2

(a)
y

x
Gráfico Nº4

(b)

x
Gráfico Nº5

59
UNIDAD 2

(c)
y

x
Gráfico Nº6

(d)
y

Gráfico Nº7

60
UNIDAD 2

En el caso (a) existe un fuerte grado de asociación lineal directa entre x e y, lo


mismo en el caso (b), aunque en este último caso es de tipo inversa. En el caso (c)
existe un débil grado de asociación lineal entre las variables. Finalmente, el caso (d)
muestra una situación muy particular: el coeficiente de correlación es nulo, dado que
no existe asociación de tipo lineal, pero ello no quiere decir que no exista otro tipo
de vinculación -no lineal- entre las variables analizadas.

Cuando el coeficiente de correlación es exactamente igual a 1, ó a -1, existe asocia-


ción lineal perfecta entre x e y. Para demostrar este caso vamos a usar la ecuación
de una recta:

y = 10 - 2 x

Generamos la muestra considerando 3 puntos de esa recta:

x 1 2 3
y 8 6 4

Calculamos los valores que intervienen en la formulación de r:

x =2 Sx = 1
y =6 Sy = 2
Cov(x,y) = [32 - 3x2x6] / (3-1) = -2

Finalmente calculamos el coeficiente de correlación:

r = -2 / (1 x 2) = -1
Este resultado indica una asociación lineal perfecta -de tipo inversa- entre x e y,
lo cual es lógico pues los puntos fueron generados a partirde la ecuación de una
recta.

61
UNIDAD 2

Ahora bien, en un caso real es poco probable que el coeficiente de correlación sea
exactamente igual a uno. También sería muy raro que el r valga cero, indicando total
ausencia de asociación lineal entre las variables. Cuando el coeficiente de correla-
ción da un valor muy bajo, se plantea la necesidad de decidir hasta qué punto se
puede pensar que el r no es significativamente distinto de cero, y por lo tanto que las
variables no están relacionadas.

Una forma de resolver esta cuestión es efectuando la siguiente prueba de hipótesis


sobre el coeficiente de correlación:

H0: ρ=0

H1: ρ1≠ 0

Si no se rechaza H0, se estará comprobando que el coeficiente de correlación no es


significativo, y por lo tanto que no hay asociación lineal entre las variables -las
variables son linealmente independientes-.

El estadístico de prueba es el siguiente:

r
T=
(1 − r 2 )
(n − 2)

Esta cantidad tiene distribución t de Student con (n-2) grados de libertad.

Se fija el nivel de significación de la prueba -a-, y se calculan los puntos críticos:

tc = t1-a/2;n-2

Finalmente, si se rechaza la hipótesis nula.

62
UNIDAD 2

Por ejemplo, para los 10 datos del ejemplo de la Figura (c), se obtuvo un coeficien-
te de correlación de 0.181 Para decidir si existe o nó asociación lineal entre las
variables, hacemos la prueba de hipótesis sobre p:

H0: r=0
H1: r¹0

0.181
T= = 0.52
(1 − 0.1812 )
(10 − 2)

Se adopta a = 0.05 Þ tc = ±2.306

Conclusión: y por lo tanto no se rechaza H0 -es decir que las variables son
linealmente independientes-.

REVISION DE CONCEPTOS DESARROLLADOS

• diagrama de Gráfico bidimensional en el que se disponen los


dispersión val ores observados conjuntamente para las va-
riables x e y en cada una de las unidades
muestrales.

• análisis de correlación Técnica usada para decidir si dos variables es-


tán linealmente relacionadas entre sí.

• covarianza Cantidad que mide el grado de variación con-


junta de dos variables.

• coeficiente de Cantidad que mide el grado de asociación


correlación lineal entre dos variables, cuyo valor varía
entre -1 y +1, indicando el tipo de asocia-
ción -inversa o directa- y la fuerza de la mis-
ma.

63
UNIDAD 2

RECOMENDACIONES PRACTICAS

• Es recomendable iniciar cualquier análisis de asociación entre dos


variables dibujando el diagrama de dispersión con los datos de la
muestra disponible. Este gráfico pone rápidamente en evidencia la
existencia o ausencia de relación, y puede evitarnos cálculos inne-
cesarios. También permite poner de manifiesto cuál es el tipo de
relación existente entre las variables. Por otra parte, es conveniente
investigar cualquier valor atípico antes de proseguir con el análisis,
ya que puede provenir de algún error de medición, o de un planteo
incorrecto del problema. Finalmente, para que la interpretación del
diagrama no nos lleve a conclusiones inexactas, debe estar confec-
cionado en una escala adecuada.

• El coeficiente de correlación mide la "fuerza" de la asociación


lineal entre dos variables, pero no existe una regla única para inter-
pretar el significado de su valor, ya que depende en gran medida de
la aplicación concreta de la que se trate.

• Recuerde que un coeficiente de correlación nulo -o cercano a


cero- indica ausencia de asociación "lineal" entre las variables ana-
lizadas, pero esto no descarta que pueda existir algún otro tipo de
relación entre las mismas.

• En el análisis de correlación, no se exige que exista "causalidad"


entre las variables analizadas. Por ejemplo, se puede establecer el
grado de asociación entre los gastos de electricidad y de supermer-
cado de una familia tipo, aún cuando ninguna de ellas "depende" de
la otra.

64
UNIDAD 2

1
Una empresa necesita decidir acerca de la conveniencia o no de publicitar
sus servicios mediante el envío de facsímiles. Para ello ha dispuesto analizar
la relación entre el "Número de Fax enviados" y la "Cantidad de Servicios
Vendidos". Una muestra con los resultados de las últimas cinco semanas per-
mitió relevar los siguientes valores:

Nro. de Fax enviados 30 45 50 60 80


Nro. de Servicios Vendidos 10 50 20 80 50

a. Dibuje el diagrama de dispersión de los datos.


b. Comente si es posible visualizar algún tipo de relación entre las variables.
c. Calcule el coeficiente de correlación, y en base a su resultado indique en
que medida puede suponerse que las ventas aumentan al enviar un mayor
número de facsímiles.
d. Efectúe la prueba de hipótesis sobre el coeficiente de correlación, e inter-
prete el resultado obtenido.

Confronte con la solución Nº 1

2. ANALISIS DE REGRESION

El análisis de regresión tiene como objetivo estimar la relación funcional que vincula
a una variable dependiente con una o varias variables independientes. En este
caso debe existir una relación de causalidad entre las variables -cosa que no
necesariamente debe ocurrir en el análisis de correlación-.

Por ejemplo, el Supervisor de una de las líneas de producción de la firma Campeón


S.A. está analizando el comportamiento de la temperatura de aceite de la cuba
de temple, en función de la hora desde que se inició la jornada de trabajo. El ha

65
UNIDAD 2

observado que durante la mañana la temperatura del aceite va creciendo a medida


que transcurren las horas de trabajo, ya que a pesar de que existe un sistema de
enfriamiento, el aumento de la temperatura ambiente y el número de piezas templa-
das provocan esa tendencia en los datos.

La evolución de la temperatura del aceite durante un día cualquiera se refleja en el


siguiente gráfico, armado con los datos que le suministró el Supervisor al Ingeniero
de Procesos:

Hora
Gráfico Nº 8

Como se puede apreciar, existe una clara relación -dependencia- entre la tempe-
ratura del aceite y la hora del día. Si se pudiera modelar esa relación, el Supervisor
contaría con una herramienta muy útil para administrar el proceso. Se podría, por
ejemplo, conocer de antemano la evolución de la temperatura, estimar el valor de la
temperatura en diferentes momentos del día, determinar los períodos más críticos
debido a altas o bajas temperaturas, etc., y aprovechar esa información para ope-
rar el proceso de la mejor manera posible.

De hecho es posible plantear un modelo que represente la relación funcional entre la


temperatura y la hora del día, y las técnicas que se usan para identificar el mejor

66
UNIDAD 2

modelo posible forman parte del análisis de regresión.

Existen distintos tipos de regresiones:

• Regresión Simple: Se relaciona un variable dependiente con una sola


variable independiente:
y = f(x)

• Regresión Múltiple: Se relaciona una variable dependiente con varias


variables independientes:
y = f(x1, x2, …, xp)

A su vez, cada uno de estos tipos de regresiones pueden ser:

• Regresión Lineal: La función es lineal respecto de sus


parámetros:
y = a + b x;

• Regresión no Lineal: La función no es lineal respecto de alguno de


sus parámetros:
y = a bx; y = c xd; y = a + b2 x

Como en todo proceso de modelación, debemos seguir los siguientes pasos:

a. Seleccionar el modelo adecuado.


b. Ajustar el modelo.
c. Evaluar la calidad del ajuste.
d. Adoptar el modelo propuesto, o volver al paso a).

Veamos brevemente en qué consiste cada una de estas etapas, y las herramientas
estadísticas que se utilizan:

67
UNIDAD 2

a. Selección del modelo

Lo primero que hay que hacer en cualquier análisis de relación entre variables es
dibujar el diagrama de dispersión de los datos, para inspeccionar visualmente el
comportamiento conjunto de las variables analizadas. Puede ocurrir que no se aprecie
ningún tipo de vinculación entre las variables, por lo que no tiene sentido continuar
con el análisis de regresión, o por el contrario el gráfico puede ser útil para eviden-
ciar el tipo de relación existente, y facilitar la identificación del modelo más apropia-
do.

A este análisis preliminar hay que agregar toda otra información que pueda ser de
utilidad para medir la relación entre las variables, como por ejemplo el coeficiente
de correlación, que da una idea del grado de asociación lineal entre las mismas.

b. Ajuste del modelo

Una vez elegido el modelo, hay que estimar sus parámetros. Para el caso de un
modelo lineal simple, el modelo general es el siguiente:
y=α+βx

donde a y b son los parámetros poblacionales, y deben ser estimados a partir de los
datos de una muestra representativa.

El criterio de estimación generalmente usado se basa en minimizar los desvíos -o


"errores"- entre la recta estimada y los valores observados. El procedimiento de
estimación que emplea este criterio se denomina método de mínimos cuadrados,
porque minimiza la suma de los desvíos cuadráticos con respecto a la recta de
regresión. Los coeficientes obtenidos -que denotamos como a y b-, se denominan
coeficientes mínimo cuadráticos.

El modelo "estimado" -ajustado por mínimos cuadrados- se expresa del siguiente


modo:

y=a+bx

68
UNIDAD 2

Una vez ajustado el modelo, podemos hacer "estimaciones" de la variables depen-


diente para diferentes valores de la variable independiente. Estas estimaciones pue-
den ser puntuales o por intervalos de confianza.

c. Verificación del modelo


Después de ajustar la recta de regresión, resta evaluar si el modelo representa en
forma adecuada la relación entre x e y. Una forma intuitiva de hacerlo es superpo-
niendo la recta obtenida sobre el diagrama de dispersión, observando qué tan bien
se ajusta a los datos. Sin embargo, como este tipo de evaluación puede ser muy
subjetivo, hay que calcular alguna medida analítica, que permita medir objetivamen-
te la calidad del ajuste obtenido.
Una cantidad que se puede calcular es el error estándar de la estimación, que
mide la dispersión de la variable dependiente y en torno a la recta de regresión.
Obviamente, a mayor valor del error estándar, mayor variabilidad de y, y por ende
menor representatividad de la recta obtenida.
Otra medida muy útil es el coeficiente de determinación, que mide el porcentaje
de variación de la variable dependiente y -al variar la variable independiente x- que
es "explicado" por la recta de regresión. Es una cantidad que varía entre cero y uno:
cuando el coeficiente vale uno, indica que el 100 % de la variación de y es explica-
do por el modelo -ajuste perfecto-, y cuando vale cero significa que el modelo no
explica nada de la variación de y.

Finalmente, se pueden hacer inferencias sobre los parámetros a y b, usando inter-


valos de confianza o pruebas de hipótesis. Estos procedimientos permiten determi-
nar si los parámetros son significativos o nó, lo que permite evaluar la representatividad
del modelo ajustado.

El uso de todas estas herramientas de análisis permite establecer con bastante cla-
ridad si el modelo elegido es útil o no.

La información necesaria para implementar las técnicas mencionadas, la va a en-


contrar en el Texto, dentro del siguiente Capítulo:

69
UNIDAD 2

REGRESION SIMPLE Y CORRELACION


Busque los siguientes temas:

• Introducción
En este apartado se ven conceptos básicos muy importantes como el análisis de
relación entre variables, el significado de regresión, los tipos de relaciones
entre variables, y el uso de los diagramas de dispersión. Resuelva los ejercicios
que propone el Texto al final del tema.

• Estimación mediante la línea de regresión


En este punto se desarrolla todo lo relativo al uso de los modelos lineales sim-
ples, el ajuste por mínimos cuadrados, y la verificación del modelo. En particu-
lar se plantea el cálculo e interpretación del error estándar de la estimación.
Seleccione y resuelva 2 ó 3 ejercicios pares del Texto correspondientes a este
tema, para cerciorarse de que maneja correctamente los conceptos desarrollados
en esta parte de la Unidad.
• Análisis de Correlación
Dentro de este item va a repasar el concepto de correlación, y va a estudiar el
coeficiente de determinación, que es una medida extremadamente útil para eva-
luar la calidad de la regresión. Analice con detenimiento la interpretación gráfica
que se hace en el Texto sobre la desviación explicada y la desviación no expli-
cada por el modelo, cantidades que sirven de base para el cálculo del coeficiente
de determinación. Finalmente, preste atención a la relación que existe entre el coefi-
ciente de determinación y el coeficiente de correlación. Calcule el coeficiente de
determinación para los ejercicios resueltos en el punto anterior, e interprete el resul-
tado obtenido.

• Inferencia sobre los parámetros


Para comprobar la significación de los coeficientes de la recta de regresión, se
pueden utilizar técnicas como intervalos de confianza o pruebas de hipótesis. Ahora
bien, de los dos parámetros de un modelo lineal simple -la pendiente y la ordena-
da al orígen-, sin duda el más importante es la pendiente, ya que representa la
forma en que "reacciona" la variable dependiente frente a cambios en la variable
independiente. En este apartado se ve la prueba de hipótesis sobre el verdadero
valor de la pendiente, el cálculo de intervalos de confianza para la pendiente, y se
explica la utilidad de este tipo de análisis. Aplique estos procedimientos en alguno
de los modelos ajustados anteriormente.

70
UNIDAD 2

• Limitaciones en el uso del análisis de regresión y de correlación


Finalmente, en este apartado se plantean recomendaciones muy útiles sobre el uso
de las técnicas de regresión y correlación, y se exponen una serie de advertencias
tendientes a evitar interpretaciones erróneas de sus resultados.


Ejemplo:
Para demostrar el procedimiento de cálculo en un análisis de regresión, vamos a
retomar el ejemplo de la recta usada en el análisis de correlación:

y = 10 - 2 x

Los valores considerados eran los siguientes:

x 1 2 3
y 8 6 4

Calculamos las cantidades necesarias para ajustar un modelo lineal:

x =2 Sx2 = 1
y =6
Cov(x,y) = [32 - 3x2 x6] / (3-1) = -2

Con estos valores calculamos los coeficientes de la recta de regresión. Podemos


usar directamente las fórmulas de trabajo del Texto, o, acomodando conveniente-
mente los términos de la ecuación, podemos usar las siguientes fórmulas que de-
penden de cantidades estadísticas muy útiles:

Cov ( x, y ) − 2
b= = = −2
S x2 1

a = y − b x = 6 − (−2 ∗ 2) = 10

71
UNIDAD 2

En consecuencia el modelo estimado resulta:


y = 10 - 2 x

Conclusión: se confirman los valores de los coeficientes de la recta de la cual


provino la muestra.

REVISION DE CONCEPTOS DESARROLLADOS

• análisis de regresión Técnica estadística utilizada para estable-


cer la relación funcional entre dos varia-
bles físicamente relacionadas.

• variable dependiente Variable a "predecir" por el modelo, o efec-


to.

• variable independiente Variable "conocida", o causa.

• relación de causalidad Vinculación entre dos variables mediante


una relación causa-efecto, es decir que
las variables están vin culadas através de
algún fenómeno físico concreto.

• modelo lineal simple Modelo que vincula a una variable depen-


diente con una sola variable independien-
te, bajo la forma de la ecuación de una
recta.

• método de mínimos Procedimiento de ajuste de un modelo li-


cuadrados neal consistente en minimizar la suma de
los desvíos cuadráticos con respecto a la
recta de regresión.

72
UNIDAD 2

• error estándar de la Cantidad que mide la dispersión de los


estimación datos en torno a la recta de regresión.

• coeficiente de Indice que mide el porcentaje de la varia-


determinación ción de y, al variar x, que es "explicado"
por el modelo.

• variación explicada Variación de y al variar x que es explica-


da o representada por el modelo.

• variación no explicada Variación de y al variar x que es no es


explicada por el modelo, y que depende-
de otros factores no contemplados en el
mismo -es una medida del error de esti-
mación-.

• extrapolación Estimación de la variable dependiente en


base al modelo ajustado, más allá del ran-
go dentro del cual fueron relevados los da-
tos de la muestra.

RECOMENDACIONES PRACTICAS

• Es útil iniciar este tipo de análisis dibujando el diagrama de dispersión de


los datos, tratando de establecer visualmente si existe algún tipo de relación
entre las variables, y en caso afirmativo cuál puede ser la función más apro-
piada para modelar la relación funcional entre x e y.

• En el análisis de regresión existe una relación de "causalidad"entre las


variables. Una de las variables es la "causa" -denominada variable indepen-
diente-, que generalmente se conoce o resulta fácil de medir. La otra variable
es el "efecto" -denominada variable dependiente-, y es la que se intenta pre-
decir.

73
UNIDAD 2

• El coeficiente de determinación es una medida muy fácil de calcular e


interpretar para evaluar la calidad del ajuste obtenido. Para facilitar su inter-
pretación conviene expresar su resultado en porcentaje.

• Muy importante: no confundir la interpretación del coeficiente de determi-


nación con la del coeficiente de correlación. Ambos miden propiedades
diferentes.

• En el caso particular de regresión lineal simple, el coeficiente de determina-


ción es el cuadrado del coeficiente de correlación. Por lo tanto, conociendo
uno de ellos, inmediatamente podemos calcular el valor del otro.

• El error estándar de la estimación da una idea de la variación de la variable


dependiente en torno a la recta de regresión. Si elevamos esta cantidad al
cuadrado, obtenemos una varianza, que se denomina "varianza residual" -
varianza de los residuos o errores-.

• Los coeficientes de regresión a y b son "variables aleatorias", cada uno


tiene su propia distribución de probabilidades, y es posible hacer inferencias
sobre el verdadero valor poblacional de esos estimadores.

• El coeficiente más importante es la pendiente, ya que expresa en que


medida reacciona la variable dependiente frente a cambios en la variable
independiente. Una prueba muy útil para verificar la significación de la pen-
diente es la siguiente:
H0: β = 0
H1: β ≠ 0
Si no se rechaza H0, se comprueba que la pendiente no es significativa, y por
ende que el modelo lineal no es apropiado. Esta prueba así planteada es
equivalente a la prueba sobre el coeficiente r que vimos en el análisis de
correlación, ya que las dos permiten establecer si las variables están o no
relacionadas linealmente.

74
UNIDAD 2

• El modelo de regresión tiene validez solamente dentro del rango de valores


de las variables usados para el ajuste. Por lo tanto, efectuar extrapolaciones
más allá del mismo es muy riesgoso, porque el comportamiento de las varia-
bles es desconocido, y puede ser completamente diferente al que se verifica
en el tramo analizado.

• Es importante determinar, antes de iniciar cualquier estudio, si existe o nó


alguna vinculación física entre las variables analizadas. Las relaciones pura-
mente numéricas no pueden estar por encima de las físicas, ya que podemos
llegar a conclusiones carentes totalmente de sentido.

2
Volvemos al ejemplo de la Actividad N°1, donde se analizaba la relación
entre el
"Número de Fax enviados" y la "Cantidad de Servicios Vendidos":

Nro. de Fax enviados 30 45 50 60 80


Nro. de Servicios Vendidos 10 50 20 80 50

Complete el tratamiento del problema, realizando el siguiente análisis:


a. Ajuste un modelo lineal simple por mínimos cuadrados.
b. Calcule el error estándar de la estimación.
c. Calcule el coeficiente de determinación, e interprete el resultado obtenido.
d. Efectúe la prueba de hipótesis sobre la pendiente de la recta, para deter
minar si es significativa o nó, al nivel de significación del 5 %.
e. Si la pendiente es significativamente distinta de cero, estime un intervalo de
confianza del 90 % para el número de servicios vendidos, si se envían 70
faxes.
Confronte con la Solución Nº 2

75
UNIDAD 2

3
Se estudia la relación entre el número de personas ocupadas en una tarea, y
la duración de esa tarea. Una muestra arrojó los siguientes resultados:

Nro. de Personas ocupadas 1 2 3 4 5


Duración de la Tarea [hrs.] 8 7 5 5 2

a. Dibuje el diagrama de dispersión de los datos, y especifique si se puede


visualizar algún tipo de relación entre las variables analizadas.
b. Calcule el coeficiente de correlación, e interprete el resultado obtenido.
c. Ajuste un modelo lineal simple por mínimos cuadrados, y superponga la
recta obtenida en el diagrama de dispersión.
d. Calcule el error estándar de la estimación.
e. Calcule el coeficiente de determinación, e interprete el resultado obtenido.

Confronte con la Solución Nº 3

3. REGRESION MULTIPLE
El Jefe de Producción de la firma Campeón S.A. desea analizar el funcionamiento
de un proceso de rectificado de varillas. Pide información al Grupo de Trabajo
responsable del proceso, el cual ha estado estudiando el comportamiento del diá-
metro de las varillas a la salida de la rectificadora.

El Grupo ha confeccionado la espina de pez de la característica, de la cual se des-


prende que el diámetro depende fundamentalmente de los siguientes factores: la
velocidad de trabajo, la temperatura de trabajo, la cantidad de piezas rectifi-
cadas desde el último diamantado del herramental, y el tiempo transcurrido
desde el último diamantado.

¿Cómo puede determinar el Jefe si todos estos factores son realmente significati-
vos, es decir si tienen un efecto considerable sobre el diámetro de las piezas recti-

76
UNIDAD 2

ficadas?
Por otro lado, al Jefe le interesaría predecir el diámetro de las varillas rectificadas
para distintos valores de los factores considerados, a fin de optimizar el proceso a
su cargo.
Una alternativa sería estimar un modelo lineal simple para cada uno de los factores
considerados. Sin embargo, intuitivamente el Jefe advierte que si encuentra una
herramienta capaz de concentrar toda la información disponible sobre el proceso
de rectificado, seguramente va a poder lograr mejores predicciones de la variable
de respuesta.
Una técnica que permite alcanzar ese objetivo es la regresión múltiple. Hablamos
de regresión múltiple cuando tratamos de explicar el comportamiento de la variable
dependiente en base al conocimiento de varias variables independientes.

El modelo general de regresión lineal múltiple se puede plantear de la siguiente


manera:
y = a + b1 x1 + b2 x2 + … + bp xp
donde y es la variable dependiente, x1, x2, … , xp son las variables independien-
tes, mientras que a, b1, b2, … , bp son los parámetros del modelo.

El modelo de regresión lineal simple es un caso particular, en el cual todos los bi y xi


mayor a 1 son igual a cero.

Para estimar los parámetros del modelo, nuevamente se utiliza el método de míni-
mos cuadrados, usando los datos de una muestra y minimizando la siguiente suma:

Σ ei2 = Σ (yi - yi )2

donde yi son los valores observados e yi los valores estimados por el modelo. Los
ei se denominan errores o residuos.

El criterio para evaluar la calidad del ajuste obtenido es similar al empleado en la


regresión simple:

• El error estándar de la estimación debe ser lo más pequeño posible.

77
UNIDAD 2

• El coeficiente de determinación deber ser lo más cercano posible a uno.

Pero en regresión múltiple es muy importante el análisis adicional de los residuos ei,
que deben cumplir con los siguientes supuestos para que el modelo sea válido:
• Deben tener distribución Normal, con media cero y varianza constante.
• Deben tener un comportamiento totalmente aleatorio -no deben existir patrones-

En regresión múltiple también se realizan inferencias útiles para comprobar la vali-


dez del modelo. Principalmente se usan las siguientes técnicas:
• Prueba sobre el modelo. Sirve para comprobar si el modelo globalmente es
apropiado.
• Pruebas sobre los coeficientes de regresión. Sirven para comprobar si cada uno
de los coeficientes del modelo es significativo o no.

Finalmente, en el caso de regresión múltiple es importante verificar que las variables


independientes no estén correlacionadas, por dos motivos: primero, si existe una
elevada correlación entre dos factores, significa que los dos explican más o menos
lo mismo dentro del modelo, y por lo tanto estamos dilapidando esfuerzos al medir
dos variables que producen el mismo efecto; segundo, una alta correlación entre
dos variables introduce errores en el proceso de ajuste, que invalida sus resultados
y puede llevar a conclusiones inexactas.

El ajuste de un modelo de regresión múltiple es bastante complicado, ya que se


requieren conocimientos de álgebra matricial, y es necesario realizar cálculos muy
laboriosos. Por otra parte, para verificar la calidad del ajuste hay que implementar
numerosas herramientas estadísticas, gráficas y analíticas. Por todo esto, el análisis
de regresión múltiple siempre se realiza con el auxilio de un software estadístico.
Todos los cálculos los realiza la computadora, y nuestra función es interpretar co-
rrectamente los resultados.

Por lo tanto, después de ver en el Texto los conceptos básicos sobre el tema, le
sugiero resolver la parte práctica usando la computadora como herramienta auxi-
liar.

Vamos a retornar al Texto, pero antes de buscar este tema específico, le sugiero

78
UNIDAD 2

repasar un par de puntos que vimos en el Capítulo anterior, y que le que le van a
servir de base para interpretar correctamente las salidas de la computadora, cual-
quiera sea el programa estadístico que use. Los temas en cuestión son los siguien-
tes:

• Valores prob: Otra manera de ver las pruebas de hipótesis


• Uso de las computadoras para la prueba de hipótesis

Si no le hace falta repasar estos temas, busque el siguiente Capítulo:

REGRESION MULTIPLE

Lea los siguientes temas:

• Regresión múltiple y análisis de correlación


En este apartado se revisan los conceptos básicos de la regresión múltiple, sus
ventajas, y los pasos que se ejecutan dentro de un análisis de regresión múltiple.

• Deducción de la ecuación de regresión múltiple


En este punto se ve el modelo general de regresión múltiple, el empleo del método
de mínimos cuadrados para ajustar el modelo, el significado de los coeficientes de
regresión, y el uso del modelo para hacer predicciones sobre la variable dependien-
te.

• La computadora y la regresión múltiple


Por fin, en esta parte se explica la forma de usar un software estadístico para ajustar
un modelo de regresión múltiple, los resultados suministra el programa, para qué
sirven y como se interpretan. Preste mucha atención al análisis de las cantidades
que permiten evaluar la calidad del ajuste, que sirven de base para decidir si el
modelo es adecuado o no para explicar el comportamiento de la variable depen-
diente.

79
UNIDAD 2

• Inferencias sobre los parámetros


Este es un apartado fundamental dentro del Capítulo, ya que aquí se ven dos prue-
bas muy importantes para decidir la validez del modelo: las pruebas sobre los
parámetros del modelo, que permiten verificar si los coeficientes de regresión son
significativos o no, y por ende si las variables asociadas a esos coeficientes aportan
información para explicar la variación de la variable dependiente; la prueba sobre el
modelo, que permite decidir si el modelo globalmente es útil o no para explicar el
comportamiento de la variable dependiente.
• Técnicas de modelado
Finalmente, en este punto se hace un repaso general sobre el planteo del problema,
y en particular se desarrolla todo lo relativo al análisis de los residuos, cuya com-
probación es fundamental para determinar la validez del modelo planteado.

Ejemplo
Vamos a volver al problema que está analizando el Jefe de Producción sobre el
diámetro de rectificado de una pieza.
Se dispone de los siguientes datos:

Diámetro de Velocidad de Temperatura Cantidad Tiempo


Rectificado Trabajo de trabajo de piezas desde el
desde el último
último diamantado
diamante
10.18 3000 60 10 13
5.90 1000 80 30 42
4.23 1200 90 12 17
6.15 1500 85 15 25
7.20 1800 75 18 28
9.21 2100 65 28 40
9.20 2600 90 15 21
9.14 2300 65 21 30
11.36 2800 60 27 41

80
UNIDAD 2

5.80 1200 70 22 33
8.53 2300 75 15 24
8.45 1800 80 27 39
7.84 1900 85 20 29
8.23 2300 90 16 25
8.60 2400 80 14 21
7.40 1600 70 26 38
7.78 1400 75 32 46
5.12 1000 65 23 35
4.50 1100 85 12 17

Vamos a seguir todos los pasos necesarios para ajustar el modelo, verificar la cali-
dad del ajuste, y seleccionar el esquema más conveniente.
En primer lugar se realiza el ajuste incluyendo todas las variables independientes,
cuyos resultados se muestran a continuación:
Model fitting results
---------------------------------------------------------------------------------------------------
Independent variable coefficient std. error t-value sig.level
---------------------------------------------------------------------------------------------------
Constante -0.156288 0.609376 -0.2565 0.8013
Velocidad 0.003131 0.000085 36.6684 0.0000
Temperatura -0.00482 0.005474 -0.8805 0.3935
Cantidad de Piezas 0.094592 0.050601 1.8694 0.0826
Tiempo 0.014159 0.035337 0.4007 0.6947
---------------------------------------------------------------------------------------------------
R-SQUARED = 0.9893

Esta Tabla indica que el resultado del ajuste es satisfactorio, ya que el coeficiente de
determinación es alto -el modelo explica un 98,93 % de la variación del diámetro-
.

81
UNIDAD 2

Analizando las pruebas sobre los coeficientes, se ve que solamente el factor "velo-
cidad" es altamente significativo.
La prueba sobre el modelo global dio los siguientes resultados:
Analysis of Variance for the Full Regression
---------------------------------------------------------------------------------------------------
Source Sum of Squares DF Mean Square F-Ratio P-value
---------------------------------------------------------------------------------------------------
Model 66.3771 4 16.5943 418.265 .0000
Error 0.555437 14 0.0396741
---------------------------------------------------------------------------------------------------
Total (Corr.) 66.9325 18
Esta prueba permite confirmar que el modelo globalmente es satisfactorio, pues el
índice F es altamente significativo, lo que indica que al menos uno de los factores es
significativo.
Finalmente, analizamos la matriz de correlaciones cruzadas:
Correlation matrix for coefficient estimates
---------------------------------------------------------------------------------------------------
Constante Velocidad Temperatura Cant.Piez.
Constante 1.0000 -.6495 -.9190 .0093
Velocidad -.6495 1.0000 .4031 -.0009
Temperatura -.9190 .4031 1.0000 .0230
Cantidad de Piezas .0093 -.0009 .0230 1.0000
Tiempo -.1237 .0670 .0537 -.9868
---------------------------------------------------------------------------------------------------
En esta matriz se advierte que la "constante" está fuertemente correlacionada con la
"temperatura", y en menor medida con la velocidad; por lo tanto se puede intentar
descartar la constante. Igualmente existe una alta correlación entre "cantidad de
piezas desde el último diamantado" y "tiempo desde el último diamantado", lo cual
intuitivamente es lógico, ya que ambas miden más o menos el mismo efecto; por lo
tanto hay que descartar alguna de las dos, dejando la variable más fácil de medir,
que en este caso es la "cantidad de piezas".
El siguiente paso es el análisis de los residuos del modelo.

82
UNIDAD 2

La próxima Figura muestra el control gráfico de Normalidad de los residuos. Como


se puede apreciar, la gráfica permite comprobar que los residuos tienen distribu-
ción Normal.

Residuals
Gráfico Nº 9

Por último, se analiza la gráfica de los residuos vs. los valores predichos de la
variable:

Residuals

Predicted
Gráfico Nº 10

83
UNIDAD 2

Se observa que el comportamiento de los residuos es aleatorio, que la media es


aproximadamente cero, y que su dispersión es constante.

En conclusión, se cumplen todos los supuestos básicos, lo que certifica la validez


del modelo.
Ahora vamos a repetir el ajuste, esta vez eliminando la constante. La tabla con los
resultados para este caso queda del siguiente modo:
Model fitting results
---------------------------------------------------------------------------------------------------
Independent variable coefficient std. error t-value sig.level
---------------------------------------------------------------------------------------------------
Velocidad 0.0031170 .000063 49.5754 0.0000
Temperatura -0.00611 0.00209 -2.9235 0.0105
Cantidad de Piezas 0.094712 0.048998 1.9330 0.0723
Tiempo 0.013038 0.033956 0.3840 0.7064
---------------------------------------------------------------------------------------------------
R-SQUARED = 0.9994
Se ve que el coeficiente de determinación aumenta ligeramente, y que los coeficien-
tes se hacen más significativos que en el ajuste anterior.
Se repite nuevamente el ajuste, esta vez eliminando la variable "tiempo desde el
último diamantado", obteniéndose la siguiente tabla:

Model fitting results


---------------------------------------------------------------------------------------------------
Independent variable coefficient std. error t-value sig.level
---------------------------------------------------------------------------------------------------
Velocidad 0.003118 0.000061 50.9665 0.0000
Temperatura -0.005987 0.002009 -2.9794 0.0089
Cantidad de Piezas 0.1134 0.005505 20.6007 0.0000
---------------------------------------------------------------------------------------------------
R-SQUARED = 0.9995

84
UNIDAD 2

El coeficiente de determinación prácticamente no varía. El cambio más importante


es que el coeficiente asociado a la "cantidad de piezas desde el último diamantado"
se hizo fuertemente significativo al eliminar el "tiempo desde el último diamantado",
variable con la que estaba altamente correlacionada.
Después de analizar estos resultados, persiste la duda sobre la real significación de
la "temperatura", por lo que se intenta un nuevo ajuste eliminando también a esta
variable. Los resultados son los siguientes:

Model fitting results


---------------------------------------------------------------------------------------------------
Independent variable coefficient std. error t-value sig.level
---------------------------------------------------------------------------------------------------
Velocidad 0.002998 0.000056 53.7450 0.0000
Cantidad de Piezas 0.102986 0.005144 20.0200 0.0000
---------------------------------------------------------------------------------------------------
R-SQUARED = 0.9992

Se ve que las dos variables que permanecen en el modelo se hacen todavía más
significativas, mientras que el coeficiente de determinación prácticamente no varía.
La prueba sobre el modelo bajo estas condiciones produce los siguientes resulta-
dos:

Analysis of Variance for the Full Regression


---------------------------------------------------------------------------------------------------
Source Sum of Squares DF Mean Square F-Ratio P-value
---------------------------------------------------------------------------------------------------
Model 1169.89 2 584.945 11349.3 .0000
Error 0.876182 17 0.0515401
---------------------------------------------------------------------------------------------------
Total 1170.77 19

85
UNIDAD 2

El modelo es altamente satisfactorio.


Si bien la variable "temperatura" aportaba algo de información para explicar la va-
riación del "diámetro", se opta por descartarla del modelo, siguiendo el criterio de
conservar la menor cantidad de variables y elegir el modelo más simple posible.
En las pruebas que se hicieron después del primer ajuste no se publicaron los resul-
tados del análisis sobre los residuos, ni las matrices de correlaciones cruzadas, por
lo que Ud. puede usar los datos del ejercicio, cargarlos en un programa estadístico,
analizar los resultados paso a paso como se ha mostrado, y comprobar si se cum-
plen los supuestos del modelo.

Dado que todas las evidencias confirman que los resultados son satisfactorios, se
adopta en definitiva el siguiente modelo:

y = 0.003 x1 + 0.103 x2

donde x1 es la velocidad de trabajo, y x2 es la cantidad de piezas procesadas desde


el último diamantado del herramental.

REVISION DE CONCEPTOS DESARROLLADOS

• análisis de regresión Técnica estadística utilizada para estable


múltiple cer la relación entre una variable depen-
diente y varias variables independientes.

• factores Variables independientes dentro del mo-


delo de regresión.

• error estándar de la Cantidad que mide la dispersión de los da-


estimación tos en torno a la recta de regresión.

• coeficiente determinación Indice que mide el porcentaje de la varia-


múltiple ción de y que es "explicado" por el
modelo.de regresión múltiple.

86
UNIDAD 2

• prueba sobre el modelo Prueba que sirve para verificar si el mo


delo globalmente sirve para explicar el
comportamiento de la variable depen-
diente.

• prueba sobre los Prueba que sirve para verificar si


coeficientes cada uno de los parámetros del
modelo es significativo o no, y por
ende si la variable asociada a ese
coeficiente aporta o no informa-
ción para explicar la variación de la
variable dependiente.

RECOMENDACIONES PRACTICAS

• El uso de un modelo de regresión múltiple es recomendable en todos


aquellos casos en que se disponga de información sobre varios factores que
pueden explicar el comportamiento de una variable.

• Algunos de los factores propuestos en el modelo pueden resultar no


significativos. Es importante eliminar del modelo todas las variables que no
sirvan para explicar la variación de la variable dependiente, y adoptar el mo-
delo más simple posible.

• La interpretación de las cantidades usadas en la regresión múltiple, es


prácticamente la misma que en la regresión simple. La complicación se pro-
duce fundamentalmente en la parte de cálculo, por lo que resulta imprescindi-
ble realizar el análisis con el auxilio de la computadora y de un software
estadístico.

• Una vez ajustado el modelo en base a los datos de la muestra disponible,


es fundamental realizar un análisis minucioso de los resultados que propor-
ciona la computadora. Es importante no saltear ninguno de los siguientes
pasos: evaluar la calidad del ajuste, a través del coeficiente de determinación,

87
UNIDAD 2

o del error estándar de estimación; realizar las pruebas de hipótesis sobre los
parámetros del modelo, y sobre el modelo en general; determinar la correla-
ción cruzada entre las variables independientes; efectuar el análisis de los
residuos, verificando que tengan un comportamiento aleatorio, distribución
Normal, media cero y varianza constante.

• También en regresión múltiple es importante verificar que exista una vincu-


lación física entre la variable dependiente y cada uno de los factores.

4
Se desea encontrar un modelo que permita predecir la variable y:"indice de
productividad de un operario" en función de las variables independientes x1:
"cantidad de horas de entrenamiento del operario" y x2: "antigüedad del ope-
rario en su función". Una muestra de 25 operarios produjo los siguientes
resultados:

Indice de Horas de Antigüedad


Productiv. x Mil Capacitación [Meses]

36.70 15 20
34.74 14 20
22.95 12 18
46.76 18 31
61.26 24 56
21.35 9 16
50.32 22 30
33.67 14 23
65.19 25 52

88
UNIDAD 2

48.76 21 29
24.68 11 20
25.33 11 19
24.08 12 17
23.37 10 18
45.87 19 28
27.29 12 19
32.89 14 22
28.01 13 19
32.64 13 23
34.54 15 20
17.41 7 16
20.36 9 17
15.78 6 14
41.68 16 24
28.00 11 19
Utilizando un programa estadístico, identifique el modelo apropiado.

Confronte con la Solución Nº 4

89
UNIDAD 2

Conclusiones

El análisis de relaciones entre variables permite identificar la existencia de asocia-


ción entre dos o más variables, medir la fuerza de la misma, y eventualmente esta-
blecer la relación funcional que vincula a las variables analizadas.

Una de las aplicaciones más comunes de este análisis consiste en predecir el valor
de una variable difícil de medir, o cuya evaluación es muy costosa, en base al cono-
cimiento de otras variables conocidas o fáciles de determinar.
Después de explorar esta Unidad se espera que usted sea capaz de:

• Identificar en forma gráfica posibles relaciones entre variables.

• Medir el grado de asociación lineal entre dos variables.

• Ajustar modelos de regresión lineal simple.

• Ajustar modelos de regresión múltiple, empleando software estadístico.

Los temas desarrollados en esta Unidad forman parte de las técnicas explicativas
de la estadística, ya que se busca explicar el comportamiento de una variable aleatoria
en base a la modelación de la relación con los factores que la afectan.

90
UNIDAD

2
SOLUCIONES A LAS
ACTIVIDADES DE PROCESO
UNIDAD 2

1. b. Parece existir una cierta relación directa entre las variables.


c. r = 0.59
El coeficiente de correlación no es muy fuerte, por lo que el grado de asocia-
ción entre las variables es bastante pobre, lo que permite suponer que el
número de fax enviados no influye decisivamente en las ventas.
d. Si fijamos α = 5 % Testimado = 1.266 Tcrítico = ±3.182
Conclusión: El coeficiente de correlación no es significativo
-tenga en cuenta que se está trabajando con muy pocos datos-

2. a. y = -5 + 0.88 x
b. Se = 25.83
c. r2 = 0.35 Un 35 % de la variación en las ventas es explicado por el modelo
estimado.
d. Testimado = 1.27 Tcrítico = ±3.182
Conclusión: la pendiente de la recta de regresión no es significativa.
e. No corresponde.

3. a. Se nota una evidente relación de tipo lineal entre las variables.


b. r = -0.96 Existe un alto grado de asociación lineal, de tipo inversa.
c. y = 9.6 - 1.4 x
d. Se = 0.73
e. r2 = 0.92 Un 92 % de la variación de la duración de la tarea, al variar el
número depersonas ocupadas, es explicado por el modelo.
Solamente el 8 % es explicado por otros factores no contem-
plados en el modelo.

4. Primer Paso: Se ajuste el modelo usando todas las variables independientes.


Modelo estimado: y = 1.92 x1 + 0.29 x2
r2 = 0.9965 El modelo explica un 99.65 % de la variación
de y.
Pruebas sobre los coeficientes: los dos parámetros resultan signi-

91
UNIDAD 2

ficativos.
Prueba sobre el modelo: el modelo es satisfactorio.
Matriz de correlaciones cruzadas: existe un fuerte grado de aso-
ciación lineal entre las dos variables independientes.
Segundo Paso: Se elimina del ajuste la variable menos significativa -antigüedad
del operario-.
Modelo estimado: y = 2.41 x1
r2 = 0.9951 Baja muy poco con respecto al ajuste anterior,
y el modelo resultante es más simple.
Pruebas sobre los coefic.: el único parámetro resulta más signi-
ficativo aún.
Prueba sobre el modelo: el modelo es satisfactorio.
Análisis de los residuos: residuos normales, independientes, con
media cero y varianza constante.
Conclusión: se adopta el modelo y = 2.41 x1

92
UNIDAD

2
ACTIVIDADES DE
AUTOEVALUACION
UNIDAD 2

1. Explique cuál es el sentido de estudiar las posibles relaciones entre variables.


2. ¿Qué tipos de relaciones pueden existir entre dos variables?
3. ¿Cómo se puede establecer en forma preliminar si existe alguna relación entre
las variables, y la forma de la relación?
4. Explique cuál es el objetivo del análisis de correlación.
5. ¿Es necesario que exista una relación causa-efecto entre las variables considera-
das en un análisis de correlación?
6. ¿Cómo se puede cuantificar el grado de asociación entre dos variables?
7. Explique qué representa el coeficiente de correlación, qué unidades tiene, entre
qué valores oscila, y la interpretación de su valor.
8. Un coeficiente de correlación nulo: ¿indica que no existe asociación entre las
variables?
9. ¿Cómo se puede comprobar si el grado de asociación lineal entre dos variables
es significativo o no?
10. Explique cuál es el objetivo del análisis de regresión.
11. ¿Cuáles son las diferencias entre el análisis de correlación y el análisis de regre-
sión?
12. ¿Qué tipos de regresiones se conoce?
13. Explique en que consiste una regresión lineal simple, y escriba el modelo gene-
ral.
14. ¿Cómo se puede ajustar un modelo lineal simple?
15. Explique en que consiste el método de mínimos cuadrados.
16. ¿Qué utilidad tiene el modelo estimado?
17. Especifique de que forma se puede establecer si el ajuste del modelo es satis-
factorio.
18. Explique qué es el error estándar de estimación. ¿Qué otra cantidad importante
está asociado con el mismo?
19. Explique el concepto de variación explicada y no explicada por el modelo.
Especifique qué índice usa esa información, y cómo se interpreta el mismo.
20. ¿Qué tipo de inferencias se pueden hacer sobre los parámetros del modelo?

93
UNIDAD 2

21. Explique qué es una regresión múltiple, y cuáles son sus ventajas. Escriba el
modelo general.
22. ¿Cómo se realiza el ajuste de un modelo lineal múltiple?
23. Explique qué herramientas se usan para verificar la consistencia del modelo
ajustado.
24. Especifique cuáles son las precauciones que hay que tener en cuenta en un
análisis de relación entre variables.
25. Considerando los valores de diámetro del resorte tipo "RRR" usados en las
Actividades de Autoevaluación de la Unidad Nº1, se sospecha que durante el pri-
mer tramo de la producción los diámetros aumentan como consecuencia de la dila-
tación del mandril de enrollamiento. Para comprobar si esto es cierto, tomar los
primeros 40 datos de la serie como variable dependiente, y el tiempo como variable
independiente, y efectuar el siguiente análisis:

a. Construya un diagrama adecuado con los datos.


b. Calcule el coeficiente de correlación, e interprete el resultado obtenido.
c. Ajuste un modelo lineal simple por mínimos cuadrados.
d. Calcule el error estándar de la estimación.
e. Calcule el coeficiente de determinación, e interprete el resultado obtenido.
f. Efectúe la prueba de hipótesis sobre la pendiente de la recta, para determinar si
es significativa o no, para un nivel de significación del 5 %.

94
SERIES DE
TIEMPO

UNIDAD

3
UNIDAD

3
UNIDAD 3
ORIENTACIÓN DEL
APRENDIZAJE

Cualquier secuencia de observaciones de una variable medida a lo largo del tiempo,


constituye una serie temporal.

Como en en la mayoría de los estudios estadísticos, el análisis de series de tiempo


tiene como objetivo fundamental determinar patrones de comportamiento de los
datos, que en este caso han sido registrados cronológicamente. El conocimiento de
esos patrones permite explicar el comportamiento de la variable en el pasado y
proyectarlo hacia el futuro, usar esta información para estimar o predecir valores
futuros de la variable, reduciendo el margen de incertidumbre y facilitando la toma
de decisiones.

Por ejemplo, el Gerente General de la firma Campeón S.A. desea incorporar en su


empresa la filosofía del Just-in-Time (Justo a Tiempo), tratando de cumplir con las
entregas a sus clientes pero manteniendo el menor stock posible en planta. Para
ello necesita estimar la demanda futura con la mayor precisión posible.

El punto de partida del análisis puede ser estudiando la evolución de la demanda en


los últimos años, y su distribución dentro del año. Los pedidos de resortes, en cada
cuatrimestre, durante los últimos 5 años, se resumen en la siguiente Figura:

Demanda de Resortes

1.6

1.4

1.2
1
Unidades
Pedidas 0.8
[en mill.]
0.6

0.4

0.2

0
I II III IV I II III IV I II III IV I II III IV I II III IV
Trimestre

Gráfico Nº 1

Se ve claramente que existe una tendencia creciente en el número de resortes pedi-


dos año tras año, y asimismo que hay un patrón de comportamiento muy evidente
dentro del año, con fuertes caídas de la demanda en el primer y último cuatrimestre.

98
UNIDAD 3

Esquema
Tema
Conceptual

Series de Tiempo

Objetivo
General
Describir el comportamiento
de una serie cronológica de datos

Objetivos
Específicos

Efectuar el Efectuar un
análisis clásico análisis
de una serie avanzado
mediante el uso
de software
estadístico
est estadístico
Herramientas
usadas
Descomposición y Identificación de la
modelación de las estructura de la
componentes básicas serie mediante el
de la serie uso de funciones
estadísticas
avanzadas

99
UNIDAD 3

Con esta información a la vista resulta más fácil entender el funcionamiento de la


demanda, y, bajo ciertas condiciones, proyectar ese patrón hacia el futuro. Esto le
permitirá al Gerente efectuar predicciones sobre la demanda para el próximo año, y
determinar en qué períodos necesita mayor producción -y por ende mayor canti-
dad de materia prima, de horas hombre, etc.-, para planificar adecuadamente los
recursos y acciones necesarios como para lograr el objetivo de mantener un stock
mínimo en la planta.

En resumen, el análisis de los datos históricos facilita la toma de decisiones con


relación a un hecho futuro, minimizando el grado de incertidumbre.

Quedan planteados aún varios interrogantes:

• ¿Cómo se puede modelar la tendencia interanual de la serie?

• ¿Cómo se puede describir el comportamiento de la serie dentro de un año cual-


quiera?

• ¿Qué otras componentes pueden estar presentes en una serie?

• ¿Cómo utilizar en la práctica la información que proporciona el análisis de series


temporales?

En esta Unidad se analizan todas estas cuestiones, de acuerdo al siguiente planteo:

Objetivos del

Comprender la importancia del análisis de series temporales Aprendizaje

Emplear el modelo clásico de análisis de series

Aplicar herramientas avanzadas de análisis de series

Utilizar software estadístico adecuado

100
UNIDAD 3

1. Análisis clásico de una serie de tiempo. Contenidos

2. Técnicas de análisis avanzadas.

MODALIDAD DE TRABAJO

El desarrollo de esta Unidad se realiza en base al siguiente esquema general:

ACTIVIDAD MATERIAL CONCEPTOS EJERCITACION


UTILIZADO DESARROLLADOS PROPUESTA
Introducción al Tema 1: GUIA „ Objetivos. Ejemplo introductorio
„ Componentes de una serie.
Análisis Clásico de una
„ Herramientas estadísticas
Serie de Tiempo Empleadas.
Lectura de la bibliografía TEXTO „ Tendencia secular. Ejercitación del Texto
obligatoria „ Variación cíclica.
„ Variación estacional.
„ Variación irregular.
Revisión de conceptos GUIA
desarrollados
Actividades de proceso GUIA Ejercicios prácticos
Tema 2: GUIA „ Función de autocorrelación. Ejemplos aplicados
„ Espectros.
Técnicas de Análisis
„ Análisis mediante el auxilio de
Avanzadas un software estadístico.
Revisión de conceptos GUIA
desarrollados
Actividades de proceso GUIA Ejercicios prácticos
Conclusiones GUIA
Actividades de GUIA Ejercitación
Autoevaluación teórico-práctica

Bibliografía Obligatoria

LEVIN, Richard y RUBIN, David. Estadística para Administradores. Sexta Edición. Editorial
Prentice-Hall. México.1996.

101
UNIDAD 3

1. ANALISIS CLASICO DE UNA SERIE DE TIEMPO

El modelo clásico de serie de tiempo asume que la estructura de la serie es el


resultado de la superposición de los siguientes factores de variación:

• Tendencia secular: Es el movimiento general de la serie a largo plazo. Por


ejemplo, los montos de demanda anual de resortes de la firma Campeón S.A. pre-
sentan un lento pero sostenido crecimiento a lo largo del tiempo.

Demanda de Resortes

1.6

1.4

1.2

1
Unidades
Pedidas 0.8
[en mill.]
0.6

0.4

0.2
0
I II III I I II III I I II III I I II III I I II III I
Trimestre

• Variación cíclica: Son fluctuaciones que ocurren generalmente en períodos pro-


longados, caracterizados por picos y caídas de varios años de duración. Por ejem-
plo, la demanda de resortes en un período extenso de tiempo, va a sufrir cambios
muy lentos asociados a la marcha general de la economía -períodos de expansión o
de recesión-.
Demanda de Resortes

1.4

1.2

Unidades 0.8
Pedidas
[en mill.] 0.6

0.4

0.2

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Año

102
UNIDAD 3

• Fluctuación estacional: Es la variación que se verifica estacionalmente, dentro


de un año cualquiera, cuyo patrón tiende a repetirse año tras año. Por ejemplo, ya
vimos que la demanda de resortes tiene un pico a mitad de año, y caídas hacia
comienzos y fines de año.
Demanda

0.8

0.7

0.6
0.5

Unidades 0.4
0.3

0.2
0.1

0
I II III IV
Trimestre

• Variación irregular o aleatoria: Son todos los movimientos de la serie que no


pueden ser explicados por los factores de variación vistos anteriormente.

Demanda

0.7

0.6

0.5

0.4
Unidades
0.3

0.2

0.1

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Año

El objeto de analizar una serie de tiempo consiste precisamente en tratar de deter-


minar sus principales propiedades: establecer si la serie presenta algún tipo de ten-
dencia, si tiene fluctuaciones cíclicas o estacionales, etc.

103
UNIDAD 3

Volvamos al ejemplo de la serie de "número de resortes pedidos por cuatrimestre",


que maneja el Gerente General de Campeón S.A. Vamos a ver las distintas herra-
mientas estadísticas que se pueden utilizar para el análisis de esa serie, y el objetivo
de la aplicación de cada una.

a. Análisis de la Tendencia

Si el Gerente detecta alguna tendencia en la serie que está analizando, y encuentra


un modelo adecuado para representarla, va a poder proyectar la demanda futura
con bastante precisión. Otra posibilidad que él tiene es la de remover la tenden-
cia de la serie, lo que le va a facilitar el análisis de las demás componentes de la
serie. Serie Original

1.6

1.4

1.2

1
Unidades
0.8
Pedidas
0.6

0.4

0.2

0
I II III IV I II III IV I II III IV I II III IV I II III IV
Trimestre

Serie sin Tendencia

0.8

0.7

0.6

0.5
Unidades
0.4
Pedidas
0.3

0.2

0.1

0
I II III I I II III I I II III I I II III I I II III I
Trimestre

Si la tendencia -creciente o decreciente- es de tipo lineal, se puede ajustar un mo-


delo lineal simple, del tipo: y = a + bx, como por ejemplo en el caso de la demanda
de resortes. El ajuste se realiza por el método de mínimos cuadrados.

104
UNIDAD 3

Si la tendencia no es lineal, se pueden aplicar otros modelos, como por ejemplo una
ecuación de segundo grado, del tipo: y = a + bx + cx2. El ajuste se realiza igual-
mente por mínimos cuadrados.

Demanda

1.4

1.2

0.8
Unidades
0.6

0.4

0.2

0
1 2 3 4 5
Año

b. Análisis de la Variación Cíclica

El Gerente Administrativo de Campeón S.A., se encuentra colaborando con el


estudio de la serie de "demanda de resortes". Como él conoce mejor los vaivenes
de la economía, se interesa en establecer los ciclos plurianuales que presenta la
demanda, para asociarlos a alguna variable conocida -como ingreso per cápita,
índices de expansión o de recesión de la economía, etc.- y trazar un pronóstico más
preciso de la demanda de resortes.

Este análisis resulta apropiado para datos no inferiores al año. Una parte de la
variación de la serie es explicada por la tendencia, y el resto por las componentes
cíclica e irregular. Para aislar e identificar la componente cíclica, se pueden calcular
los residuos cíclicos, como diferencia entre el valor observado y el valor estimado
por el modelo de tendencia: ei = yi - i

El signo de los residuos indica el tipo de ciclo que presenta la serie -cresta o valle-
mientras que su valor representa la magnitud o importancia del ciclo. Una forma de
facilitar su interpretación es calculando un índice relativo: (yi - i) / yi Cuando
el índice es nulo, significa que el valor observado coincide con el estimado por el
modelo de tendencia, lo que indica ausencia de variación cíclica. Cuanto más se
aleja este índice de cero -positiva o negativamente-, más acentuado es el ciclo
presente en los datos. Este índice se puede volcar en un gráfico que pone rápida-
mente en evidencia el comportamiento de la serie después de remover la tendencia.

105
UNIDAD 3

D em anda de R esortes

0. 3

0. 2

0. 1

R e sid u o s
0
C í cl ic o s
1 2 3 4 5 6 7 8 9 1 0 1 1 12 13 1 4 1 5 16 17 1 8 1 9 20
-0. 1

-0. 2

-0. 3
Año

c. Análisis de la Variación Estacional

Otro dato muy importante para el Gerente General es la evolución temporal de la


demanda dentro de un año cualquiera, si existe algún patrón definido de comporta-
miento, y si ese patrón se reitera cada año. Conociendo esta información, él puede
prever los recursos materiales y la dotación humana necesarios para hacer frente a
la demanda prevista, sin provocar incumplimientos con los clientes, ni acumular un
stock excesivo en la planta que produzca otros tipos de perjuicios.

Este análisis se puede realizar para datos semanales, mensuales, trimestrales, etc.,
es decir siempre menores a un año.

Una técnica muy útil en este caso es el cálculo de promedios móviles, que permite
suavizar las fluctuaciones de la serie, y facilitar la identificación de la componente
estacional. El número de términos considerados para el cálculo del promedio puede
variar, pero a medida que su valor aumenta, las irregularidades de la serie van des-
apareciendo, poniendo más en evidencia las componentes presentes en la serie.

C álculo de P rom edios Móviles

0.8
0.7
0.6
0.5
Unida de s
0.4
P e did a s
0.3
0.2
0.1
0
I III I III I III I III I III
T rim e stre

106
UNIDAD 3

Una vez identificada la componente estacional, se puede utilizar esta información


para mejorar los pronósticos. Otra posibilidad es remover esta componente de la
serie, calculando lo que se denomina una serie desestacionalizada, que facilita el
análisis de las demás componentes.

d. Análisis de la Variación Irregular

Finalmente, tanto el Gerente General como el Administrativo saben que, aún cuan-
do hayan podido modelar adecuadamente las componentes anteriores, lo mismo va
a quedar una variación irregular como resultado de la acción de diversos factores
aleatorios, que no son fáciles de representar. Cuando alguno de estos factores tiene
una incidencia determinante sobre el comportamiento de la serie -provocando un
brusco pico o caída-, resulta importante identificar el punto y asignar la causa de la
variación, para facilitar la interpretación del comportamiento de la serie, y tener en
cuenta la ocurrencia de estos imponderables al efectuar un pronóstico.

Bien, todo lo concerniente al análisis mencionado previamente, lo va a encontrar en


el Texto, dentro del siguiente Capítulo:

SERIES TEMPORALES

Lea los siguientes temas:

• Introducción

• Tipos de variación

• Análisis de tendencia

• Variación cíclica

• Variación temporal

• Variación irregular

• Uso del análisis en predicciones

Al final de los dos primeros temas, y de los dos últimos, figuran una serie de pregun-
tas conceptuales, que le conviene analizar y responder, ya que le facilitarán la
internalización de los conceptos presentados.

107
UNIDAD 3

En el resto de los temas, el Texto propone varios ejercicios prácticos. Le sugiero


que resuelva al menos uno de cada tema, para ejercitar el ajuste de modelos de
tendencia lineal y no lineal, el cálculo de los residuos cíclicos, y el uso de promedios
móviles.


REVISION DE CONCEPTOS DESARROLLADOS

• serie de tiempo Secuencia de valores de una variable registra-


dos a lo largo del tiempo.

• modelo clásico de Modelo de descomposición en componentes ,


análisis de series que analiza los principales factores de variación
temporal de la serie.

• tendencia secular Movimiento creciente o decreciente de la


serie a lo largo del tiempo.

• variación cíclica Fluctuación lenta de la serie en períodos largos,


caracterizada por picos y caídas de varios años
de duración.

• variación estacional Fluctuación natural de la serie en períodos me-


nores a un año, asociada a factores estacionales.

• variación irregular Fluctuación aleatoria de la serie.

• remoción de las Eliminación de alguna de las componentes de


componentes la serie, para evidenciar mejor el efecto de las
demás.

• modelo de tendencia Ecuación matemática que representa la tenden-


cia general de la serie durante un período de
tiempo suficientemente prolongado.

• residuo cíclico Diferencia entre el valor observado y el valor


estimado por el modelo de tendencia.

• promedio móvil Promedio de un cierto número de valores de la


serie observados antes y después de un tiempo

108
UNIDAD 3

dado, que permite suavizar las irregularidades


de la serie.

RECOMENDACIONES PRACTICAS

• La gráfica de la serie en una escala adecuada, permite explorar visualmente


el comportamiento de la serie, y detectar sus principales componentes.

• Durante este análisis preliminar de la serie, puede ser útil identificar las
variaciones irregulares muy pronunciadas, a las que se pueda asignar una
causa concreta.

• El modelo de tendencia es válido para el rango de valores considerados en


el ajuste. Hay que tener mucho cuidado al extrapolar valores más allá de
dicho rango.

• El empleo de promedios móviles resulta extremadamente útil para suavizar


las irregularidades de la serie, y poner en evidencia las componentes presen-
tes en la estructura de la serie.

• El objetivo más común del análisis de una serie, es efectuar pronósticos


sobre el comportamiento de una variable, y usar esta información para facili-
tar la toma de decisiones. En un mundo tan cambiante como el actual, son
muchos los factores que pueden modificarse de un año a otro, por lo que
resulta imprescindible agregar una buena cuota de sentido común a la predic-
ción estrictamente matemática, para no caer en conclusiones inapropiadas
que conduzcan a decisiones equivocadas.

109
UNIDAD 3

1
La siguiente serie representa las ventas anuales de un electrodoméstico, du-
rante el período 1980-1996:

Año Ventas Año Ventas

1980 4154 1988 5787


1981 5954 1989 5402
1982 5880 1990 6754
1983 7666 1991 7444
1984 6160 1992 7554
1985 5923 1993 9101
1986 4132 1994 8337
1987 5474 1995 7070

a. Dibuje la serie, analice su estructura, e identifique las principales compo-


nentes presentes.

b. Modele la tendencia.

c. Identifique los ciclos, si existen, y efectúe el tratamiento correspondiente.

d. Pronostique el total de ventas para el año 1996.

Sugerencia: codifique los años, arrancando de cero y aumentando de uno en


uno, para facilitar los cálculos.

Confronte con la Solución Nº 1

110
UNIDAD 3

2
La siguiente serie representa las ventas de otro electrodoméstico, discrimina-
das mes a mes, durante el período 1990-1994:

Año 1990 Año 1991 Año 1992 Año 1993 Año 1994

Mes Venta Mes Venta Mes Venta Mes Venta Mes Venta

1 5450 1 6781 1 6660 1 8598 1 5521


2 5284 2 7190 2 7161 2 8155 2 5015
3 5944 3 8159 3 7652 3 8828 3 5571
4 6272 4 7036 4 7369 4 7866 4 6174
5 6844 5 7167 5 7980 5 8801 5 6790
6 7584 6 7613 6 7616 6 8733 6 6182
7 4643 7 4689 7 3936 7 6775 7 5152
8 2540 8 4576 8 3710 8 4157 8 4158
9 4542 9 7120 9 8088 9 6661 9 6088
10 3654 10 7586 10 8417 10 8872 10 7626
11 3411 11 7366 11 8274 11 8271 11 4996
12 5706 12 5932 12 6662 12 5071 12 3940

a. Dibuje la serie.

b. Realice el análisis correspondiente de la componente estacional de la


serie.

c. Pronostique las ventas para diciembre de 1995.

Confronte con la Solución Nº 2

2. TECNICAS DE ANALISIS AVANZADAS

El análisis de la estructura de una serie de tiempo resulta muy sencillo si aplicamos


herramientas estadísticas tales como la Función de Autocorrelación y la Función
de Densidad Espectral.

Su determinación es bastante laboriosa, por lo que para hacer viable su utilización


es necesario disponer de algún software estadístico que incluya el análisis de series
de tiempo.

111
UNIDAD 3

Estas funciones permiten poner en evidencia el comportamiento general de la serie,


e identificar la presencia de sus distintas componentes. Veamos en qué consiste
cada una:

a. Función de Autocorrelación

La autocorrelación se refiere a la correlación que existe entre los valores de una


misma variable, considerada a diferentes intervalos. Su valor refleja de alguna ma-
nera la "memoria" del proceso analizado, o sea en qué medida las observaciones
actuales dependen de las anteriores.

Para determinar la Función de Autocorrelación (FAC) hay que seguir los siguientes
pasos:

1. Determinar el coeficiente de correlación entre valores consecutivos de la serie.


De esta manera se calcula el coeficiente de correlación para retardo uno -r1-, es
decir para valores separados por un intervalo.

2. Determinar el coeficiente de correlación para retardo dos -r2-, es decir para


valores separados por dos intervalos.

3. Continuar el cálculo de los coeficientes de correlación para distintos retardos,


hasta el retardo de orden k.

4. Construir la gráfica de la FAC, colocando en abscisas los retardos y en ordena-


das los coeficientes de correlación correspondientes a cada retardo.

La forma de la FAC permite identificar con facilidad el tipo de componente pre-


sente en la serie.

Una serie con tendencia tiene una FAC con la siguiente forma:

Gráfico Nº 2
112
UNIDAD 3

Una serie con estacionalidad presenta una FAC como la siguiente:

Función de Autocorrelación

1
0.8
0.6
0.4
0.2
r 0
1 2 3 4 5 6 7 8 9 10 11 12 13 14
-0.2
-0.4
-0.6
-0.8
-1
Retardo

Gráfico Nº 3

Una serie estacionaria es aquella que no presenta cambios ni en su media ni en su


varianza a lo largo del tiempo. La FAC de tales series decae rápidamente a cero, de
la siguiente forma:

Función de Autocorrelación

0.8

0.6

r 0.4

0.2

0
1 2 3 4 5 6 7 8 9 10
-0.2
Retardo

Gráfico Nº 4

Una serie que tiene autocorrelación hasta retardo de orden 3, tendría una FAC

113
UNIDAD 3

aproximadamente así:
Función de Autocorrelación

0.8

0.6

r 0.4

0.2

0
1 2 3 4 5 6 7 8 9 10
-0.2
Retardo

Gráfico Nº 5

Una serie con una estructura totalmente aleatoria, es decir que no está afectada por
la acción de ninguna componente, tiene una FAC muy particular, en la cual los
coeficientes de correlación para diferentes retardos son todos parecidos, y sus va-
lores no son significativos -la autocorrelación es prácticamente nula-:
Función de Autocorrelación

0.5
0.4
0.3
0.2
0.1
r 0
-0.1 1 2 3 4 5 6 7 8 9 10

-0.2
-0.3
-0.4
-0.5
Retardo

Gráfico Nº 6

Para determinar si el coeficiente de correlación de orden τ es significativamente


diferente de cero, se puede realizar la siguiente prueba:

114
UNIDAD 3

H0: ρτ = 0

H1: ρτ ≠ 0

La decisión de rechazar o no H0 se basa en el valor de rτ -autocorrelación de


orden τ calculada para la serie disponible-.

b. Función de Densidad Espectral

La Función de Densidad Espectral (FDE) es la transformada de Fourier de la Fun-


ción de Autocorrelación. Esta nueva función distribuye la varianza total de la mues-
tra sobre el rango de frecuencias de aparición de cada valor, por lo que tiene las
propiedades de una función de densidad.

Como la varianza es una medida de la dispersión de los datos en torno a su media,


la FDE la distribuye sobre las bandas de frecuencia que producen las mayores
fluctuaciones.

El espectro toma diferentes formas, según sea el proceso generador de la serie.

Una serie con tendencia concentra las varianzas en la frecuencia cero, como se ve
en la siguiente figura:
Función de Densidad Espectral

0.01
0.009
0.008
0.007
0.006
Var 0.005
0.004
0.003
0.002
0.001
0
0.02 0.06 0.1 0.14 0.18 0.22 0.26 0.3 0.34 0.38
Fecuencia

Una serie con fluctuación estacional concentra la varianza sobre la frecuencia


correspondiente al período de la serie -longitud total de un ciclo estacional-. Para
un período de 4 intervalos de tiempo, el gráfico se vería del siguiente modo:

115
UNIDAD 3

Función de Densidad Espectral

0.01
0.009
0.008
0.007
0.006
Var 0.005
0.004
0.003
0.002
0.001
0
0.02 0.06 0.1 0.14 0.18 0.22 0.26 0.3 0.34 0.38
Fecuencia

Gráfico Nº 7

Finalmente, una serie completamente aleatoria presenta un espectro uniforme la lo


largo de las distintas bandas de frecuencia:
Función de Densidad Espectral

0.01
0.009
0.008
0.007
0.006
Var 0.005
0.004
0.003
0.002
0.001
0
0.02 0.06 0.1 0.14 0.18 0.22 0.26 0.3 0.34 0.38
Fecuencia

Gráfico Nº 8

Resumiendo, dada una serie temporal, con el auxilio de un programa estadístico


podemos calcular la FAC y la FDE de la misma. Del análisis conjunto de estas dos
funciones, surge cuáles son las componentes presentes en la serie, lo que ayuda a
explicar el mecanismo generador de la misma.

116
UNIDAD 3

REVISION DE CONCEPTOS DESARROLLADOS

• autocorrelación Correlación entre dos valores de la serie, me-


dida para diferentes retardos.

• retardo Número de intervalos para el cual se calcula la


autocorrelación.

• función de Función que asigna los valores de correlación


autocorrelación para diferentes retardos.

• función de densidad Función que distribuye la varianza sobre el ran-


espectral go de frecuencias de aparición de cada valor.

• serie estacionaria Serie en la que no cambian la media ni la varianza


a lo largo del tiempo.

RECOMENDACIONES PRACTICAS

• El análisis de la Función de Autocorrelación y de la Función de Densidad


Espectral permite identificar con facilidad las componentes presentes en una
serie. La determinación se hace en forma visual, inspeccionando los gráficos
de las respectivas funciones, que son el resultado de cálculos analíticos com-
plejos, lo cual confiere a esta técnica una base muy sólida.

• Cuando una serie presenta varias componentes superpuestas, el uso de


estas herramientas no es tan simple, ya que la interpretación de las gráficas se
complica. Hasta tanto adquiera habilidad como para llevar adelante el análi-
sis de esos casos, es recomendable que recurra al auxilio de un especialista
en el tema, para no formular conclusiones erróneas.

117
UNIDAD 3

Ejemplos:

3. Serie de montos de ventas anuales de la Compañía Kodak para el período 1970/


92 (Fuente: Moody's Handbook of Common Stocks).

Año Ventas Año Ventas

1970 2.8 82 10.8


71 3.0 83 10.2
72 3.5 84 10.6
73 4.0 85 10.6
74 4.6 86 11.5
75 5.0 87 13.3
76 5.4 88 17.0
77 6.0 89 18.4
78 7.0 90 18.9
79 8.0 91 19.4
80 9.7 92 20.1
81 10.3

a. Gráfica de la serie:

25

20

15
Ventas
10

0
1 6 11 16 21
Años

118
UNIDAD 3

b. Función de Autocorrelación:
0.9
0.8
0.7
0.6
0.5
r
0.4
0.3
0.2
0.1
0
1 2 3 4 5 6 7 8 9
retardo

c. Función de Densidad Espectral:

2000

1500

Var 1000

500

0
0 0.1 0.2 0.3 0.4 0.5
Frecuencias

c. Elabore las conclusiones del caso.

4. Serie de Gastos de Construcción en viviendas privadas en una ciudad de Esta-


dos Unidos, desde Enero de 1989 hasta Diciembre de 1993 (Fuente: Berenson y
Levine. Estadística Básica en Administración).

Año
Mes 1989 1990 1991 1992 1993
1 11.2 12.5 12.6 13.2 13
2 11 12 12 12.5 12.7
3 12.7 13.9 14.2 14.4 14.8
4 14.3 15.4 15.6 15.8 15.9
5 16.2 17 17.1 17.1 17.1
6 17.7 18.2 18.3 18.1 17.7
7 18.4 18.6 18.9 18.7 17.9
8 18.6 18.8 19.3 18.9 18
9 18.1 18.4 18.7 18.1 16.8
10 18 18.2 18.7 17.8 16.3
11 16.7 17.1 17.7 16.7 14.7
12 14.2 14.5 15 14 12.2

119
UNIDAD 3

a. Gráfica de la serie:
21
19
17
Gastos

15
13
11
9
1 11 21 31 41 51
Mes

b. Función de Autocorrelación:
1

0.5

r 0
1 10 19
-0.5

-1
retardo

c. Función de Densidad Espectral:

300
250
200
Var 150
100
50
0
0 0.0833 0.1667 0.25 0.3333 0.4167 0.5
Frecuencias

120
UNIDAD 3

d. Elabore las conclusiones correspondientes a este análisis.

5. Serie de datos de diámetro exterior de resortes, registrados consecutivamente


durante un estudio inicial de esa característica, en la firma Campeón S.A.

1 133.33 26 133.17 51 133.20 76 133.26 101 133.44


2 133.19 27 133.29 52 133.16 77 133.12 102 133.16
3 133.04 28 133.24 53 132.97 78 133.42 103 132.94
4 133.07 29 133.35 54 133.25 79 133.36 104 133.08
5 132.78 30 132.91 55 133.38 80 133.38 105 133.17
6 133.18 31 133.12 56 133.20 81 133.14 106 133.52
7 133.11 32 133.12 57 133.16 82 133.10 107 133.16
8 133.14 33 133.12 58 133.36 83 133.14 108 133.30
9 133.24 34 133.07 59 133.15 84 133.26 109 133.30
10 133.35 35 133.20 60 132.86 85 133.05 110 133.22
11 133.28 36 133.30 61 133.36 86 133.09 111 133.21
12 133.35 37 133.31 62 133.38 87 133.04 112 133.19
13 133.13 38 133.12 63 133.34 88 133.20 113 133.26
14 133.42 39 132.83 64 133.21 89 132.94 114 133.30
15 133.12 40 133.37 65 133.48 90 133.41 115 133.29
16 133.26 41 133.40 66 133.04 91 133.01 116 133.02
17 133.12 42 133.14 67 133.23 92 133.15 117 133.20
18 133.19 43 133.37 68 132.90 93 133.23 118 133.33
19 133.07 44 132.93 69 133.18 94 133.17 119 133.31
20 132.95 45 133.02 70 133.11 95 133.21 120 133.16
21 133.42 46 133.36 71 133.29 96 133.13 121 133.23
22 133.29 47 133.34 72 133.21 97 133.02 122 133.36
23 133.34 48 133.20 73 133.35 98 133.49 123 133.06
24 133.29 49 133.08 74 133.31 99 132.95 124 133.22
25 133.16 50 133.21 75 133.21 100 133.24 125 133.04

121
UNIDAD 3

a. Gráfica de la serie:
133.6

133.4
Diámetro

133.2

133

132.8

132.6
1 21 41 61 81 101 121
Tiempo

b. Función de Autocorrelación:

0.5

0.3

0.1
r
-0.1 1 11 21

-0.3

-0.5
retardo

c. Función de Densidad Espectral:


0.16
0.14
0.12
0.1
Var 0.08
0.06
0.04
0.02
0
0 0.081 0.161 0.242 0.323 0.403 0.484
Frecuencias

d. Elabore las conclusiones correspondientes al análisis de esta serie.

122
UNIDAD 3

Conclusiones

En esta Unidad Usted ha incursionado en el análisis de series temporales, con la fina-


lidad de explicar el comportamiento pasado de una variable, y tratar de pronosticar
valores futuros de la misma

Los principales aspectos abordados sobre el tema han sido los siguientes:

• Definición de series de tiempo, y objetivos de su análisis.

• Tipos de variación de los valores de la serie: tendencia, ciclos, variación estacional y


variación aleatoria.

• Modelación de las componentes de una serie.

• Análisis de la estructura de una serie mediante herramientas avanzadas: la Función


de Autocorrelación y la Función de Densidad Espectral.

• Pronósticos basados en el análisis de la serie.

Con la incorporación de estas técnicas de análisis, Usted maneja a partir de ahora


herramientas estadísticas de fundamental importancia para facilitar la toma de decisio-
nes respecto a hechos futuros en base al análisis de datos históricos, minimizando el
grado de incertidumbre, y reduciendo los riesgos que involucran tales decisiones.

123
UNIDAD

3
SOLUCIONES A LAS
ACTIVIDADES DE PROCESO
UNIDAD 3

SOLUCIONES A LAS ACTIVIDADES DE PROCESO

1. a. Componentes presentes en la serie: tendencia lineal - ciclos plurianuales.


b. Con los datos codificados, el modelo de tendencia ajustado es: y = 5030 +
186 x
c. Hay tres ciclos bien diferenciados en la serie:
Período 1981-84 por encima de la línea de tendencia
Período 1985-90 por debajo de la línea de tendencia
Período 1991-94 por encima de la línea de tendencia

Cálculo de residuos cíclicos con respecto al modelo de tendencia:

Año 1980 1981 1982 1983 1984 1985 1986 1987


Residuo cíclico -17.42 14.15 8.25 37.19 6.69 -0.62 -32.77 -13.55
relativo [%]

Año 1988 1989 1990 1991 1992 1993 1994 1995


Residuo cíclico -11.21 -19.42 -1.97 5.20 4.02 22.19 9.20 -9.60
relativo [%]

d. El pronóstico de ventas para el año 1996 según el modelo de tendencia es


de 8006, pero teniendo en cuenta que durante el año 1995 comenzó un
ciclo de retracción de ventas, el pronóstico real es menor.

2. b. Cálculo del índice estacional para cada uno de los 12 meses del año:

Mes 1 2 3 4 5 6
Media Modif. 105.53 105.90 114.17 105.55 115.32 111.28
Media Ajustada 105.1 105.4 113.7 105.1 114.8 110.8

Mes 7 8 9 10 11 12
Media Modif. 79.22 54.86 101.05 113.86 110.44 88.22
Media Ajustada 78.9 54.6 100.6 113.3 109.9 87.8

c. El pronóstico de ventas para diciembre de 1995 según el modelo de tenden-


cia es aproximadamente 8415.

124
UNIDAD 3

El pronóstico estacionalizado para diciembre es: 8415 x 0.878 = 7388.37

3. Tanto la FAC como la FDE indican con claridad la existencia de una tendencia
en la serie ananlizada.

4. La FAC de la serie indica la existencia de ciclos. La FDE indica que los ciclos
se repiten en períodos de longitud L=1/0.0833=12 intervalos - cada 12 me-
ses-, poniendo de manifiesto que se trata de ciclos estacionales.

5. Ni en la FAC ni en la FDE se advierten patrones especiales, y por lo tanto


todo indica que la serie de diámetros es totalmente aleatoria.

125
UNIDAD

3
ACTIVIDADES DE
AUTOEVALUACION
UNIDAD 3

1. Explique qué es una serie de tiempo, y cuáles son los objetivos de su análisis.

2. ¿Qué tipos de variaciones están presentes en una serie temporal, y qué repre-
senta cada una?

3. Explique en qué consiste básicamente el análisis de una serie.

4. ¿Cómo se puede modelar la tendencia?

5. ¿Cómo se puede detectar la presencia de un ciclo superpuesto a la tendencia


general de la serie?

6. ¿Qué tipo datos conviene emplear para el análisis de ciclos y tendencias?

7. ¿Cómo se puede modelar el patrón estacional? ¿Qué tipo de datos es necesario


disponer?

8. Explique cuál es la utilidad de calcular promedios móviles.

9. ¿Qué es una serie desestacionalizada?

10. ¿Cómo se efectúa el tratamiento de la componente irregular de una serie?

11. Explique el concepto de autocorrelación, y qué es la Función de Autocorrelación.

12. Explique en qué consiste la Función de Densidad Espectral.

13. ¿Para qué se usan la FAC y la FDE?

14. ¿Qué precauciones hay que tener al utilizar los resultados del análisis de una
serie?

15. En base a los valores de diámetro del resorte tipo "RRR" usados en las Activi-
dades de Autoevaluación de la Unidad Nº1, efectúe un análisis convencional de la
serie, desde la observación Nº 30 hasta la Nº 60. Identifique y modele las compo-
nentes presentes.

16. Considerando los últimos 60 datos de la serie de diámetros del resorte tipo
"RRR", realice el análisis de la serie empleando la FAC y la FDE. Elabore un bre-
ve informe especificando el comportamiento de la serie.

126
CONTROL DE L A
CALIDAD

UNIDAD

4
UNIDAD

4
UNIDAD 4
ORIENT A C I ” N DEL
RIENTA
A PRENDIZAJE

Si bien existen numerosas definiciones de calidad, una que está muy en boga y que
de alguna manera expresa la idea básica es la siguiente: "calidad es cumplir con
los requisitos del cliente".

Esta definición se puede aplicar a la producción de bienes o servicios. Además,


en la concepción moderna de la calidad, el cliente puede ser tanto el consumidor
final, como cada uno de los eslabones que componen el proceso de elaboración.

¿Cómo se puede determinar si un producto cumple con los requisitos del cliente?
Para ello es necesario controlar sus principales propiedades.

Históricamente, el control de calidad se hacía mediante una inspección final de


productos terminados. Los productos que no cumplían con alguna de las especifi-
caciones del cliente se clasificaban como no conformes, y eran retrabajados o
rechazados. El problema de este enfoque - además del perjuicio económico - con-
siste en que una vez terminado el producto es muy difícil establecer en que etapa de
su elaboración había surgido el problema, como para tomar alguna acción correctiva
apropiada. No existe una retroalimentación del sistema.

En la concepción moderna, se establecen controles en cada una de las etapas de


elaboración del producto, lo que permite reaccionar inmediatamente frente a la
ocurrencia de problemas, y actuar en forma preventiva. Con este criterio prevalece
el concepto de prevención antes que el de detección de problemas.

Para garantizar la calidad del producto, no basta con utilizar la mejor materia prima
posible, tener mano de obra capacitada, buena maquinaria, etc., sino que es nece-
sario medir periódicamente los resultados del trabajo realizado para establecer
fehacientemente si se ajustan a lo esperado.

126
UNIDAD 4

Si bien existen diferentes propuestas de metodologías para el control de calidad,


vamos a analizar en particular el Control Estadístico de Procesos (CEP), que
consiste en el uso de herramientas estadísticas para controlar la variabilidad de los
procesos. Una de las técnicas más usadas son las cartas de control de Shewart,
que sirven para comprobar si un proceso está funcionando en condiciones norma-
les.

Es conveniente remarcar que el enfoque moderno de la calidad va más allá del mero
control: la calidad se "planifica", se "controla", y se "mejora", es decir que debe
entenderse como un proceso continuo. Por lo tanto, si bien en esta Unidad nos
vamos a ocupar principalmente de la etapa de control, la calidad empieza mucho
antes, en la planificación y aplicación de políticas de calidad, se retroalimenta con
los controles, y continúa con la implementación de acciones que tiendan a un mejo-
ramiento continuo de los procesos.

Los conceptos presentados van a ser abordados en la presente Unidad, de acuer-


do al siguiente esquema:

127
UNIDAD 4

Esquema
Tema
Conceptual

Control de la Calidad

Objetivo
General Controlar la calidad de productos y
servicios, evaluar la variabilidad de
procesos y mejorar continuamente
su rendimiento.

Objetivos
Específicos

Planificar y Estudiar y
administrar controlar la
eficientemente la variabilidad de un
calidad proceso

Herramientas
usadas
Calidad total, grupos Cartas de control
de trabajo, por variables y por
herramientas para atributos
trabajo en grupo
(Pareto, espina de pez,
etc.)

128
UNIDAD 4

Objetivos del
Conocer la filosofía moderna de la calidad Aprendizaje

Manejar las herramientas usadas en el control de calidad.

Comprender la importancia del estudio y control de la variabilidad.

Emplear el Control Estadístico de Procesos

Contenidos
1. Control de la calidad.

2. Control estadístico de procesos.

2.1 Cartas de control por variables

2.2 Cartas de control por atributos

129
UNIDAD 4

MODALIDAD DE TRABAJO

El desarrollo de esta Unidad se realiza en base al siguiente esquema general:

ACTIVIDAD MATERIAL CONCEPTOS EJERCITACION


UTILIZADO DESARROLLADOS PROPUESTA
Introducción al Tema 1: GUIA  Objetivos del control de Ejemplo introductorio
Control de la Calidad Calidad.
 Gestión de la calidad.
Lectura de la bibliografía TEXTO  Introducción al control de la Ejercitación del Texto
obligatoria Calidad.
 Administración total de la
Calidad.
Revisión de conceptos GUIA
desarrollados
Actividades de proceso GUIA Ejercicios prácticos
Tema 2: GUIA  Causas de variación. Ejemplos prácticos
Control Estadístico de  Cartas de Control. Base
Procesos Conceptual del método.
Control por Variables
Lectura de la bibliografía TEXTO  Control estadístico de
obligatoria Procesos.
 Diagramas de control para
Medias.
 Diagramas de control para
la dispersión.
Control por atributos GUIA  Tratamiento de atributos. Ejemplos prácticos
Lectura de la bibliografía TEXTO  Diagramas de control p
obligatoria para atributos.
Revisión de conceptos GUIA
desarrollados
Actividades de proceso GUIA Ejercicios prácticos
Conclusiones GUIA
Actividades de GUIA Ejercitación
Autoevaluación teórico-práctica
a í f argo i l b iB

Bibliografía Obligatoria

LEVIN, Richard y RUBIN, David. Estadística para Administradores. Sexta Edición.Editorial


Prentice-Hall. México. 1996.

130
UNIDAD 4

1. CONTROL DE LA CALIDAD

Un grupo de trabajo formado en una de las líneas de producción de la firma Cam-


peón S.A. está analizando los problemas de calidad detectados con los resortes
para vehículos particulares. El análisis de datos con reclamos de clientes permitió
armar el siguiente diagrama de Pareto:

50

Frec. [%]
40

30

20

10

0
Diámetro Altura
Diámetro Pintura Embalaje Otros
Pintura Otros

Reclamos

Gráfico Nº 1

Según se desprende del gráfico, las dos principales causas de reclamos son el diá-
metro y la altura de los resortes. Estas dos variables se denominan en la jerga
industrial características de calidad, ya que miden propiedades relevantes del
producto que condicionan su correcto desempeño.

El grupo de trabajo decide encarar primero el análisis del diámetro de los resortes.

Empleando la técnica del "torbellino de ideas", arman la espina de pez de la carac-


terística, que es un diagrama en el cual se resumen todas las fuentes de variación
que afectan a la variable, agrupadas en 5 items básicos, denominados las 5 M:
Máquina, Materiales, Método, Mano de Obra y Medio Ambiente.

Para el caso de los diámetros, el grupo elaboró el siguiente diagrama:

131
UNIDAD 4

Máquina Materiales
Horno
Rodillo
Mandril Proveedor Dureza

Diámetro
Experiencia Puesta a Punto
Capacitación Turbulencias
Velocidad
Mantenimiento

Mano de Obra Medio Ambiente Método

El grupo identifica los factores que considera relevantes para estudiarlos con mayor
profundidad, y simultáneamente comienza a elaborar alternativas de acciones a corto
y mediano plazo tendientes a mejorar el proceso de fabricación.

Por su parte el estadístico del grupo descarga toda la batería de herramientas útiles
para este tipo de análisis:

 Selección de una muestra representativa de la producción de resortes,


y medición de los diámetros.
 Confección del diagrama de caja, e histogramas de frecuencias simples y
acumu ladas de los datos.
 Cálculo de las principales medidas analíticas: media aritmética, mediana,
modo, desvío estándar, coeficiente de asimetría.
 Determinación de la distribución de probabilidades de la variable.
 Inferencias sobre los parámetros poblacionales.
 Estimación del porcentaje de la producción que no cumple con las espe-
cificaciones del cliente.
 Análisis de relaciones entre los factores de variación y la variable analiza-
da.
 Estudio de la evolución de los diámetros durante la jornada de trabajo.

La información obtenida mediante estos análisis permite poner en evidencia los


principales problemas que afectan al diámetro de los resortes, y de esta manera el

132
UNIDAD 4

grupo puede determinar con facilidad los cursos de acción apropiados.

En todo este análisis subyace la siguiente idea: es fundamental estudiar la variabili-


dad de la característica de calidad: determinar su patrón de comportamiento,
calcular sus principales propiedades, modelar su distribución, y conocer su evolu-
ción temporal.

Se sabe que es imposible fabricar piezas exactamente iguales. Si siempre van a


existir variaciones dentro de un proceso ¿tiene algún sentido el estudio de la varia-
bilidad? Existen varios motivos que lo justifican:

 Determinar el patrón de comportamiento de una característica de


calidad, y comprobar si está de acuerdo con lo que se espera.
 Verificar si la dispersión de la variable es razonable o excesiva, y si el
centrado es correcto. En definitiva, si se cumple o no con las especificaciones del
cliente.
 Estudiar la evolución de la variable, y determinar si tiene un comporta-
miento estable, o está sujeto a frecuentes cambios.
 Evaluar la efectividad de las acciones implementadas para reducir la varia-
bilidad y mejorar el rendimiento de un proceso.

Dentro del enfoque moderno de la calidad, la reducción de la variabilidad de los


procesos debe ser un objetivo permanente de los grupos de trabajo, no solo para
asegurar el cumplimiento de los requisitos del cliente, sino también para incorporar
en la mentalidad de trabajo la filosofía del mejoramiento continuo.

Un ejemplo de la aplicación concreta de estos conceptos lo constituye el caso


japonés. De una manufactura caracterizada por su baja calidad antes de la Segunda
Guerra, después de la misma sufrió un cambio espectacular como resultado de la
reformulación de las políticas de calidad, el convencimiento de los niveles directivos
sobre la importancia del tema, y el involucramiento de todos los niveles del perso-
nal. Dentro de la filosofía japonesa de la calidad, uno de los aspectos relevantes es
el estudio de la variabilidad, y la realización de esfuerzos tendientes a su reducción,
entendidos como procesos continuos en el tiempo.

Para profundizar sobre estos conceptos, remítase en el Texto al siguiente Capítulo:

CALIDAD Y CONTROL DE CALIDAD

Lea la Introducción de este Capítulo. Posteriormente le sugiero alterar en alguna


medida el orden propuesto en el Texto, y pasar al tema Administración de cali-

133
UNIDAD 4

dad total. En estos dos apartados usted va a encontrar información general sobre
los principales conceptos relativos a la calidad: definición, gestión de la calidad,
herramientas usuales, estudio de la variabilidad, e importancia del mejoramiento
continuo de la calidad. Resuelva la ejercitación propuesta al final de ambos temas.


REVISION DE CONCEPTOS DESARROLLADOS

 control de la calidad Secuencia de tareas tendientes a garantizar que


un producto cumpla con las especificaciones del
cliente.

 especificaciones Valores estándares especificados en el diseño de


un proceso o producto.

 productos no Bienes o servicios que no cumplen con una o


conformes más especificaciones del cliente.

 característica de Variable o atributo que mide alguna propiedad


calidad relevante de un producto.

 diagrama de Pareto Gráfico en el que vuelcan las causas de no con


formidad de un producto, ordenados de acuer-
do a la frecuencia de ocurrencia.

 espina de pez Diagrama en el cual se identifican los factores de


variación de una característica de calidad.

 mejora continua Filosofía de trabajo que implica trabajar en pos


de la reducción de la variabilidad de los proce-
sos, y la mejora continua de su rendimiento

134
UNIDAD 4

RECOMENDACIONES PRACTICAS

 No existe un procedimiento único que permita garantizar la calidad de un


bien o de un servicio. La calidad es una exigencia y un desafío de nuestra
época, que requiere de programas a nivel de empresa, en los que deben
estar firmemente involucrados todos sus integrantes, desde la alta dirección
hasta el último operador.

 Dentro de los programas de calidad, un aspecto muy importante es el estu-


dio de la variabilidad de procesos, y la implementación de acciones tendien-
tes a controlar y reducir la variación.

 En el enfoque moderno de la calidad, es mejor prevenir que detectar los


problemas. Por ello se impone el control en las diferentes etapas de elabora-
ción de un producto, antes que la inspección de productos terminados.

 El diagrama de Pareto es una herramienta de gran utilidad para identificar


las causas de no conformidad de un producto, y atacar en principio las más
importantes, dejando las secundarias para una etapa posterior.

 El diagrama de causa-efecto, o espina de pez, permite relacionar una ca-


racterística de calidad con las fuentes de variación. Su análisis facilita la iden-
tificación de los factores más relevantes, que conviene estudiar más en pro-
fundidad, como así también la formulación de acciones de mejora que permi-
tan reducir la variación de la característica.

 En el análisis de los problemas de calidad deben intervenir personal de


todos los niveles de la empresa. Es imprescindible tener en cuenta el aporte
de los operadores de los procesos considerados, ya que son quienes están
más directamente vinculados con la problemática que se desea tratar.

 La filosofía actual de trabajo referida a la calidad, no se conforma con el


cumplimiento de las especificaciones, sino que apunta a incorporar el mejo-
ramiento continuo de procesos como uno de los objetivos permanentes.

135
UNIDAD 4

El Grupo de Trabajo responsable del lanzamiento del nuevo modelo de re-


sortes está muy ansioso por resolver los problemas que afectan al proceso, y
proponer acciones de mejora.

a. ¿Qué recomendaciones le haría para ordenar sus esfuerzos y optimizar


los resultados del trabajo grupal?
b. Para fabricar el nuevo modelo de resortes, se usará nueva maquinaria y
materia prima. ¿Qué tipos de controles propondría para verificar el diá
metro de las piezas?
c. Según se ve en la espina de pez de la característica, la velocidad de
trabajo es un factor importante. ¿Cómo se puede evaluar su influencia
sobre los diámetros?
d. Indique algunas propuestas de acciones concretas, enmarcadas dentro de
un proceso de mejoramiento continuo de la fabricación de resortes.

Confronte con la Solución Nº 1

2. CONTROL ESTADISTICO DE PROCESOS

El Control Estadístico de Procesos (CEP) es la aplicación de herramientas esta-


dísticas para el análisis y control de la variabilidad de un proceso.

En el punto anterior vimos que un grupo de trabajo estableció - después de efectuar


el análisis correspondiente - que el diámetro de los resortes era una característica
de calidad problemática, pues presentaba la mayor frecuencia de reclamos por no
conformidades.

La fábrica está por lanzar un nuevo modelo de resortes, así es que se decide apro-
vechar el mismo para efectuar un estudio piloto sobre los diámetros. Las especifi-
caciones de ingeniería establecen que el diámetro de estos nuevos resortes debe
oscilar entre los 132 y 134 mm.

Después de poner la maquinaria en las mejores condiciones posibles, seleccionar la


materia prima a utilizar, revisar el método de trabajo, y establecer las responsabili-
dades de cada miembro del grupo, se lanza una producción experimental de 125
piezas, tendiente a verificar el funcionamiento del proceso. Se mide el diámetro de

136
UNIDAD 4

todos los resortes de acuerdo al orden de producción.

Una vez finalizada la prueba, se procesan sus resultados y se analizan en una re-
unión grupal.
133.6

133.4
DIAMETRO

133.2

133.0

132.8

132.6
1 8 15 22 29 36 43 50 57 64 71 78 85 92 99 106 113 120

Número de Observación

La serie de diámetros presenta un comportamiento aparentemente aleatorio. No se


advierte a simple vista la presencia de ciclos, tendencias u otros patrones especia-
les.

El análisis de la Función de Autocorrelación de la serie permite confirmar la


aleatoriedad de los datos.

DIAMETRO
1.0
FAC

.5

0.0

-.5
Confidence Limits

-1.0 Coefficient
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Lag

137
UNIDAD 4

El diagrama de caja de los datos muestra que la distribución es bastante simétrica.

133.6

133.4

133.2

133.0

132.8

132.6
N = 125
DIAM ETRO

Las principales medidas analíticas calculadas para la serie disponible son las si-
guientes:

Posición: Media = 133.211 Mediana = 133.21 Modo = 133.12


Dispersión: Varianza = 0.02046 Desvío Estándar = 0.143
Forma: Coeficiente de Asimetría = -0.335

Se realizan pruebas de Kolmogorov y Chi-cuadrado de bondad de ajuste, y ambos


tests confirman que la muestra proviene de una población con distribución Normal.

Finalmente, comparando la distribución observada con las especificaciones, se ve


que todas las observaciones están dentro de tolerancias.

Gráfico Nº 2

138
UNIDAD 4

Si durante una jornada normal de trabajo se verifican condiciones similares a las de


este experimento inicial - en cuanto a las variaciones debidas a las 5 M - los diáme-
tros deberán tener un comportamiento parecido al que acabamos de ver.

Tipos de variación

En cualquier proceso existe una variabilidad natural, que es la suma de muchos


factores de variación relacionados con las 5 M, que hacen que nunca se fabriquen
dos piezas exactamente iguales. Estos factores constituyen las denominadas cau-
sas comunes de variación.

Si todo funciona normalmente, el proceso va a estar influenciado únicamente por las


causas comunes de variación, y en ese caso el patrón de comportamiento de la
variable es previsible y conocido, dado que se puede establecer mediante un análi-
sis estadístico como en el caso anterior.

¿Qué pasaría si se verifican cambios importantes en el proceso? Por ejemplo, si el


operador se enferma y lo remplaza otro empleado no experimentado, es probable
que aumente la dispersión del proceso; una modificación en la temperatura de seteo
del horno de calentamiento, puede producir una modificación en la media de la
característica estudiada; un error en la puesta a punto puede afectar tanto la media
como la dispersión del proceso. Cuando sucede un problema puntual como el de
los ejemplos, que tiene un fuerte impacto en los resultados del trabajo, se dice que
sobre el proceso están actuando causas especiales de variación. En estos casos
es posible asignar con relativa facilidad el motivo o la causa que afectó el funciona-
miento del proceso, y se debe actuar para removerla inmediatamente.

Por lo tanto, las causas especiales de variación pueden ser eliminadas tomando
acciones locales, dispuestas por el responsable del proceso, inmediatamente des-
pués que han sido detectadas. En cambio, las causas comunes de variación no son
tan fáciles de identificar, y para lograr su reducción es necesario tomar acciones a
nivel de sistema, que resultan más complejas y costosas, por lo que requieren
generalmente la intervención de la Dirección.

Cuando actúan solamente causas comunes de variación, el proceso permanece


estable, ya que el patrón de variación se mantiene en el tiempo.

139
UNIDAD 4

Fuente: Manual de la Norma QS-9000


Gráfico Nº 3

En cambio, cuando actúan causas especiales de variación, se dice que el proceso


está inestable, ya que cambia la media, la dispersión, o ambas propiedades simultá-
neamente.

Fuente: Manual de la Norma QS-9000


Gráfico Nº 4

140
UNIDAD 4

Cartas de Control

Una alternativa de control de la producción es la inspección del 100% de las piezas.


En el caso de los resortes, hay que medir sus diámetros y compararlos con las
tolerancias. Obviamente este método puede resultar lento, tedioso y costoso, y
además sólamente permite determinar si la pieza cumple o no con las especificacio-
nes, pero no brinda información adicional que sea de utilidad para evaluar el com-
portamiento del proceso.

Otra forma de control es tomando muestras periódicas de la producción, evaluan-


do en cada una de ellas la media y la dispersión de los datos. Si la característica
controlada tiene un valor estándar u objetivo de centrado y de dispersión - μ0 y 0,
con los resultados de cada muestra se pueden efectuar las siguientes comprobacio-
nes:

Prueba sobre la media: H0: μ = μ0


H1: μ  μ0

Prueba sobre la varianza: H0: 2 = 02


H1: 2  02

Si ninguna de las hipótesis nulas se rechaza, significa que, para el nivel de significa-
ción elegido y para los datos disponibles, no hay evidencia como para rechazar que
la media y el desvío del proceso sean iguales a los valores objetivos.

¿Qué importancia práctica tienen estos resultados? Si el centrado y la dispersión


del proceso no difieren significativamente de los valores objetivos, quiere decir que
el proceso está estable, y de acuerdo a lo que vimos anteriormente esto significa
que solamente actúan las causas comunes de variación.

En cambio, si alguna de las hipótesis se rechaza, significa que el centrado, la disper-


sión, o ambos, han cambiado significativamente. En ese caso el proceso está ines-
table, es decir que existen causas especiales de variación que deben ser inme-
diatamente identificadas y eliminadas.

Una de las ventajas de esta forma de control es que, como se basa en el uso de
muestras, en general requiere pocas mediciones. La frecuencia de muestreo y el
tamaño de las muestras depende del tipo de proceso y de la característica de cali-
dad que se controla, pero generalmente conviene trabajar con muestras pequeñas

141
UNIDAD 4

lo más frecuentes posibles. Otra ventaja del método es que brinda información
sobre la evolución de las principales propiedades del proceso.

Sin embargo, se puede objetar el hecho de que resulta una forma de control un
tanto compleja, ya que exige efectuar una prueba de hipótesis con los datos de
cada muestra, algo difícil de realizar por un operador al pie de la máquina. Por este
motivo, Walter Shewart, un estadístico americano, ideó en la década del '30 una
forma gráfica de realizar estas pruebas: las cartas de control.

Las cartas son diagramas que se usan para controlar el comportamiento de varia-
bles cuantitativas o cualitativas -atributos-.

Como cada tipo de carta presenta sus propias reglas de tratamiento, desarrollamos
las principales características de cada una.

2.1. Cartas de control por variables

Vamos a analizar los gráficos más usados en la práctica, que son las cartas de
control de medias-rangos.

Los diagramas x-R son dos gráficos, uno de los cuales controla la media del proce-
so, y el otro la dispersión. Son fáciles de construir e interpretar, por lo que pueden
ser manipulados directamente por el operador del proceso.

Control Chart: DIAMETRO


C ontrol C hart: D IA M E TR O
133.50
Mean

133.25
DIA M E TRO

UCL = 133.4019

Average = 133.2109

133.00 LCL = 133.0198


1 5 9 13 17 21 25

142
UNIDAD 4

.8

.6
Range

.4
DIA M E TRO

.2 UCL = .7003

A verage = .3312

0.0 LCL = .0000


1 5 9 13 17 21 25

Para elaborar estas cartas se procede del siguiente modo:

a) El operador toma la muestra, de acuerdo a la frecuencia y tamaño establecidos en el plan


de control de la empresa, y mide en cada pieza la característica de calidad controlada -en
este caso el diámetro de los resortes-.
b) Con los resultados de cada muestra, calcula la media y el rango.
c) La media y el rango calculados en el paso anterior se vuelcan en los respectivos diagramas.
d) El operador analiza las cartas, ve si el proceso está o no estable, y decide si puede
continuar trabajando normalmente o debe implementar acciones correctivas para remover
las inestabilidades.

Base conceptual del método

Usted debe estar haciéndose la siguiente pregunta: ¿cómo sabe el operador si el proceso
está estable?

Primero hay que aclarar que Shewart planteó el método con el supuesto de que la caracte-
rística controlada tiene distribución Normal. Por lo tanto, antes de implementar las cartas de
control hay que hacer la verificación de normalidad.

Shewart propuso utilizar como regla de decisión, para aceptar o rechazar la hipótesis nula,
un cierto intervalo alrededor del valor objetivo. Para el caso de la media, la cantidad gene-
ralmente utilizada son 3 desvíos alrededor de la media, y a los valores ubicados a esa

143
UNIDAD 4

distancia los llamó límites de control superior e inferior.

Esta idea se puede esquematizar gráficamente del siguiente modo:

0.4

0.3

0.2

0.1

0
95 97 99 101 103 105
media

Gráfico Nº 5

Si la variable efectivamente es Normal, entre ±3 desvíos de la media está aproxi-


madamente el 99.74 % de la distribución. Por lo tanto, fuera de los límites de con-
trol queda solamente el 0.26 % de la distribución, que es el nivel de significación de
la prueba.

El razonamiento seguido es el siguiente: se saca una muestra, y se calcula la media.


Si todo está funcionando normalmente, ese valor tiene una chance del 99.74 % de
estar dentro de los límites de control. Por lo tanto, si la media calculada está dentro
de los límites, no se rechaza la hipótesis nula - H0: μ = μ0 -, al nivel de significación
del 0.26 %, lo que significa aceptar que la media del proceso es estable, y que
sobre el proceso actúan únicamente las causas comunes de variación.

Si la media cae fuera de los límites de control, podríamos atribuirlo en principio al


azar. Pero como la chance de obtener un valor fuera de los límites es muy baja,
apenas del 0.26 %, lo razonable es pensar que algo raro está ocurriendo en el
proceso, que ha generado una media más allá de los límites 3. Eso raro que suce-
de es producto de la acción de alguna causa especial de variación, que debe ser
rápidamente identificada y eliminada del proceso.

144
UNIDAD 4

Por lo tanto, la carta de control sirve para identificar la acción de causas especiales
de variación que tornan al proceso inestable. Esto obliga al operador a reaccionar
en forma inmediata, investigando la causa de la inestabilidad, y tomando acciones
correctivas para eliminar su efecto. Una vez logrado esto, se puede continuar traba-
jando normalmente, es decir solamente bajo la acción de las causas comunes de
variación.

¿Por qué se trabaja con un nivel de significación tan bajo - sólo el 0.26 % -?
Recordemos que el nivel de significación mide la probabilidad de rechazar una hi-
pótesis verdadera, y en la carta de control eso significa rechazar que el proceso esté
estable cuando en realidad lo está. Si la carta indica que el proceso está inestable,
hay que reaccionar, generalmente parando el proceso y buscando la causa de la
inestabilidad. Esto lleva tiempo, y la parada puede resultar muy costosa. Si las
señales de inestabilidad son frecuentes, y en muchos casos las alarmas resultan
injustificadas, se termina provocando un sentimiento de desconfianza hacia el méto-
do, e inclusive el personal dejará de reaccionar cuando existan puntos fuera de
control. Para evitar esta situación, se trabaja con un nivel de significación muy bajo,
tratando de minimizar la probabilidad de dar alarmas falsas.

El mismo razonamiento efectuado para construir e interpretar la carta de medias, se


usa para la carta de rangos. Se usa el rango como medida de dispersión en lugar de
la varianza, ya que es una cantidad más fácil de calcular e interpretar sin conoci-
mientos avanzados de estadística. Además, el rango es una medida de dispersión
muy eficiente cuando se trabaja con muestras pequeñas.

Señales de inestabilidad

Si bien un punto fuera de alguno de los límites de control es la señal de inestabili-


dad más contundente, también existen otras señales de alarma, que indican patro-
nes no aleatorios de la variable. Cualquier comportamiento atípico de los diagramas
permite inferir la acción de causas especiales de variación, y se debe reaccionar
preventivamente.

Cuando en los diagramas no se detectan situaciones extrañas, se dice que el proce-


so está estable o bajo control estadístico. En cambio, cuando los gráficos eviden-
cian algún comportamiento sospechoso, se dice que el proceso está inestable o
fuera de control.

145
UNIDAD 4

Ventajas del método

Una de las ventajas fundamentales de las cartas de control es que permiten identifi-
car la acción de causas especiales de variación, inclusive antes de encontrar puntos
fuera de los límites de control.
Otra de las ventajas reside en el hecho de que los diagramas permiten hacer un
seguimiento del proceso en el tiempo, pudiéndose analizar la evolución de la media
y de la dispersión. En los gráficos resulta fácil visualizar de qué manera repercuten
todos los cambios y modificaciones realizados, y en especial el impacto de las
acciones tomadas con el propósito de mejorar el funcionamiento del proceso

Finalmente, la carta de control constituye una herramienta que le permite al opera-


dor trabajar más tranquilo, ya que le proporciona una evidencia concreta para sa-
ber si todo anda bien, y no se ve obligado a tener que "adivinar" la ocurrencia de
problemas en el proceso a su cargo.

Interpretación de las cartas

Para interpretar las cartas de control, conviene proceder del siguiente modo: prime-
ro se analiza la carta de rangos. Si los rangos están inestables, significa que la dis-
persión está fuera de control, y en ese caso también la carta de medias va a acusar
problemas. Si la carta de rangos está bajo control, se observa la carta de medias. Si
las dos cartas no muestran señales de inestabilidad, significa que el proceso está
estable. Si los rangos están estables, pero no así las medias, significa que hay pro-
blemas con el centrado del proceso.

Gráfico Nº 6

146
UNIDAD 4

Todo este análisis se ha realizado suponiendo que tenemos valores estándar de


centrado y dispersión. Sin embargo, lo más común es que al iniciar el estudio de una
característica de calidad no conozcamos de antemano su comportamiento, siendo
necesario disponer de un número suficientemente grande de muestras como para
poder establecer el mismo. En ese caso, en base a las primeras muestras se calcula
la media y la dispersión real del proceso, y con esos valores se determinan los
límites de control iniciales. Luego, a medida que se va mejorando el centrado o
reduciendo la dispersión, se pueden recalcular periódicamente los límites de con-
trol.

Ejemplo:

Vamos a usar las cartas de control con los 125 datos de diámetro de resortes
obtenidos en la producción experimental del nuevo tipo de resortes. Agrupamos las
observaciones consecutivas en subgrupos de 5 elementos. Posteriormente calcula-
mos la media general y el rango medio de los 25 subgrupos que quedan, y final-
mente calculamos los límites de control. Las cartas de control resultantes de medias
y rangos son las que se muestran al principio de este apartado.

Como se puede apreciar, ni en la carta de rangos ni en la de medias existen puntos


fuera de control, ni patrones de comportamiento "sospechosos", por lo que se con-
cluye que durante la producción experimental el proceso estuvo estable, es decir
bajo control estadístico.

Después de esta introducción donde se remarcaron los objetivos y beneficios del


CEP, le sugiero volver al Texto, para profundizar los siguientes conceptos:

 Cálculo de los límites de control, con media y desvío conocidos, o esti-


mados a partir de los datos.

 Interpretación de las cartas de control. Identificación de las principales


señales de inestabilidad.

 Aplicaciones de las cartas de control.

Lea los siguientes temas:

 Control estadístico de procesos

 Diagramas de control para medias

147
UNIDAD 4

 Diagramas de control para la dispersión


2.2 Cartas de control por atributos

Vamos a analizar los gráficos p, de proporción o porcentaje de producción defec-


tuosa.

En la práctica es muy común calificar un producto como conforme o no confor-


me, según cumpla o no con los requisitos del cliente. Generalmente esta calificación
surge de algún control sencillo, como una medición fácil de realizar, el uso de un
calibre pasa-no pasa, o una inspección visual del producto. El resultado de estos
controles es un atributo.

Los atributos toman valores no numéricos, y por lo tanto no es posible aplicar las
cartas por variables. Pero en el caso planteado, se puede calcular la fracción de
productos no conformes, y llevar un control periódico de esta cantidad.

Base conceptual del método

Si existe un valor objetivo de proporción defectuosa, digamos p0, o se conoce


suficientemente bien el proceso como para estimar ese valor, podemos efectuar
periódicamente la siguiente prueba:

H0: p = p0
H1 : p  p 0

Si no se rechaza la hipótesis nula, significa que la proporción de producción defec-


tuosa no ha cambiado significativamente, y por lo tanto que las variaciones que
sufre esa cantidad sólo está afectada por causas comunes. Por el contrario, si se
rechaza la hipótesis nula implica que en el proceso existen causas especiales de
variación, que hacen que la proporción de rechazo sea significativamente mayor o
menor que el valor objetivo. En el primer caso, hay que tomar acciones correctivas
para reducir la fracción rechazada a valores normales, y en el segundo, estudiar las
condiciones que permitieron disminuir esa cantidad para poder "copiarlas" en el
futuro.

Esta prueba también se implementa en forma gráfica, a través de la denominada


carta de control p. Es un gráfico donde se marca la fracción defectuosa que se
encuentra en una muestra de la producción, en un lote determinado, durante una
jornada de trabajo, etc., y se analiza su evolución a lo largo del tiempo.

148
UNIDAD 4

Construcción e interpretación de la carta

Para calcular los límites de control, nuevamente se utiliza el criterio de considerar


tres desvíos alrededor del valor central, que denominamos p0. Pero en este caso
hay que tener en cuenta que la proporción es una variable con distribución Binomial,
y por ende para calcular el desvío hay que considerar las propiedades de este
modelo.

El valor estándar p0 generalmente es desconocido, por lo que en la práctica se


analiza un número suficientemente grande de lotes o muestras, y se calcula un valor
promedio de proporción defectuosa.

Si el tamaño del lote es constante, los límites de control permanecen fijos. En cam-
bio, si el número de unidades considerados cambia en cada nuevo control, los
límites de control son variables, complicando un poco el trazado -y a veces la inter-
pretación- de la carta.

La construcción de la carta de control y su interpretación es básicamente la misma


que la de las cartas por variables. Una inestabilidad cualquiera indica que el proce-
so está fuera de control. Las inestabilidades pueden ser "positivas", como un punto
por debajo del límite de control inferior o una racha de puntos debajo del valor
objetivo, ya que indican una reducción de la fracción de no conformidades, o "ne-
gativas", cuando evidencian un aumento del índice de rechazo.

Ventajas y desventajas

Una de las principales ventajas de las cartas p es que su implementación general-


mente resulta más económica que una por variables, pues requieren mediciones
menos sofisticadas. Es común iniciar los controles a través de un gran número de
cartas p en distintos puestos de control, y allí donde se evidencien problemas
implementar cartas por variables. Además, el uso de estas cartas constituye un
excelente medio de control para la gerencia, ya que de un vistazo puede tomar
conocimiento de la evolución de la calidad en un determinado proceso.

La principal desventaja de las cartas p es que como los atributos son datos no
numéricos, su tratamiento es mucho más restringido que el de una variable, y por lo
tanto el análisis y las conclusiones son bastante menos "jugosas". Además, como se
requiere trabajar con lotes relativamente grandes, generalmente pasa mucho tiempo
entre punto y punto, limitando la capacidad de reacción en base a la información
brindada por las cartas.

149
UNIDAD 4

Ejemplo:

Veamos un ejemplo concreto. El grupo de trabajo responsable de la producción del


nuevo modelo de resortes debe estudiar entre otras características la carga de los
mismos. Para ello se prueba cada resorte en una balanza, y se verifica que la carga
esté dentro de las especificaciones de ingeniería. Si la carga es mayor que la tole-
rancia superior, la pieza se retrabaja, y si es menor que la tolerancia inferior, la pieza
se rechaza.

Generalmente se producen lotes de entre dos mil y tres mil resortes. Para tener una
idea si las condiciones del proceso son adecuadas, se toma una muestra de los
primeros trecientos resortes, se cuenta el número de piezas no conformes -bajas de
carga-, y se calcula la fracción de piezas rechazadas en cada muestra. Este valor se
vuelca en la carta de control.

Con los resultados de los primeros 20 lotes de producción, se calcula la proporción


de resortes bajos de carta, y se traza la carta de control correspondiente.
.05

.04
Proportion Nonconforming

.03

.02 RE CH

UCL = .0352
.01
Center = .0145

0.00 LCL = .0000


1 3 5 7 9 11 13 15 17 19

Como se puede apreciar, existe un 1.45 % de producción rechazada, en promedio


para los primeros 20 lotes. Analizando la carta resultante, se ve que no existe límite
inferior de control, ya que los tres desvíos por debajo del promedio caen en zona
de valores negativos.

Por otra parte se pueden identificar las siguiente señales de inestabilidad:

 Lote N°4: punto por encima del límite de control superior. Revisando las
anotaciones, se pudo determinar que ese día trabajó en el puesto de carga un ope-
rador no experimentado, lo que justifica el elevado nivel de piezas no conformes. El
Supervisor del proceso dispuso entrenar en esa tareas a varios operadores, de
manera que se puedan efectuar relevos necesarios sin afectar la calidad de la pro-
ducción

150
UNIDAD 4

 Lotes N°10 al 16: racha de puntos por encima de la media. Después de analizar
la información disponible, el Supervisor determinó que durante esos días el respon-
sable del proceso de revenido había seteado incorrectamente la temperatura del
Horno, lo que afectó en forma negativa la carga de los resortes. Como medida
preventiva, se dispuso mantener una comunicación fluida entre los responsables de
los distintos procesos para evitar en el futuro estos inconvenientes.

Después de esta introducción aclaratoria, le sugiero retornar al Texto para abordar


en profundidad todo lo referido al cálculo e interpretación de las cartas de control
p. Busque dentro del Capítulo de Control de Calidad, el siguiente tema:

 Diagramas p para atributos

REVISION DE CONCEPTOS DESARROLLADOS

 control estadístico de Aplicación de técnicas estadísticas para


procesos (CEP) controlar la variabilidad de un proceso.

 causas de variación Factores que afectan el desarrollo de un


proceso.

 causas comunes de Variación aleatoria o inherente al proceso, como


variación resultado de la superposición de muchos facto-
res.

 causas especiales Variación excesiva del proceso, producto


de variación de alguna causa asignable o fácil de
identificar.

 proceso estable o Proceso que se desarrolla solamente bajo la ac-


bajo control estadístico ción de causas comunes de variación.

 proceso inestable Proceso en el cual están presentes causas espe-


o fuera de control ciales de variación.

 control 100% Inspección de una cierta característica de cali-


dad en todas las unidades producidas.

 cartas de control de Diagramas que permiten controlar periódicamen-

151
UNIDAD 4

Shewart te la variabilidad de una característica de cali


dad.

 cartas por variables Diagramas que se usan para controlar carac-


terísticas de tipo numéricas.

 cartas por atributos Diagramas que sirven para controlar atributos.

 carta de media-rango Gráficos que permiten controlar el centrado y la


dispersión de una característica numérica.

 carta p Gráfico que se utiliza para controlar la fracción


de la producción que no cumple con las especi-
ficaciones.

 límites de control Valores utilizados en los diagramas de control


para decidir en forma gráfica si el proceso está
estable o inestable.

 señal de inestabilidad Puntos fuera de los límites de control, o cual-


quier patrón de comportamiento no aleatorio en
los diagramas que indican la presencia de cau-
sas especiales de variación.

RECOMENDACIONES PRACTICAS

 En los casos en que se deban implementar controles para garantizar la


conformidad de un producto, el control estadístico de procesos presenta
muchas ventajas comparativas con respecto al control 100%.

 La decisión entre emplear cartas por variables o atributos, depende de la


importancia de la característica a controlar, y de los medios o recursos dis-
ponibles. Siempre que sea posible es preferible utilizar el control por varia-
bles, ya que proporciona mayor información sobre la evolución del proceso.

 Antes de implementar una carta por variables del tipo propuesto por Shewart,
es necesario verificar la normalidad de la característica a controlar.

152
UNIDAD 4

 Los límites de control " 3 " no son los únicos posibles. Se pueden utilizar
límites más estrictos o más flexibles, dependiendo de varios factores, princi-
palmente la importancia de la característica a controlar, y del riesgo que re-
presenta una no conformidad en una unidad que llegue a manos del cliente. Al
modificar el ancho de los límites varía el nivel de significación de la prueba,
pero en general se tiende a trabajar con valores bajos para evitar dar alarmas
injustificadas.

 Para emplear satisfactoriamente las cartas de control, hay que diferenciar


correctamente entre el significado de variación común y especial. Todos los
niveles de una empresa vinculados al CEP deben conocer estos conceptos.

 Para entender con claridad el significado de las señales de inestabilidad, se


requieren conocimientos adicionales de estadística, entre los que se incluyen
el concepto de distribución de una variable, las medidas de posición y de
dispersión, y algunas nociones básicas de probabilidad.

 Cuando tenga que interpretar la evolución de una carta media-rango, en


primer lugar analice los rangos, ya que si la dispersión del proceso está ines-
table, muy probablemente también el centrado estará fuera de control.

Las herramientas del CEP son unos de los mejores aliados con que cuenta
un grupo de trabajo interesado en la mejora continua de los procesos a su
cargo.

 La sola implementación de las cartas de control produce un impacto posi-


tivo en el funcionamiento de un proceso, aún antes de tomar acciones
correctivas de fondo, ya que ayuda al operador a determinar cuando está
trabajando correctamente y cuando no, y estimula en él el compromiso de
"hacer las cosas bien desde la primera vez".

 Por lo general, la implementación de una carta de control no tiene un im-


pacto económico significativo, y en cambio su uso puede traducirse en bene-
ficios muy importantes, por la disminución del número de piezas rechazadas,
la reducción permanente de la variabilidad de los procesos, y una mayor
satisfacción del cliente.

 Para asegurar la eficacia de esta herramienta de control, es necesario capa-


citar en forma adecuada al personal de control, realizar un seguimiento perió-

153
UNIDAD 4

dico por parte de los mandos medios, e informar regularmente a la gerencia


acerca de la evolución observada en las cartas de control.

2
El Grupo de Trabajo responsable del lanzamiento del nuevo modelo de re-
sortes, tiene que controlar también la "dureza de revenido" de los resortes.
Después de analizar el tema, ha decidido implementar una carta de control de
medias-rangos, tomando muestras de 3 piezas cada 2 horas de producción.
Durante la primer semana de trabajo, los valores registrados fueron los si-
guientes:

Día Hora Mediciones Observaciones


Lunes 8:00 2.81 2.80 2.81 Arranque de Fabricación (A.F.)
Horno 430° Colada 215
10:00 2.83 2.81 2.84
12:00 2.81 2.83 2.81
14:00 2.81 2.82 2.79 Corriente brusca de aire por aper
tura de portones
Martes 8:00 2.82 2.80 2.82 A.F. Horno 430° Colada 215
10:00 2.80 2.82 2.84
12:00 2.82 2.82 2.80 Corriente brusca de aire por aper
tura de portones
14:00 2.80 2.81 2.78
Miérc. 8:00 2.80 2.80 2.81 A.F. Horno 430° Colada 215
10:00 2.84 2.84 2.83 Cambio de materia prima: Colada
324
12:00 2.84 2.85 2.83 Se baja la T° del Horno a 420° a
las 12:15 horas
14:00 2.80 2.80 2.81
Jueves 8:00 2.82 2.80 2.83 A.F.Horno 420° Colada 324 Hora
9:00: se baja T°a 410°

154
UNIDAD 4

10:00 2.78 2.77 2.80 Hora 10:15: se vuelve a subir la T°


del Horno a 420°.
12:00 2.84 2.80 2.82
14:00 2.83 2.81 2.81
Viernes 8:00 2.79 2.82 2.80 A.F. Horno 420° Colada 324
10:00 2.80 2.76 2.84 Hora 10:20: se para el Horno para
reparar placas caídas
12:00 2.82 2.82 2.84
14:00 2.81 2.80 2.84

a. Calcule la media y el rango de cada muestra, y vuelque los resultados en la


carta de control correspondiente.
b. Con los resultados de las seis primeras muestras, calcule y trace en las
cartas los límites de control para medias y para rangos.
c. Usando esos límites iniciales, analice el comportamiento del proceso. Iden-
tifique todas las señales de inestabilidad que se vean en las cartas, y en lo
posible indique las causas de las mismas.

Confronte con la Solución Nº 2

3
El nuevo modelo de resortes producidos por la firma Campeón presenta
problemas de pintura, especialmente con algunos detalles de terminación. En
forma preventiva, y hasta evaluar la verdadera magnitud del problema, el
ingeniero de proceso decide implementar una carta p. Durante esta etapa de
estudio se inspeccionan visualmente el 100 % de los resortes pintados. La
producción se encuentra estabilizada en alrededor de 2500 piezas por día.
Al final de cada jornada de trabajo se cuenta el número de resortes con fallas
en la pintura. Los resultados durante los últimos 21 días fueron los siguientes:

155
UNIDAD 4

Día Resortes Día Resortes Día Resortes


no conf. no conf no conf

1 105 8 110 15 99
2 140 9 125 16 102
3 98 10 98 17 102
4 125 11 115 18 89
5 125 12 108 19 103
6 110 13 95 20 97
7 132 14 112 21 99

a. Elabore la carta de control p. Con los resultados de los primeros 7 días,


calcule los límites de control, y represéntelos en el diagrama.
b. El grupo de trabajo fue implementando diferentes acciones de mejora
durante el transcurso del estudio. Analice la evolución de la carta durante
este tiempo, y efectúe su interpretación.
c. ¿Qué decisión tomaría al final de estos 21 días de control?

Confronte con la Solución Nº 3

156
UNIDAD 4

Conclusiones

La calidad es un término muy en boga en estos tiempos, ya que las posibilidades de


supervivencia de una empresa en un contexto tan competitivo como el actual de-
penden en buena medida de los esfuerzos que se hagan en el tema.

El control de la calidad es una de las actividades más importantes dentro del enfo-
que moderno de la calidad, ya que tiende a garantizar que los bienes y servicios
producidos cumplan con las expectativas del cliente, y facilita el comienzo de un
proceso de mejoramiento continuo.

Dentro de esta Unidad Usted ha repasado los principios modernos de la Calidad, y


algunas de sus herramientas básicas, como ser:

 Definición de calidad
 Significado del control de la calidad
 Diferencia entre detección y prevención de problemas
 Herramientas de diagnóstico: diagrama de Pareto, espina de pez
 Fuentes de variación
 Uso de las especificaciones, y concepto de no conformidad
 Concepto de mejoramiento continuo de procesos

Otro de los aspectos relevantes de esta Unidad fue el estudio de la variabilidad, que
resulta de fundamental importancia para entender el comportamiento de un proce-
so, determinar cuando se está trabajando correctamente, y evaluar los resultados
de las acciones tomadas en pos del mejoramiento continuo. Los principales con-
ceptos abordados fueron los siguientes:

 Control estadístico de procesos


 Causas comunes y especiales de variación
 Cartas de control por variables y por atributos
 Interpretación de las cartas
 Concepto de estabilidad de procesos
 Aplicación práctica de las herramientas estadísticas de control

La incorporación de estos conceptos le permitirá adquirir conocimientos muy valo-


rados a la hora de ofrecer sus servicios a una empresa o encarar proyectos particu-
lares, además de manejar un lenguaje imprescindible en el mundo moderno de los
negocios.

157
UNIDAD

4
UNIDAD 4
SOLUCIONES A LAS
A CTIVIDADES DE PROCESO

1. a. Fijar claramente los objetivos del grupo, definir sus integrantes y la responsa-
bilidad de cada uno, y evaluar los recursos disponibles. Usar todas las herra-
mientas disponibles para identificar los problemas de la línea, por ejemplo el
diagrama de Pareto. Establecer inmediatamente controles en los procesos
con problemas. Definir las características de calidad que van a ser medidas.
Armar o revisar la espina de pez de las características controladas, para iden-
tificar los factores que la afectan. Identificar todas las oportunidades de me-
jora del proceso, proponiendo alternativas concretas de solución.
b. Dado que se trata de un proceso nuevo, lo razonable es implementar inicial
mente un control sobre el 100 % de la producción para verificar los diáme-
tros de las piezas, hasta tanto se compruebe que el proceso es capaz de
cumplir con las especificaciones del cliente.
c. Utilizando alguna técnica explicativa de la estadística, como por ejemplo el
análisis de regresión.
d. El grupo debe fijarse como objetivo la reducción permanente de la variabili-
dad del proceso. La espina de pez puede facilitar la individualización de los
factores a considerar: capacitar mejor al personal de operación, aumentar la
frecuencia de mantenimiento de los equipos, plantear mayores exigencias a
los proveedores, optimizar los parámetros de puesta a punto del proceso,
etc.

2.b. x = 2.815 R = 0.025


Diagrama de Medias: LCsup = 2.841 Línea Central = 2.815 LCinf = 2.789
Diagrama de Rangos: LCsup = 0.064 Línea Central = 0.025
c. Se advierten señales de inestabilidad en los siguientes controles:
Controles Nº 10 y 11: Puntos muy cerca del LCsup en la carta de medias.
Causa: cambio de materia prima. Recomendación: bajar la Tº del horno de
revenido, para adecuarlo al nuevo material procesado.
Control Nº 14: Un punto por debajo del LCinf en la carta de medias. Causa:
Tº del horno de revenido incorrecta. Recomendación: regresar la Tº al valor
anterior.
Control Nº 18: Un punto por encima del LCsup en la carta de rangos. Causa:
rotura del horno, que provoca un aumento súbito de la dispersión. Recomen-
dación: detener el proceso y reparar el horno.

3. a. Diagrama p: LCsup = 0.0605 Línea Central = 0.0477 LCinf = 0.0349


b. Es evidente que las acciones de mejora han tenido resultados positivos, ya
que desde la mitad de la carta en adelante se nota una clara tendencia decre-
ciente de la proporción de rechazo. La última parte de la carta muestra una
inestabilidad -positiva-: una racha de puntos por debajo de la media.

158
UNIDAD 4

c. Si la mejora lograda en el proceso se puede sustentar en el tiempo, es


recomendable recalcular los límites de control en base a los últimos valores
de la serie, para adecuar la carta al nuevo nivel de calidad obtenido, y revisar
periódicamente su evolución.

159
UNIDAD

4
A CTIVIDADES DE
A UTOEV
UTOEV ALUACION
OEVALUACION
UNIDAD 4

1. Ensaye una definición simple del concepto de calidad.


2. ¿En que consiste el control de calidad?
3. ¿Cómo se realizaba el control históricamente? ¿Cuál es el enfoque actual?
4. ¿Qué diferencias existen entre los conceptos de detección y prevención?
5. ¿Cuál es el objetivo del control total de calidad?
6. ¿Para qué sirven los diagramas de Pareto y la espina de pez?
7. Proponga una definición de característica de calidad.
8. Explique cuál es el sentido de estudiar la variabilidad de una característica de
calidad.
9. Mencione algunos de los objetivos concretos dentro del enfoque moderno de
calidad.
10. ¿Qué es el control estadístico de procesos?
11. ¿Qué significa causas comunes y especiales de variación?
12. Explique en que consiste una carta de control.
13. ¿Cuándo un proceso está estable?
14. ¿Cuál es la base conceptual de las cartas convencionales de Shewart?
15. Indique qué clasificación primaria se puede hacer de las cartas de control.
16. ¿En qué consiste una carta de medias-rangos?
17. ¿Qué verificación hay que realizar antes de implementar una carta convencional
por variables?
18. ¿Con qué criterio se trazan los límites de control? ¿Para que sirven?
19. ¿Cómo se determinan la media general y el rango medio de una carta?
20. ¿Por qué se trabaja generalmente con niveles de significación muy bajos?
21. Explique que es una señal de inestabilidad. Enumere las principales señales.
22. ¿Cómo conviene analizar una carta de medias-rangos?
23. ¿Para que se usan las cartas p?
24. ¿Cuáles son las principales ventajas de las cartas de control?
25. a. En base a los valores de diámetro del resorte tipo "RRR" usados en las
Actividades de Autoevaluación de la Unidad Nº1, confeccione una carta de control
de medias-rangos, para muestras de tamaño 5. Analice la carta resultante, e identi-
fique todas las señales de inestabilidad presentes. Se sabe que al final de las prime-
ras 9 muestras se efectuó un ajuste en la puesta a punto del proceso, para mejorar
los valores de los diámetros producidos.

b. Se asume que recién hacia la mitad de la producción el proceso comienza a


estabilizarse. Efectúe la comprobación de normalidad en base a los últimos 60 da-
tos de la serie, repita el cálculo de los límites de control para esos datos, construya
la carta de media-rango correspondiente y haga la interpretación de la misma.
26. Los resortes tipo "RRR" presentan un problema de deformación durante el

160
UNIDAD 4

proceso de enrollamiento, atribuible a una mala puesta a punto del proceso. Para
verificar las condiciones de la puesta a punto, se toma regularmente una muestra de
los primeros 100 resortes fabricados desde el comienzo de la producción, y se
cuenta el número de resortes con deformaciones. Los resultados registrados duran-
te las últimas 25 jornadas de producción son los siguientes:

4 7 4 9 5 9 5 7 4 3 5 8 5 6 6 10 7 4 3 3 3 0 5 5 3

Con estos datos confeccionar una carta de control p para la proporción de resortes
con deformaciones, e interpretar el diagrama obtenido.

161
DISEÑO DE
EXPERIMENTOS

UNIDAD

5
UNIDAD

5
UNIDAD 5
ORIENTACIÓN DEL
APRENDIZAJE

El grupo de trabajo responsable del lanzamiento del nuevo modelo de resortes de la


firma Campeón S.A. se encuentra verdaderamente comprometido con la filosofía
de la mejora continua, así que está analizando diversas alternativas de interven-
ción sobre el proceso, tendientes a mejorar día a día la calidad de los productos
que fabrican en su línea.

En la Unidad de Control de Calidad vimos que el grupo había detectado que la


principal causa de reclamos por no conformidades estaba relacionada con el diá-
metro de los resortes. Revisando la espina de pez de esta característica, el grupo
decide estudiar con mayor profundidad de qué manera influyen los siguientes facto-
res sobre la variación de los diámetros:

a. El proveedor de materia prima.


b. La temperatura de calentamiento de la varilla a enrollar.

La firma tiene dos proveedores de varillas de acero, así que el Ingeniero de Proce-
so decide tomar una muestra aleatoria de varillas de cada uno, y realizar una prueba
de comparación de medias poblacionales, para comprobar si existen diferencias
significativas en el diámetro obtenido con las dos fuentes de materia prima. Aplican-
do esta técnica se puede determinar el efecto de la materia prima sobre los diáme-
tros producidos.

Para la temperatura de calentamiento el análisis no es tan sencillo. El Ingeniero


opina que habría que calentar las varillas a enrollar a 930°. El Supervisor sugiere en
cambio que esa temperatura es muy elevada, y que convendría trabajar a 890°. Por
su parte, los operadores, en base a su experiencia con resortes parecidos, estiman
que lo más conveniente es setear el horno a 900°.

En definitiva ¿a qué temperatura conviene trabajar? ¿Tiene algún efecto la tempera-


tura de calentamiento de las varillas sobre el diámetro de los resortes?

Para responder a estas preguntas, el grupo decide realizar un experimento proban-


do el horno a diferentes temperaturas, observando cómo influyen las diferentes
condiciones sobre el diámetro de los resortes producidos.

¿Qué valores de temperatura conviene probar? Cuanto mayor sea el número de


condiciones del horno ensayadas, más completa va a ser la información obtenida
del estudio. Por simplicidad el grupo decide probar inicialmente con tres tempera-
turas diferentes, digamos mínima, media y máxima.

164
UNIDAD 5

Finalmente se realiza el experimento, procesando 5 varillas a cada una de las 3


temperaturas fijadas de antemano. Se trabaja con varillas de un solo proveedor,
para lograr condiciones más uniformes del material a ensayar, y no introducir otro
factor de variación ajeno por ahora al estudio.

Se registran los diámetros obtenidos, se calcula la media y el desvío de los datos


para cada una de las condiciones de trabajo, y los resultados se vuelcan en la
siguiente planilla:

REPETICIONES
TEMPERATURA 1 2 3 4 5 Media Desvío
Baja 132.52 132.75 132.46 132.31 132.59 132.53 0.0726
Media 132.70 132.51 132.45 132.57 132.31 132.51 0.0645
Alta 133.02 132.78 133.06 133.20 132.94 133.0 0.0693

¿Existen diferencias importantes entre los diámetros obtenidos para las tres tempe-
raturas de calentamiento? Una forma expeditiva de analizar los resultados obteni-
dos es graficando el diámetro medio obtenido para cada una de las condiciones de
trabajo del horno.

133.5

133.25

133
Diámetro

132.75

132.5

132.25

132
0 1 2 3 4

Tem peratura

165
UNIDAD 5

El diagrama parece sugerir que efectivamente los diámetros son diferentes. ¿Cómo
se puede comprobar en forma objetiva si esto realmente es así? Utilizando la técni-
ca denominada análisis de varianza, que permite comparar varias medias
poblacionales simultáneamente.

Esta técnica también se puede utilizar para comparar varios factores simultánea-
mente – dos o más –. Para ello debemos realizar un experimento donde intervengan
todos los factores de interés.

Por ejemplo, si queremos verificar conjuntamente el efecto de la temperatura de


calentamiento y la fuente de materia prima, y se trabaja con dos proveedores y tres
temperaturas diferentes, deberíamos probar todas las combinaciones posibles de
ambos factores:

Proveedor Piezas fabricadas con


Material 2 a la Tº 1
Temperatura 1 2
1 x
2
3

Además, uno de los integrantes del grupo, muy perspicaz, hace la observación
de que, combinando distinta materia prima a diferentes temperaturas de calenta-
miento, es probable que se produzcan interacciones entre ambos factores que in-
troduzcan efectos adicionales de variación

Veamos una presentación hipotética de los resultados del experimento:

133

132.75
Diámetro

132.5
Pr ove e dor A
Pr ove e dor B

132.25

132
0 1 2 3

Te m pe r atur a

166
UNIDAD 5

En este caso se ve que el efecto del cambio de temperatura es más o menos el


mismo para los dos proveedores, por lo que se obtienen dos rectas aproximada-
mente paralelas. Esto indica que no existe interacción entre los dos factores consi-
derados.

Analicemos ahora otro resultado posible del experimento:

133

132.75
Diámetro

132.5
Proveedor A
Proveedor B
132.25

132
0 1 2 3

Tem peratura

En este caso el efecto de la materia prima depende de la temperatura considerada,


y por eso las rectas no son paralelas, indicando la existencia de una interacción
entre los factores analizados.

La importancia o significación de la interacción puede ser determinada también a


través del análisis de varianza.

Bien, todo parece muy interesante, pero … ¿existe alguna forma sistematizada de
encarar este tipo de estudios? Efectivamente, se puede diseñar un experimento
estadístico, planificando en forma adecuada la experiencia a realizar en función de
los objetivos del estudio.

El diseño de experimentos consiste en una serie de pruebas en las cuales se modi-


fican ciertas variables de entrada, denominadas factores, y se analiza el comporta-
miento de una variable de salida, denominada respuesta. Esta técnica fue aplicada
inicialmente en estudios agronómicos, y posteriormente se fue extendiendo a otras
disciplinas, llegando al campo de las aplicaciones industriales.

167
UNIDAD 5

En el caso de los resortes, la variable de respuesta es el diámetro, y los factores


pueden ser el proveedor de materia prima, la temperatura de calentamiento de las
varillas, la velocidad de trabajo de la máquina enrolladora, la destreza del operador,
etc.

Podemos formular la siguiente relación entre la respuesta y los factores:

y = f(x1, x2, x3, … )

donde y es la variable de respuesta, y las xi son los factores.

El objetivo de un diseño puede ser cualquiera de los siguientes:

• Identificar los factores que afectan significativamente a la respuesta.

• Optimizar el valor de los factores, de manera que la respuesta esté lo más cerca
posible del valor objetivo, y que su dispersión sea mínima.

Los factores a los que hicimos referencia en esta descripción inicial son factores
controlables, ya que sus valores pueden ser fijados a voluntad. Pero existen otros
factores no controlables, cuyos valores son difíciles o imposibles de manejar, y
que también inciden sobre la respuesta. Por ejemplo, en el caso de la fabricación de
resortes, la temperatura ambiente es una variable muy difícil de controlar -ya que
sería muy costoso implementar en la planta un sistema que garantice una temperatu-
ra uniforme-, pero indudablemente mucho frío o calor ambiente producirán un im-
pacto sobre el proceso de fabricación. Una ventaja adicional del diseño es que
permite optimizar el valor de los factores controlables, de modo de minimizar los
efectos de los factores no controlables.

El diseño de experimentos es una herramienta insustituible dentro de un programa


de calidad, ya que permite mejorar tanto el funcionamiento de procesos como el
desarrollo de nuevos productos o procesos.

El uso del diseño de experimentos es fundamental para reducir la variabilidad de un


proceso, optimizar el centrado, mejorar la calidad y reducir los costos. Por lo tanto
es uno de los mejores aliados con que cuenta un equipo de trabajo interesado en el
mejoramiento continuo de procesos.

El empleo del diseño en la etapa de desarrollo de un producto o proceso, permite


comparar diferentes alternativas de diseño, optimizando calidad y costos. Además,
sirve para determinar los parámetros de diseño que permitan que el producto fun-

168
UNIDAD 5

cione correctamente dentro de una amplia gama de condiciones trabajo previstas.


Los productos o procesos que son “insensibles” a los factores de variación se
denominan robustos, y su obtención es una de las aplicaciones estadísticas más en
boga en la actualidad.
Esquema
Tema Conceptual

Diseño de Experimentos

Objetivo
General
Identificar los factores de variación que
afectan la respuesta de un proceso, y
optimizar el funcionamiento del mismo

Objetivos
Específicos

Identificación del Análisis de los


diseño más resultados de un
apropiado experimento

Herramientas
usadas
Diseños a un solo Análisis de varianza
factor, y diseños
multifactoriales

169
UNIDAD 5

El diseño experimental es un tema muy vasto, así que vamos a acotar su tratamiento
a los aspectos fundamentales, organizando el desarrollo del siguiente modo:

Objetivos del
Aprendizaje
Conocer los principios del diseño de experimentos

Distinguir los diferentes tipos de diseño

Efectuar el análisis de varianza

1. Principios del Diseño de Experimentos. Contenidos


1.1 Diseños a un solo factor.
1.2 Diseños factoriales.
2. Análisis de Varianza.
2.1 Tabla de ANOVA.
2.2 Verificación de la idoneidad del modelo.

170
UNIDAD 5

MODALIDAD DE TRABAJO

El desarrollo de esta Unidad se realiza en base al siguiente esquema de trabajo:

ACTIVIDAD MATERIAL CONCEPTOS EJERCITACION


UTILIZADO DESARROLLADOS PROPUESTA
Introducción al Tema 1: GUIA • Objetivos del diseño de Ejemplo introductorio
Principios del Diseño experimentos.
de Experimentos • Etapas del diseño.
• Diseños a un solo factor.
• Diseños factoriales.
Lectura de la bibliografía TEXTO • Diseño de experimentos.
obligatoria
Revisión de conceptos GUIA
desarrollados
Actividades de proceso GUIA Ejercicio práctico
Tema 2: GUIA • Objetivo del método.
Análisis de Varianza • Descomposición de la
variación.
Lectura de la bibliografía TEXTO • Análisis de Varianza.
obligatoria
Tabla de ANOVA GUIA • Construcción e interpretac. Ejemplo práctico
de la tabla de ANOVA.
• Empleo de software
estadístico.
Comprobación de la GUIA • Análisis de los residuos. Ejemplo práctico
Idoneidad del Modelo • Empleo de software
estadístico.
Revisión de conceptos GUIA
desarrollados
Actividades de proceso GUIA Ejercicio práctico
Conclusiones GUIA
Actividades de GUIA Ejercitación
Autoevaluación teórico-práctica

Bibliografía Obligatoria

LEVIN, Richard y RUBIN, David. Estadística para Administradores. Sexta Edición. Editorial
Prentice-Hall. México. 1996.

171
UNIDAD 5

1. PRINCIPIOS DEL DISEÑO DE EXPERIMENTOS

Un experimento consiste en una prueba, o un conjunto de pruebas, tendientes a


obtener información sobre algún hecho particular.

En un diseño experimental de tipo estadístico, se considera un proceso como un


sistema, con una entrada y una salida, y diversos factores o variables de proceso.
El objetivo general de un experimento es comprobar las variaciones que sufre la
variable de salida, o respuesta, frente a cambios introducidos deliberadamente en
los valores de los factores.

Factores Controlables

x1 x2 … xp

Entrada PROCESO Salida

z1 z2 … zq

Factores No Controlables

Los objetivos particulares del diseño son los siguientes:

• Determinar qué factores tienen mayor influencia sobre la respuesta.

• Determinar los mejores valores para los factores controlables, de modo


que la respuesta esté lo más cerca posible al valor nominal u objetivo.

• Determinar los mejores valores para los factores controlables, de manera


que la variación de la respuesta sea la menor posible.

172
UNIDAD 5

• Determinar los mejores valores para los factores controlables, de modo


que se minimicen los efectos no deseados de los factores no controlables.

Al encarar un diseño experimental, es necesario conocer o investigar a fondo el


proceso que va a ser objeto de análisis, formular con claridad los objetivos especí-
ficos del estudio, identificar la variable de respuesta y las variables de proceso.

Los factores son las fuentes de variación que actúan sobre el sistema, cuyos valo-
res se cambian en forma deliberada para observar su impacto sobre la respuesta.
Los distintos valores que se asignan a un factor se denominan niveles del factor. A
su vez, en un diseño se puede comprobar el efecto de uno o varios factores,
dando lugar a experimentos unifactoriales o multifactoriales. Estos últimos tam-
bién se denominan simplemente diseños factoriales.

Las unidades experimentales son objetos de existencia real o creados


artificialmente a los fines del estudio, y que serán sometidos a experimentación.

Se denomina tratamiento a una combinación particular de factores a los que se


somete a una unidad experimental.

La variable dependiente, o respuesta, es la medición obtenida en cada unidad


experimental después de aplicar un tratamiento particular.

Para aumentar la precisión del estudio, generalmente se aplica cada tratamiento


particular a varias unidades experimentales, es decir que hay un cierto número de
repeticiones o réplicas de cada tratamiento. La respuesta casi siempre varía en
cada repetición, y esa variación es conocida como error experimental, que es el
resultado de diversas fuentes de error: error de planteo; error de observación o
medición; variación en las unidades experimentales; variación debida a factores no
contemplados en el modelo; etc.

Cuando se trabaja con diseños multifactoriales, se pueden producir interacciones


entre los factores, que es un efecto adicional sobre la variable de respuesta debido
a la combinación de dos o más factores.

En el ejemplo del grupo responsable del lanzamiento del nuevo modelo de resortes,
el sistema en estudio está representado por el proceso de fabricación de los resor-
tes. La variable de respuesta es el diámetro de los resortes, y los factores conside-
rados son el proveedor de materia prima y la temperatura del horno de calenta-
miento. El factor “proveedor” se trabaja a dos niveles: Proveedor A y Proveedor

173
UNIDAD 5

B; la “temperatura” se considera a tres niveles: alta, media y baja. Las unidades


experimentales son las varillas. Un tratamiento posible es el siguiente: varilla del
“Proveedor A” calentada a temperatura “media”.

Un principio fundamental en el diseño de experimentos es la aleatorización, que


significa asignar por sorteo las unidades experimentales a cada uno de los trata-
mientos. Esto es importante para garantizar lo más posible la independencia entre la
respuesta y la unidad experimental considerada.

Etapas de un diseño de experimentos

1. Análisis del problema. Incluye el estudio pormenorizado del sistema o


proceso considerado, la recopilación de todos los antecedentes disponibles,
la definición de los objetivos específicos y alcances del estudio, la identifica-
ción de las variables del sistema, y el relevamiento de los recursos disponi-
bles.

2. Diseño propiamente dicho del experimento. En esta etapa se realiza la


planificación del experimento, se determina la forma de medición de la varia-
ble de respuesta, se seleccionan los factores a incluir en el diseño y los niveles
de cada uno, se elige el diseño experimental apropiado, se establecen las
pautas generales para realizar el experimento y los niveles de responsabili-
dad, se seleccionan convenientemente las unidades experimentales a utilizar y
se asignan los tratamientos al azar.

3. Ejecución del experimento. Consiste en la realización de las pruebas,


contemplando la ejecución de todas las tareas previstas durante su planifica-
ción, cuidando al máximo todos los detalles relacionados con el experimento,
y registrando minuciosamente los resultados así como todas las novedades
ocurridas durante el experimento.

4. Análisis e interpretación de los resultados. Se refiere al tratamiento de la


información relevada durante el experimento, incluyendo el análisis estadísti-
co de los datos, su presentación en forma apropiada, y la interpretación de
los resultados obtenidos, contemplando las conclusiones y recomendaciones
que surjan del análisis.

Una de las etapas claves dentro de este proceso, es la selección del diseño apro-
piado. Por un lado, hay que asegurar que el modelo no excluya ningún factor que
sea de importancia para explicar el comportamiento de la variable de respuesta.

174
UNIDAD 5

Por otro lado, hay que tratar de elegir el modelo más simple posible, acorde a los
objetivos del estudio, para evitar complicaciones de cálculo innecesarias. El mejor
modelo no es el más complejo, sino el que aporta mayor información sobre el
comportamiento de la variable dependiente.

Vamos a revisar las principales características de los diferentes tipos de diseño.

1.1 Diseños a un solo factor

Este es el caso más simple, en que se considera un solo factor, a dos o más niveles.
El modelo general es el siguiente:

yij = μ + αi + εij con i = 1, 2, … , k; j = 1, 2, … , n

siendo k = número de tratamientos


n = número de observaciones del i-ésimo tratamiento
y = variable dependiente, o respuesta
μ = media general para todos los tratamientos
αi = efecto del i-ésimo tratamiento
εij = error aleatorio

Uno de los supuestos básicos del modelo es que los errores εij son variables
aleatorias, independientes entre sí, normalmente distribuidas, con media cero y
varianza σ2 constante para todos los niveles del factor.

Otra suposición importante es la de aleatoriedad, que significa que las unidades


experimentales son asignadas al azar a cada uno de los tratamientos, para evitar que
existan relaciones entre las unidades y los tratamientos, que puedan incorporar al-
guna tendencia en los resultados.

Bajo estas condiciones, el método consiste en poner bajo prueba las siguientes
hipótesis:

H0: α1 = α2 = … = αk = 0
H1: al menos un αi es distinto de cero

Si no se rechaza H0, se estará comprobando que ninguno de los tratamientos pro-


duce un efecto significativo sobre la respuesta.

175
UNIDAD 5

Ahora bien, cada observación individual se puede escribir como la suma de la me-
dia propia de cada tratamiento, más el error aleatorio:

yij = μ i + εij donde μ i es la media del i-ésimo tratamiento.

En estas condiciones, las hipótesis anteriores se pueden expresar del siguiente modo:

H0: μ1 = μ2 = … = μk -todos los tratamientos tienen la misma media-


H1: al menos un μi es distinto -al menos un tratamiento tiene una media
significativamente distinta-

Si no se rechaza H0, todos los tratamientos tienen la media común μ, y en términos


prácticos significa que ninguno de los tratamientos produce una variación significa-
tiva en la respuesta del proceso. Este resultado se puede expresar gráficamente del
siguiente modo:

Si en cambio se rechaza H0, significa que hay uno ó más tratamientos que producen
un efecto significativo, y por ende que las medias no son todas iguales. Esto se
puede esquematizar de la siguiente manera:

176
UNIDAD 5

El procedimiento utilizado para formalizar esta prueba, es el denominado Análisis


de Varianza (ANOVA), tema que se analiza en el punto siguiente.

Ejemplo: Volvamos al experimento planteado en la Introducción, que tiene como


objetivo verificar la influencia del calentamiento de las varillas sobre el diámetro de
los resortes. Utilizando los mismos valores mostrados en la planilla de resultados
correspondiente, el grupo decide realizar un análisis exploratorio sencillo.

177
UNIDAD 5

Se representan en un gráfico los diagramas de caja correspondientes a los diáme-


tros obtenidos para cada uno de los niveles del factor:

133.4

133.2

133.0
DIAMETRO

132.8

132.6

132.4

132.2
N= 5 5 5
1.00 2.00 3.00

NIVELES

Del análisis de este diagrama se pueden extraer las siguientes conclusiones:

• Las distribuciones son bastante simétricas, y la dispersión de los datos es


similar para los tres niveles del factor.

• Los niveles 1 y 2 del factor producen una respuesta muy parecida, mien-
tras que el nivel 3 produce resultados significativamente mayores al resto.

• Recordando que las especificaciones de ingeniería establecían que el diá-


metro de los resortes debía estar entre los 132 y 134 mm., con el nominal
en 133 mm., se deduce que conviene setear el horno de calentamiento a
temperatura “alta”, que es el nivel del factor que permite obtener un diáme-
tro medio más próximo al valor objetivo.

178
UNIDAD 5

1.2 Diseños factoriales

En este caso se consideran dos o más factores, a diferentes niveles, y se exploran


todas las combinaciones posibles de los niveles de los factores en cada repetición
del experimento.

Si bien no vamos a desarrollar el análisis completo de este tipo de experimentos,


veamos a título informativo el modelo general para el caso de dos factores:

yijk = μ + αi + βj + (αβ)ij + εijk con i = 1, 2, … , a


j = 1, 2, … , b
k = 1, 2, … , n

siendo a = número de niveles del primer factor


b = número de niveles del segundo factor
n = número de repeticiones del experimento para cada tratamiento
αi = efecto del i-ésimo nivel del primer factor
βj = efecto del j-ésimo nivel del segundo factor
(αβ)ij = efecto de interacción entre ambos factores, en los niveles i y j
respectivamente

El resto de los términos tienen el mismo significado que para el modelo a un solo
factor. Los supuestos básicos del modelo son también los mismos que en el caso
anterior.

Como existen a niveles del primer factor, b niveles del segundo, y n repeticiones de
cada tratamiento, en total hay axbxn observaciones.

En este caso interesa poner bajo prueba las siguientes hipótesis:

Factor 1
H0: α1 = α2 = … = αa = 0
H1: al menos un αi es distinto de cero

Factor 2
H0: β1 = β2 = … = βb = 0
H1: al menos un βj es distinto de cero

Interacciones
H0: (αβ)ij = 0 para todo i, j
H1: al menos una (αβ)ij es distinta de cero

179
UNIDAD 5

También en este caso el procedimiento que se utiliza para realizar las pruebas es el
Análisis de la Varianza -ANOVA a dos factores-.

Bien, en esta introducción al Diseño de Experimentos se han presentado los princi-


pios básicos del método, sus objetivos, la terminología usada habitualmente, los
principales tipos de diseño, y sus aplicaciones.

Para completar esta visión inicial del tema, puede volver al Texto, y buscar el si-
guiente Capítulo:

DISTRIBUCIONES DE MUESTREO

Lea el siguiente tema:

• Diseño de experimentos

En este apartado se desarrollan conceptos básicos relacionados con el diseño, y se


muestran algunas de sus aplicaciones a través de ejemplos muy simples.


REVISION DE CONCEPTOS DESARROLLADOS

• diseño de experimentos Procedimiento usado para verificar el


comportamiento de una variable depen-
diente, frente a cambios introducidos
deliberadamente en una o varias varia-
bles independientes.

• respuesta Variable dependiente, o salida del sistema.

• factores Variables independientes, o variables de


proceso.

• factores controlables Variables de proceso cuyos valores se


pueden fijar a voluntad en condiciones
normales.

• factores no controlables Variables de proceso cuyos valores, en

180
UNIDAD 5

condiciones reales de funcionamiento del


sistema, no son manejables.

• niveles del factor Valores que toma un determinado factor.

• tratamientos Conjunto particular de condiciones experi-


mentales a las que se somete una unidad
experimental.

• unidad experimental Entidad de existencia física o no, a la cual


se aplica un solo tratamiento.

• diseños unifactoriales Experimentos a un solo factor.

• diseños multifactoriales Experimentos a dos ó más factores.

• interacciones Efecto adicional de variación debido a la


combinación de dos ó más factores.

• error experimental Diferencias entre las respuestas obtenidas


en unidades experimentales sometidas al
mismo tratamiento.

• aleatorización Asignación al azar de las unidades experi-


mentales a cada uno de los tratamientos.

• análisis de varianza Procedimiento usado para comprobar la


igualdad de varias medias poblacionales.

• proceso robusto Proceso poco sensible a los factores de


variación.

181
UNIDAD 5

RECOMENDACIONES PRACTICAS

• Comenzar el análisis efectuando una descripción clara del problema, y formu-


lando los objetivos del estudio. Recopilar toda la información disponible sobre
el tema. Definir claramente el sistema, los factores y la respuesta a medir.

• Es fundamental contemplar en el análisis todos los factores que puedan afec-


tar significativamente la respuesta, pero no es conveniente incluir factores
redundantes o poco relevantes. Los niveles de los factores se deben fijar funda-
mentalmente en base al conocimiento que se tenga del proceso en estudio; en
estudios exploratorios, conviene trabajar con pocos niveles, generalmente no
más de dos.

• Seleccionar el diseño apropiado para el proceso analizado, tratando de tra-


bajar con el modelo más simple posible.

• Fijar el número de repeticiones de cada tratamiento en función de los objeti-


vos del estudio, de la precisión deseada en el análisis, y de los medios disponi-
bles.

• Es importante recordar que las unidades experimentales deben ser elegidas


tratando de lograr la mayor uniformidad posible, y que su asignación a los trata-
mientos se debe efectuar siempre al azar -no confiarse en la experiencia o en la
intuición-.

• Durante la fase de ejecución del experimento, es muy importante poner la


mayor atención posible para que las condiciones del ensayo se mantengan esta-
bles. De no ser así, registrar adecuadamente todas las novedades, para poder
decidir con posterioridad la validez o no del experimento.

• Un detalle muy importante consiste en clasificar o identificar conveniente-


mente las unidades experimentales, especialmente cuando las mediciones no se
efectúan inmediatamente después del experimento. Poner especial cuidado al
realizar las mediciones, tratando de evitar errores u omisiones que puedan inva-
lidar -o imposibilitar- el análisis.

• El análisis de los resultados debe hacerse con métodos estadísticos, para


garantizar la objetividad de las conclusiones.

• No perder de vista el objetivo final del estudio, y tratar siempre de elaborar


conclusiones eminentemente prácticas, que conduzcan a acciones concretas.

182
UNIDAD 5

1
Se estudian cuatro circuitos digitales diferentes de computadora, a fin de
comparar el nivel de ruido presente. Los resultados obtenidos fueron los
siguientes:

Circuito Ruido Observado

1 23 20 15 30 8

2 80 61 73 56 80

3 47 26 25 35 50

4 95 46 83 78 97

Fuente: “Diseño y Análisis de Experimentos” D.Montgomery

a. Utilizando alguna herramienta gráfica, compare el nivel de ruido para los


cuatro circuitos. ¿El nivel de ruido es el mismo en todos los casos?

b.¿Cuál circuito conviene seleccionar?

Confronte con la Solución Nº1

2. ANALISIS DE VARIANZA

Vamos a desarrollar el procedimiento de análisis de varianza, para el caso de expe-


rimentos a un solo factor.

Vale la pena recordar el modelo lineal correspondiente a este caso:

yij = μ + αi + εij con i = 1, 2, … , k; j = 1, 2, … , n

donde εij~N(0, σ2) es la componente aleatoria que refleja los errores de experi-
mentación.

En el punto anterior vimos que cuando tenemos un solo factor considerado a k

183
UNIDAD 5

niveles diferentes, el objetivo del análisis es probar la igualdad entre las medias de
los k tratamientos:

H0: μ1 = μ2 = … = μk
H1: al menos un μi es distinto

Esta comprobación se realiza en forma indirecta, analizando las fuentes de variación


presentes en el experimento. Vamos a descomponer la variabilidad total de los
datos en dos componentes: una variación “entre” tratamientos, que mide las
diferencias entre los tratamientos, y una variación “dentro” de cada tratamien-
to, que refleja las diferencias dentro de cada tratamiento debidas a los errores
experimentales.

En esta introducción al tema vamos a utilizar formulaciones simbólicas, fáciles de


entender. Los cálculos en detalle los va a ver posteriormente en el Texto. Vamos a
expresar las fuentes de variación en términos de sumas de cuadrados:

STotal = STrat + SError

donde
STotal =Suma de cuadrados total, que contempla todas las fuentes de variación
STrat =Suma de cuadrados entre tratamientos, que considera la variación
introducida por los tratamientos
SError =Suma de cuadrados dentro de cada tratamiento, que contempla la varia-
ción debida al error experimental

De esta expresión se deduce, mediante algunos pasos algebraicos intermedios, que


existen dos estimaciones posibles de la varianza σ2: una basada en la variabilidad
interna o propia de cada tratamiento, y otra considerando la variabilidad entre los
distintos tratamientos. Las cantidades usadas como estimadores se denominan cua-
drados medios:

CMTrat = STrat / (k-1)

CM Error = SError / k(n-1)

Para probar la hipótesis nula de que las medias de los k tratamientos son iguales, se
comparan estos cuadrados medios. Si no hay diferencias entre las medias de los
tratamientos, las dos estimaciones de σ2 deben ser parecidas. En cambio, si ambas

184
UNIDAD 5

estimaciones son muy distintas, se atribuye esa diferencia al hecho de que la


variación entre las medias de los tratamientos es muy elevada, y por ende se
deduce que las medias de los tratamientos son significativamente diferentes.

Intuitivamente se puede explicar esto del siguiente modo: el “piso” de variación


está dado por el error experimental, al cual le podemos “agregar” otros efectos
-como el que introducen los tratamientos-. Por lo tanto, si la variación entre
muestras -o entre tratamientos- es parecida a la variación dentro de las mues-
tras -debida al error experimental-, significa que la variación introducida por los
tratamientos no es mayor que la variación aleatoria debida al error de experi-
mentación, lo que indica que no existe un efecto “agregado” por los tratamien-
tos.

Una forma de comparar las dos estimaciones de σ2 es a través de la siguiente


cantidad:

F = CMTrat / CM Error

Si las dos estimaciones son parecidas, el cociente va a estar cercano a uno, y en


ese caso se estaría comprobando que las medias de los k tratamientos son
iguales.

Si el cociente es muy distinto de uno, significa que las dos estimaciones de la


varianza son diferentes, y en ese caso tenderíamos a pensar que las medias de
los tratamientos no son iguales.

¿Qué valores puede tomar la cantidad F? Recordando que en el denominador


tenemos el “piso” de variación dado por la componente aleatoria del error, si
existen diferencias significativas entre los tratamientos el numerador va a ser
más grande, y por lo tanto F va a ser mayor que uno. Entonces F puede ser
mayor o igual a uno.

Se demuestra que la cantidad F es un estadístico con distribución F, con (k-1)


grados de libertad en el numerador y k(n-1) g.l. en el denominador. Para deci-
dir si se rechaza o no la hipótesis nula, se compara la estimación del estadístico
F efectuada en base a los datos, con el valor crítico obtenido de tabla para el
nivel de significación elegido para la prueba y los grados de libertad correspon-
dientes.

Completada esta introducción, ahora puede volver al Texto para ver el tema
con mayor detalle, particularmente lo que se refiere al cálculo de las estimacio-

185
UNIDAD 5

nes de varianza a las que hemos hecho referencia, el uso del estadístico F y de la
tabla de la distribución F, la ejecución del procedimiento, y la interpretación de los
resultados.

Busque el siguiente Capítulo:

JI-CUADRADO Y ANALISIS DE VARIANZA

Dentro de ese Capítulo ubique el siguiente tema:

• Análisis de varianza

Estudie el tema, siga con atención los ejemplos planteados, y deténgase el tiempo
necesario para entender con claridad el origen y el significado de las expresiones
utilizadas.


2.1. Tabla de anova

Después de haber visto con mayor profundidad en el Texto el análisis de varianza,


es oportuno dedicar algunas líneas al tema de la construcción e interpretación de la
Tabla de ANOVA, que es el nudo central del método, ya que allí se resumen todos
los cálculos.

La Tabla que aparece en todos los Textos y salidas de programas estadísticos, para
el caso de un solo factor tiene la siguiente estructura:

Las fórmulas de cálculo originales, así como las “fórmulas de trabajo” simplificadas
están ampliamente desarrolladas en la literatura especializada. Su aplicación manual
es bastante laboriosa, ya que hay que manipular muchos datos y operaciones. Como
los cálculos de ANOVA están disponibles en cualquier software estadístico, vamos

186
UNIDAD 5

a recurrir al auxilio de estos programas para confeccionar la Tabla correspondiente,


y vamos a concentrarnos en la interpretación de resultados.

Ejemplo: Vamos a retomar el ejemplo presentado en el punto anterior, sobre el


experimento destinado a verificar el efecto de la temperatura de calentamiento so-
bre el diámetro de los resortes. Los datos y las condiciones generales del experi-
mento son las mismas que se plantearon oportunamente. En este caso vamos a
desarrollar en forma detallada la fase de análisis estadístico de los resultados.

Recordemos en primer lugar las hipótesis puestas bajo prueba:

H0: μ1 = μ2 = μ3 Las medias de los tres tratamientos son iguales


H1: las medias no son iguales

Cargamos los datos en la computadora, y los procesamos mediante un programa


estadístico. La Tabla de ANOVA queda de la siguiente manera:
One-Way Analysis of Variance

Source of variation Sum of Squares d.f. Mean square F-ratio Sig. level

Between groups .7784400 2 .3892200 16.411 .0004


Within groups .2846000 12 .0237167

Total 1.0630400 14

De entrada vemos que el cuadrado medio debido a los tratamientos -“entre”- es


muy superior al cuadrado medio del error -“dentro”-, lo que se traduce en un
cociente F mucho mayor que uno.

Fijamos el nivel de significación de la prueba, digamos en el 5 %. Ahora podemos


comparar el cociente F obtenido, con el valor crítico de la tabla F que corresponde
a ese nivel de significación, y para 2 grados de libertad en el numerador y 12 en el
denominador. Sin embargo, podemos tomar un atajo -que Usted ya usó en Unida-
des anteriores-, consistente en comparar el valor prob, o probabilidad de que el F

187
UNIDAD 5

estimado sea superado, con el nivel de significación de la prueba.

f(F)

Fcrítico Fobservado

Como en este caso el valor prob es mucho menor que el nivel de significación, el
estadístico F cae claramente en zona de rechazo de la hipótesis nula. Por lo tanto se
rechaza H0, lo que equivale a decir que las medias de los tratamientos no son todas
iguales.

Veamos la tabla que resume las principales propiedades de cada tratamiento:

Table of means

Stnd. Error 95 Percent Confidence


Level Count Average (internal) intervals for mean
1 5 132.52600 .0725672 132.37590 132.67610
2 5 132.50800 .0645291 132.35790 132.65810
3 5 133.00000 .0692820 132.84990 133.15010
Total 15 132.67800 .0397632 132.59134 132.76466

Como se puede apreciar, el desvío estándar es parecido en los tres tratamientos,


lo que parece confirmar el supuesto de varianza constante que se plantea en el
modelo general. Por su parte, las medias son parecidas para los tratamientos 1 y 2,
y bastante mayor para el tratamiento 3, lo que resulta consistente con el resultado
de la prueba.

188
UNIDAD 5

Obviamente las conclusiones a partir de estos resultados coinciden con el análisis


visual de los diagramas de caja realizado en el punto anterior, en donde aparecía de
manera muy evidente que la dispersión era similar en los tres tratamientos, y que
una de las medias era notablemente distinta al resto.

Vamos a incluir ahora otro gráfico parecido, en este caso dibujando los intervalos
de confianza para las medias de cada uno de los tratamientos, cuyos valores apare-
cen en la tabla anterior:

Nuevamente se confirma el resultado: los intervalos para los tratamientos 1 y 2 se


“solapan”, evidenciando que no hay diferencias significativas entre sus medias, mien-
tras que el intervalo para la media del tratamiento 3 se encuentra completamente
por encima de los anteriores, indicando que para este nivel del factor la respuesta
cambia significativamente.

189
UNIDAD 5

2.2. Verificación de la idoneidad del modelo

Si bien en este ejemplo concreto resulta evidente que se cumplen todos los supues-
tos básicos del modelo, es conveniente incluir su verificación como parte del análi-
sis, para comprobar que el modelo usado sea apropiado y evitar interpretaciones
erróneas sobre el problema analizado.

Esta comprobación se hace a través el análisis de los residuos u errores, que


como vimos al principio deben ser independientes, normalmente distribuidos, con
media cero y varianza constante. Si estas suposiciones se cumplen en la práctica, el
procedimiento de análisis de varianza constituye una prueba concluyente para veri-
ficar la igualdad de medias entre tratamientos. En caso contrario, las conclusiones a
partir del análisis de varianza pueden no resultar válidas.

Los residuos se pueden estimar de la siguiente manera:

eij = yij - yij

donde yij es el valor observado y yij el valor estimado por el modelo. Fíjese que
para poder hacer estos cálculos es necesario ajustar el modelo -estimar sus
parámetros-, operación que hace automáticamente el software estadístico por el
método de mínimos cuadrados, cosa que sería muy laboriosa de realizar a mano.

Para nuestro ejemplo, los residuos son los siguientes:


——————————————————————————————
( 1) -6E-3 ( 2) 0.224 ( 3) -0.066 ( 4) -0.216 ( 5) 0.064
( 6) 0.192 ( 7) 2E-3 ( 8) -0.058 ( 9) 0.062 (10) -0.198
(11) 0.02 (12) -0.22 (13) 0.06 (14) 0.2 (15) -0.06
——————————————————————————————

Vamos a efectuar el control de Normalidad de los residuos, utilizando la prueba


de Kolmogorov-Smirnov. Los resultados del programa indican lo siguiente:

——————————————————————————————
Estimated overall statistic DN = 0.126759
Approximate significance level = 0.969449
——————————————————————————————-

190
UNIDAD 5

Como el valor prob es mucho mayor que cualquiera de los niveles de significación
usados habitualmente -1, 5 ó 10 %-, significa que el estadístico de prueba cae en
zona de aceptación, y por lo tanto no se rechaza la hipótesis de que los datos
provienen de una población Normal.

A continuación vamos a ver la gráfica de los residuos dispuestos en orden secuencial.

.3
RESIDUOS

.2

.1

.0

-.1

-.2

-.3
0 2 4 6 8 10 12 14 16

ORDEN

Este diagrama permite obtener algunas conclusiones importantes: en primer lugar, la


distribución de los valores es totalmente aleatoria, y no se visualizan “patrones”
extraños; este comportamiento confirma que los errores son independientes.
Cualquier patrón sospechoso, que indique correlación entre los valores, sería indi-
cio de que la suposición de independencia ha sido violada. Si quedara alguna duda
al respecto, se puede calcular la FAC de la serie. En segundo lugar, se ve que la
dispersión de los residuos no cambia con la secuencia, lo que indica que la varianza
del error es constante a lo largo del experimento. Finalmente se puede apreciar a
simple vista que los residuos tienen aproximadamente media cero, es decir que se
cumple otro de los supuestos del modelo.

Otra forma de verificar el comportamiento de la varianza, es dibujando los residuos


contra los niveles del factor:

191
UNIDAD 5

.3
RESIDUOS

.2

.1

.0

-.1

-.2

-.3
.5 1.0 1.5 2.0 2.5 3.0 3.5

NIVELES DEL FACTOR

En este diagrama se puede comprobar que la dispersión es similar para los tres
niveles del factor. Otra forma de verificar la igualdad de varianzas es mediante el
empleo de pruebas estadísticas del siguiente tipo:

H0: σ12 = σ22 = σ32


H1: al menos un σi2 es distinto

Veamos los resultados de dos de tales pruebas que incluye un programa estadístico
convencional:

Tests for Homogeneity of Variances


————————————————————————————
Cochran’s C test: 0.370063 P = 1
Bartlett’s test: 1.00463 P = 0.975365
————————————————————————————

Nuevamente analizando los valores prob de las dos pruebas, vemos que en ambos
casos son mucho mayores que cualquiera de los niveles de significación convencio-
nales -1, 5 ó 10 %-, y por lo tanto se concluye que el estadístico de prueba cae en
zona de aceptación de la hipótesis nula, esto es, se comprueba la igualdad de
varianzas para los distintos tratamientos.

192
UNIDAD 5

Resumiendo: hemos verificado que se cumplen todos los supuestos básicos del
modelo, y por lo tanto podemos aceptar como válidas las conclusiones del análisis
de varianza.

REVISION DE CONCEPTOS DESARROLLADOS

• variación total Variabilidad total de la variable de res-


puesta registrada durante un experimen-
to estadístico.

• variación “entre” Variabilidad debida a efecto de los dife-


rentes tratamientos aplicados a las unida-
des experimentales.

• variación “dentro” Variabilidad dentro de cada muestra o


tratamiento, debida a los errores experi-
mentales.

• sumas de cuadrados Medidas de variabilidad “entre”, “dentro”


y “total”.

• cuadrados medios Cantidades que surgen de dividir las su-


mas de cuadrados por los correspondien-
tes grados de libertad.

• tabla de ANOVA Tabla donde se resumen todos los cálcu-


los necesarios para realizar el análisis de
varianza.

• análisis de los residuos Análisis estadístico de los errores, que


sirve para comprobar la validez del mo-
delo empleado.

• supuestos básicos Suposiciones bajo las cuales fue deducido


el modelo particular correspondiente al
diseño empleado.

193
UNIDAD 5

RECOMENDACIONES PRACTICAS

• Cuanto mayor sea el tamaño de muestra, es decir el número de repeticio-


nes del experimento para cada tratamiento, mayor validez van a tener las
inferencias que se hagan respecto de las poblaciones consideradas. Existen
métodos analíticos para seleccionar el tamaño muestral apropiado, utilizando
curvas de operación característica.

• Cuando el análisis de varianza detecta diferencias significativas entre las


medias de los tratamientos, el siguiente paso es determinar rangos de medias
estadísticamente similares. Si bien dentro de esta Unidad hemos visto sola-
mente como realizar ese análisis en forma gráfica, existen métodos analíticos
para resolver el problema, que se pueden consultar en la literatura especiali-
zada en el tema.

• Es imprescindible efectuar rutinariamente el análisis de los residuos, consi-


derándolo una parte inseparable del análisis de varianza, para asegurarse que
las conclusiones del mismo sean válidas.

• Es lícito emplear gráficos, pruebas analíticas, y cualquier otra herramienta


disponible que sea de utilidad para verificar cada uno de los supuestos del
modelo. Los gráficos son herramientas sencillas pero de suma utilidad, ya
que ponen rápidamente en evidencia las inconsistencias que puedan existir.

• En casos límites, cuando el cociente F dé muy cercano a uno, o cuando se


haya violado alguno de los supuestos del modelo, revisar una y otra vez los
resultados hasta estar seguro de las conclusiones. Si es posible repetir el
experimento, utilizando un mayor número de unidades experimentales, y po-
niendo especial esmero en su ejecución para tratar de acotar al máximo los
errores de experimentación.

194
UNIDAD 5

2
Vamos a retomar el ejemplo de los cuatro circuitos digitales presentado en la
Actividad de Proceso Nº1. Recordamos que los niveles de ruido para cada
circuito eran:

Circuito Ruido Observado

1 23 20 15 30 8

2 80 61 73 56 80

3 47 26 25 35 50

4 95 46 83 78 97

Fuente: “Diseño y Análisis de Experimentos” D.Montgomery

a. Utilizando un programa estadístico, elabore la tabla de ANOVA.

b.Interprete los resultados del ANOVA. ¿El nivel de ruido es el mismo en


todos los casos?¿Cuál circuito conviene seleccionar? ¿Coinciden las conclu-
siones de este análisis con las del análisis gráfico efectuado en la Actividad
Nº1?

c.Empleando las facilidades que brindan los programas estadísticos, realice


el análisis completo de los residuos del modelo. Especifique si se viola alguno
de los supuestos.

Confronte con la Solución Nº 2

195
UNIDAD 5

Conclusiones

En esta Unidad Usted ha adquirido los conocimientos básicos necesarios como


para iniciarse en el uso del diseño experimental, una de las herramientas estadísticas
más potentes, que tiene un amplio campo de aplicaciones, desde investigación cien-
tífica hasta usos eminentemente prácticos.

Se usa en todas las disciplinas, pero particularmente en el campo técnico es un


método ineludible para mejorar el rendimiento de un proceso productivo, desarro-
llar nuevos procesos, o diseñar nuevos productos, economizando tiempos y costos,
y permitiendo alcanzar mejoras significativas en la calidad.

Un aspecto interesante de este tema es que hemos utilizado prácticamente todas las
herramientas estadísticas desarrolladas hasta aquí, desde la parte descriptiva, pa-
sando por los conceptos de probabilidad y distribuciones de probabilidad, hasta
llegar por fin a lo relativo a la inferencia estadística.

Los principales aspectos abordados fueron los siguientes:

• Objetivos y aplicaciones del diseño de experimentos.


• Terminología usada en el tema.
• Etapas de un diseño.
• Modelo general para uno y dos factores.
• Análisis de varianza para un factor.
• Descomposición de la variación total.
• Confección de la tabla de ANOVA.
• Interpretación de resultados.
• Verificación de la idoneidad del modelo.
• Interpretación de salidas de computadora.

El diseño de experimentos estadísticos es un tema muy vasto, abarcando mucho


más de lo que se ve en esta Unidad. De todas maneras, Usted ya está en condicio-
nes de abordar experimentos simples, y tiene la base necesaria como para profun-
dizar sobre temas relacionados en la literatura especializada.

Seguramente en algún momento de su actividad profesional va a tener oportunidad


de hacer uso de esta herramienta, y de comprobar personalmente sus beneficios.
¡Manos a la obra!

196
UNIDAD

SOLUCIONES A LAS
ACTIVIDADES DE PROCESO 5 UNIDAD 5

1.a. Comparando los diagramas de caja, o los intervalos de confianza calculados


para cada uno de los cuatro circuitos, es evidente que el nivel de ruido no es el
mismo en todos.

b. Razonablemente el mejor circuito es el Nº 1, que es el que produce el menor


nivel de ruido, y de paso es el que presenta la menor dispersión de dicha variable

2.a. Tabla de análisis de varianza:


—————————————————————————————
Source of variation Sum of Squares d.f. Mean square F-ratio Sig. level
—————————————————————————————
Between groups 12042.000 3 4014.0000 21.546 .0000
Within groups 2980.800 16 186.3000
—————————————————————————————
Total 15022.800 19
————————————————————————————

b. En base al valor del estadístico F, y a su nivel de probabilidad, se deduce que


se rechaza la hipótesis de igualdad de medias para los distintos niveles del fac-
tor. Conclusión: los cuatro circuitos no producen el mismo nivel de ruido.

Tabla de Medias:
—————————————————————————————
95 Percent Confidence
Level Count Average Stnd. Error intervals for mean
—————————————————————————————
1 5 19.200000 3.7067506 6.256683 32.143317
2 5 70.000000 4.9295030 57.056683 82.943317
3 5 36.600000 5.1826634 23.656683 49.543317
4 5 79.800000 9.1727858 66.856683 92.743317
—————————————————————————————

Se ve que el valor medio más bajo de nivel de ruido corresponde al circuito Nº


1, y por lo tanto conviene seleccionar ese circuito. Esta conclusión coincide con
el análisis exploratorio realizado en base a los gráficos en la actividad anterior.

c. En base a los resultados gráficos y analíticos que proporciona el programa


estadístico, se puede concluir de que no se viola ninguno de los supuestos del
modelo. Existe una sola duda, planteada por la excesiva dispersión en el circui-
to Nº 4. Analizando los datos, se ve que el motivo de esto es un dato extremo,

197
UNIDAD 5

así que habría que verificar su origen. De odas maneras, los tests analíticos
confirman la igualdad de varianzas para todos los niveles del factor. Por últi-
mo, hay que tener en cuenta que se ha trabajado con muy pocas repeticiones
de cada tratamiento, cuestión que influye sobre los resultados obtenidos.

198
UNIDAD

ACTIVIDADES DE
AUTOEVALUACION 5 UNIDAD 5

1. Defina el concepto de diseño de experimentos estadísticos.

2. Mencione algunas de las aplicaciones del diseño.

3. ¿A qué se denominan factores y respuesta?

4. Enumere los objetivos específicos del diseño de experimentos.

5. ¿Cuáles son las principales fases de un diseño?

6. ¿Qué tipos de diseño conoce?

7. ¿A qué se denomina tratamiento?

8. ¿Qué es el error experimental?

9. ¿Qué significa aleatorizar? ¿Por qué es importante?

10. ¿Cuál es la base conceptual del método?

11. ¿Cómo se aplica el método?

12. Explique en qué consiste del análisis de varianza.

13. ¿Los resultados del análisis de varianza son concluyentes?

14. ¿Qué es el análisis de los residuos?

15. ¿Qué tamaño de muestra conviene utilizar?

16. El Gerente de Recursos Humanos de una empresa desea evaluar la efectividad


de cuatro Programas de Entrenamiento dictados a empleados nuevos. Un grupo de
32 empleados recientemente contratados han sido asignados por sorteo a cada uno
de los 4 programas. Al final del período de entrenamiento se tomó una evaluación a
los asistentes, cuyos resultados se muestran a continuación:

199
UNIDAD 5

PROGRAMAS
I II III IV
66 72 61 63
74 51 60 61
82 59 57 76
75 62 60 84
73 74 81 58
97 64 55 65
87 78 70 69
78 63 71 80

Fuente: "Estadistica Básica en Administración" Berenson-Levine

a. Empleando un software estadístico, realice el análisis de varianza de los datos.


¿Los programas son igualmente efectivos? ¿Cuál conviene implementar?
b. Efectúe el análisis de los residuos, y verifique que no se violen ninguno de los
supuestos del modelo.

200
ACTIVIDAD
OBLIGATORIA
Nº2
UNIDAD 5

Este es el momento en que usted debe resolver la Actividad Obligatoria


Nº 2, que se encuentra al final de esta guía de estudio.

Aquí le indico cuáles son los criterios de Evaluación.

CRITERIOS DE EVALUACION

Es importante que la aplicación de cada una de las herramientas estadísticas esté


debidamente justificada en este trabajo, para que además de juzgar su
implementación, se pueda evaluar la aplicación de los conceptos necesarios que
permitieron la identificación de las mismas.

Si bien los problemas están planteados bajo la forma de ejercicios, no se limite a la


mera aplicación de fórmulas, sino que haga una defensa conceptual de la solución
planteada, y elabore conclusiones concretas en función del problema analizado.

Tenga en cuenta que la debida fundamentación del trabajo realizado es esencial


para que su tutor pueda evaluar los logros obtenidos en el proceso de enseñanza-
aprendizaje, y pueda realizar los ajustes necesarios antes de llegar a las instancias
finales de evaluación.

201
Nº1 ACTIVIDAD
OBLIGATORIA
ACTIVIDAD OBLIG.

Contenidos

1. En una fábrica de autopartes se controla el proceso de pintura. En particular se


mide el "espesor de capa de pintura" de las piezas. Después de efectuar tareas de
mantenimiento en el equipo de pintura, se realiza un control sobre 100 piezas con-
secutivas, registrándose los siguientes valores de espesor de pintura [en micrones]:

( 1) 177 ( 19) 124 ( 37) 160 ( 55) 106 ( 73) 140 ( 91) 132
( 2) 110 ( 20) 110 ( 38) 137 ( 56) 104 ( 74) 68 ( 92) 92
( 3) 118 ( 21) 122 ( 39) 133 ( 57) 136 ( 75) 138 ( 93) 122
( 4) 125 ( 22) 123 ( 40) 183 ( 58) 141 ( 76) 114 ( 94) 140
( 5) 120 ( 23) 112 ( 41) 120 ( 59) 140 ( 77) 124 ( 95) 110
( 6) 117 ( 24) 117 ( 42) 107 ( 60) 143 ( 78) 102 ( 96) 179
( 7) 122 ( 25) 122 ( 43) 127 ( 61) 167 ( 79) 104 ( 97) 145
( 8) 137 ( 26) 151 ( 44) 95 ( 62) 106 ( 80) 76 ( 98) 139
( 9) 151 ( 27) 135 ( 45) 135 ( 63) 81 ( 81) 137 ( 99) 134
( 10) 152 ( 28) 140 ( 46) 116 ( 64) 136 ( 82) 143 (100) 122
( 11) 175 ( 29) 150 ( 47) 130 ( 65) 116 ( 83) 142
( 12) 179 ( 30) 145 ( 48) 172 ( 66) 99 ( 84) 98
( 13) 170 ( 31) 144 ( 49) 177 ( 67) 144 ( 85) 156
( 14) 158 ( 32) 137 ( 50) 166 ( 68) 144 ( 86) 100
( 15) 117 ( 33) 112 ( 51) 139 ( 69) 114 ( 87) 147
( 16) 148 ( 34) 117 ( 52) 114 ( 70) 115 ( 88) 69
( 17) 142 ( 35) 161 ( 53) 125 ( 71) 113 ( 89) 99
( 18) 118 ( 36) 155 ( 54) 103 ( 72) 171 ( 90) 112

a) Compruebe mediante una prueba chi-cuadrado de bondad de ajuste si la mues-


tra proviene de una población con distribución Normal.

b) De acuerdo con las especificaciones de Ingeniería, el espesor de pintura no


debe ser menor a los 40 micrones. Suponiendo que la variable efectivamente tiene
distribución Normal, calcule el porcentaje de piezas que no cumplen con las espe-
cificaciones.

c) El Ingeniero de Proceso opina que la media de la variable no debe ser mayor


que 120 micrones, pues en tal caso el proceso se torna antieconómico. Usando los
primeros 20 datos de la serie, compruebe en qué condiciones se encuentra el pro-
ceso respecto a esta cuestión.

d) Durante el proceso de pintura suelen presentarse problemas de taponamiento


de las boquillas, que producen una disminución del espesor de capa, y un aumento

202
ACTIVIDAD OBLIG.

de la dispersión de la variable. Arme dos muestras, una con las observaciones Nº 1


a 30, y otra con las observaciones Nº 60 a 95, y realice las comprobaciones que
crea conveniente para verificar si se han producido esas situaciones.

2. El embalse del Dique San Roque, en la provincia de Córdoba, recibe el aporte


de todos los ríos y arroyos del valle de Punilla. Debido a la importancia del embalse
como fuente de aprovisionamiento para agua potable y riego, es necesario construir
modelos que permitan pronosticar los volúmenes de agua que ingresan mensual-
mente al mismo. El siguiente gráfico resume el comportamiento del ciclo hidrológico.

P (precipitaciones)

Río

V (escurrimiento)

Del total de lluvia caída, una parte escurre directamente al río, y otra se infiltra en el
suelo. El agua infiltrada se mueve lentamente por el suelo y el subsuelo, alimentando
el almacenamiento subterráneo, que a su vez aporta agua al río.

Un modelo posible para los volúmenes de escurrimiento es el siguiente:

Vt = a Pt + b Vt-1 + c Pt -1

donde:
Vt es el volumen de escurrimiento para un cierto mes
Pt es la cantidad de lluvia caída durante ese mes
Vt-1 es el volumen escurrido durante el mes anterior
Pt-1 es la precipitación del mes anterior

203
ACTIVIDAD OBLIG.

Trate de comprender con claridad el significado y la importancia de c/u de las varia-


bles del modelo, teniendo en cuenta las consideraciones sobre el fenómeno que se
hacen a cont.

El suelo permite mayor o menor infiltración, según esté seco o húmedo. Esto a su
vez depende de la época del año, ya que en invierno el suelo está muy seco, y en
verano se humedece con las lluvias. Por lo tanto en invierno hay mucha absorción
de las lluvias y poco escurrimiento directo al río, mientras que en verano el proceso
se invierte.

En el modelo planteado para V, cada uno de los términos implica una demora o
retardo en el recorrido del agua hasta llegar al lago. Si el primer término de la
ecuación es importante, significa que el retardo es bajo y la llegada al lago es cues-
tión de horas. Si el segundo término es importante, entonces la demora es de varios
días o semanas. Finalmente, si el tercer término es importante hay un retardo supe-
rior a un mes.

En las siguientes tablas se proporcionan los datos de Precipitación Mensual y de


Aporte Mensual, para un período de 20 años. Con estos datos debe ajustar el
modelo más adecuado para los meses de febrero y mayo, efectuando un cuidadoso
análisis de los resultados, evitando incluir variables no significativas. Finalmente,
realice una interpretación física de los modelos obtenidos para cada mes, destacan-
do las diferencias entre ambos.

204
ACTIVIDAD OBLIG.

205
ACTIVIDAD OBLIG.

ORIENTACIONES PARA SU RESOLUCION

Considere los siguientes pasos para el análisis de los casos:

- Defina con claridad el problema, y qué es lo que pide concretamente el


enunciado.
- Seleccione las herramientas estadísticas adecuadas.
- Utilice correctamente esas herramientas. Tenga en cuenta que puede reali-
zar los cálculos a mano, o empleando algún paquete estadístico.
- Fundamental: interpretación adecuada de cada uno de los resultados obte-
nidos, y su importancia en términos del problema específico planteado.

206
ACTIVIDAD
OBLIGATORIA
Nº2
ACTIVIDAD OBLIG.

1. El encargado de recepción de materia prima de una fábrica, cree advertir un


extraño comportamiento en las entregas que realiza la única empresa de transporte
que realiza los fletes. Las entregas se realizan únicamente de lunes a viernes. Para
estudiar con mayor detalle el problema, el encargado reúne los datos sobre tonela-
das de material recibidas de lunes a viernes registrados durante las última 6 sema-
nas de trabajo. Los datos son los siguientes:

( 1) 1.98 (19) 3.25


(2) 3.28 (20) 1.85
( 3) 2.11 (21) 2.14
(4) 4.02 (22) 2.51
( 5) 2.38 (23) 2.68
(6) 1.44 (24) 3.85
( 7) 3.62 (25) 2.71
( 8) 2.04 (26) 1.34
( 9) 4.01 (27) 3.05
(10) 2.71 (28) 2.2
(11) 1.81 (29) 3.82
(12) 3.15 (30) 2.02
(13) 2.68
(14) 2.98
(15) 2.21
(16) 2.01
(17) 2.95
(18) 2.11

Analice la serie resultante, y ayude al encargado de recepción a confirmar si efecti-


vamente pasa algo raro con las entregas, y en tal caso cuál es el comportamiento
que se advierte en el movimiento de cargas. Remueva las componentes presentes,
calculando los índices correspondientes, y muestre cómo se vería la serie en esas
condiciones.

2. Vuelva a considerar los datos de «espesor de capa de pintura» empleados en el


Ejercicio 1 de la Actividad Obligatoria N’ 1. Realice el análisis de la serie utilizando
las siguientes Herramientas:

a) Función de autocorrelación.

207
ACTIVIDAD OBLIG.

b) Función de densidad espectral.

c) Deduzca cómo es la estructura de la serie, y qué componentes están pre-


sentes.
3. Con la misma serie del ejercicio anterior, realice lo siguiente: Construya una carta
de Medias-Rangos para n = 4.

a) Calcule y trace los límites de control.

b) Interprete el comportamiento del proceso de pintura, en base a lo que se


advierte en las cartas. Explique si el proceso está o no estable, identifique
las señales de inestabilidad presentes, y comente cómo ha sido la evolución
del proceso durante el tiempo que duró la experiencia.

c) Teniendo en cuenta las consideraciones generales sobre el problema pre-


sentadas en la Actividad N’ 1, y a los resultados del análisis realizado con
las cartas de control, formule una opinión sobre el funcionamiento del pro-
ceso, indicando de acuerdo a su punto de vista que aspectos se pueden
mejorar.

4. En una fábrica se controla el diámetro interno de un modelo de cárter. La pieza


se fabrica en 4 máquinas diferentes, a lo largo de 2 turnos de trabajo. El Departa-
mento de Calidad de la empresa ha detectado últimamente una mayor variabilidad
en los diámetros producidos. Para investigar acerca de la posible causa de ese
aumento, se decide realizar un estudio tomando muestras de la producción de las 4
máquinas y de los dos turnos de trabajo.

Los resultados del muestreo se muestran en las tablas siguientes. La cota deseada
para el diámetro es de 67 mm, y los datos registrados representan la diferencia
entre el diámetro real de la pieza y la cota deseada, expresando esa diferencia en
centésimas de milímetro.

Realice lo siguiente:

a) Utilizando herramientas estadísticas adecuadas, determine si existen dife-


rencias significativas entre la producción de las máquinas, o entre los turnos
de trabajo.

b) En base al análisis anterior, formule una opinión acerca del origen del au-
mento de la variabilidad de los diámetros.

208
ACTIVIDAD OBLIG.

ORIENTACIONES PARA SU RESOLUCION

Considere los siguientes pasos para el análisis de los casos:

- Defina con claridad el problema, y qué es lo que pide concretamente el


enunciado.
- Seleccione las herramientas estadísticas adecuadas.
- Utilice correctamente esas herramientas. Tenga en cuenta que puede reali-
zar los cálculos a mano, o empleando algún paquete estadístico.
- Fundamental: interpretación adecuada de cada uno de los resultados obte-
nidos, y su importancia en términos del problema específico planteado.

209
UNIDAD

CLAVES DE
RESPUESTAS 1
Claves de Resp.

1. Poner bajo prueba una afirmación sobre el valor de un parámetro de una pobla-
ción, o sobre la distribución de una variable aleatoria.

2. Hay dos tipos de prueba sobre la media poblacional, de acuerdo a la informa-


ción disponible: con varianza poblacional conocida o muestras grandes, y con
varianza poblacional desconocida y muestras pequeñas. En ambos casos cambia el
estadístico de prueba.

3. Para comparar la dispersión o el nivel medio de una variable medida en ambas


poblaciones.

4. Primero, si las muestras son dependientes o independientes. Segundo, el tamaño


de las muestras. De acuerdo al caso considerado cambia el estadístico de prueba.

5. Comprobar la distribución de una variable aleatoria, o decidir si una muestra


proviene de una población con una cierta distribución especificada de antemano.

6. Compara dos distribuciones: la distribución observada, construida en base a los


datos de la muestra disponible, y la distribución esperada, calculada en base al
modelo propuesto en la hipótesis nula.

7. a. x = 99.778 mm. s = 0.1457 mm.


Testimado = -6.814 Tcrítico = ± 2.093 (Para prueba bilateral)
Conclusión: el diámetro medio obtenido difiere significativamente del valor
nominal.
b. χ2estimado = 40.334 χ2crítico = 30.144
Conclusión: la varianza es significativamente superior a 0.01 mm.2

c. La prueba permite comprobar que la muestra proviene de una población


con distribución Normal.

d. n1 = 40 x 1 = 99.812 mm. s1 = 0.1703 mm. (antes de la corrección)


n2 = 85 x 2 = 100.009 mm. s2 = 0.1707 mm.(después de la corrección)
Comparación de varianzas: Festimado= 0.9953 FCrít.Inf.=0.6 F.Crít.Sup.=1.5
Conclusión: las varianzas antes y después de la corrección no son diferentes.
Comparación de medias: Zestimado = -6.03 Zcrítico = ±1,96
Conclusión: la media del proceso cambió significativamente después de la
corrección.

211
UNIDAD

2
Claves de Resp.
CLAVES DE
RESPUESTAS

1. Establecer el tipo y grado de asociación entre dos variables, analizar como


reacciona una variable dependiente frente a cambios en la variable independiente,
predecir el comportamiento de una variable difícil de medir en base al valor de otra
u otras conocidas.

2. Directa o inversa, lineal o curvilínea.

3. Dibujando el diagrama de dispersión de los datos.

4. Evaluar el grado de asociación entre dos variables.

5. No.

6. Calculando la Covarianza o el Coeficiente de Correlación.

7. El Coeficiente de Correlación mide el grado de asociación lineal entre dos varia-


bles, y es un índice adimensional que varía entre -1 y +1. Si el Coeficiente de
Correlación tiende a |1| significa que hay un fuerte grado de asociación lineal entre
las variables, mientras que si tiende a 0 el grado de asociación es débil. Cuando el
Coeficiente de Correlación vale exactamente uno, significa que existe asociación
lineal perfecta, y cuando vale exactamente cero significa que las variables son
linealmente independientes.

8. No necesariamente, ya que puede existir algún otro tipo de relación, no lineal,


que no es detectada por este coeficiente.

9. Realizando la prueba de hipótesis sobre el Coeficiente de Correlación, plantean-


do como hipótesis nula que su valor es igual a cero.

10. Establecer la relación funcional entre una variable dependiente, y una o varias
variables independientes.

11. En el análisis de correlación no es imprescindible que exista una relación de


causalidad entre las variables, cosa que si debe ocurrir en un análisis de regresión.
En el análisis de correlación no interesa conocer la relación funcional que existe
entre las variables, lo que en cambio constituye el objetivo del análisis de regresión.

12. Lineales, no lineales, simples y múltiples.

13. Es un modelo que vincula a la variable dependiente con una sola variable
independiente, mediante la ecuación de una recta: y = a + b x

212
Claves de Resp.

14. En forma intuitiva, procurando identificar la recta que represente lo mejor po-
sible a los puntos del diagrama de dispersión, o en forma analítica, mediante el
método de mínimos cuadrados.

15. Se basa en minimizar la suma de los desvíos -errores o residuos- cuadráticos


con respecto a la recta de regresión, tratando de definir la recta que más represen-
tativa de los datos disponibles.

16. Sirve para efectuar estimaciones de la variable dependiente, para diferentes


valores de la variable independiente. Se pueden efectuar estimaciones puntuales o
por intervalos.

17. Superponiendo la función obtenida en el diagrama de dispersión, evaluando


visualmente la representatividad del modelo; calculando el error estándar de la es-
timación; calculando el coeficiente de determinación.

18. El error estándar de la estimación mide la dispersión de la variable dependiente


en torno a la recta de regresión ajustada. Una cantidad asociada es la varianza
residual, que es el cuadrado del error estándar.

19. La variación explicada es la parte de la variación total de la variable dependien-


te -al variar la variable independiente- que es representada por el modelo. La varia-
ción no explicada es la variación de y no representada por el modelo -o error que
se comete al estimar el valor de la variable dependiente a través del modelo-. Una
cantidad muy importante que emplea esta información es el coeficiente de determi-
nación, que se interpreta como el porcentaje de la variación de y, al variar x, que es
explicada por el modelo.

20. Se pueden calcular intervalos de confianza o hacer pruebas de hipótesis sobre


los parámetros del modelo lineal simple. De los dos parámetros, el más importante
es la pendiente, ya que expresa en qué medida reacciona la variable dependiente
frente a cambios en la variable independiente. Una comprobación muy útil consiste
en averiguar si la pendiente es significativamente distinta de cero, pues si esto no
ocurre significa que el modelo no es útil para explicar la variación de la variable
dependiente.

21. Una regresión múltiple es un modelo en el cual se relaciona la variable depen-


diente con varias variables independientes. La principal ventaja consiste en que, al
agregar más factores dentro de análisis, seguramente se va a poder explicar mejor
el comportamiento de la variable de respuesta. El modelo general es:
y = a + b1 x1 + b2 x2 + … + bp xp

213
Claves de Resp.

22. El ajuste de un modelo lineal múltiple se realiza de la misma manera que el


ajuste de un modelo lineal simple, minimizando la suma de residuos al cuadrado
mediante el método de mínimos cuadrados.

23. Se hacen diferentes análisis para evaluar la calidad del ajuste: error estándar de
la estimación, varianza residual, y coeficiente de determinación; análisis de correla-
ción entre los parámetros del modelo; análisis de inferencia: prueba sobre el modelo
global, prueba sobre los parámetros del modelo; análisis de los residuos: verifica-
ción de normalidad e independencia, media cero y varianza constante.

24. No extrapolar resultados mucho más allá del rango de valores disponibles
sobre las variables; investigar el origen de todos los datos sospechosos; no forzar la
existencia de relaciones, cuando éstas realmente no existen; verificar la existencia
de una vinculación física real entre las variables en un análisis de regresión; no usar
los resultados del análisis numérico para justificar relaciones que no existen entre las
variables.

25. b. r = 0.255
El valor del coeficiente de correlación sugiere que existe un débil grado de
asociación lineal entre las variables.
c. y = 99.73 + 0.0038 x
d. Se = 0.172
e. r2 = 0.0651 Significa que la recta ajustada explica sólamente un 6.51 % de la
variación de los diámetros al variar el tiempo.

f. Testimado = 1.626 Tcrítico = ±3.182

Conclusión: la pendiente de la recta de regresión no es significativa, y por


ende el modelo lineal no es adecuado para explicar la relación entre diámetro
y tiempo.

214
UNIDAD

CLAVES DE
RESPUESTAS 3
Claves de Resp.

1. Una serie de tiempo es el conjunto de valores de una variable registrados a lo


largo del tiempo. El objetivo de su análisis es tratar de explicar el comportamiento
pasado de la serie, para usar esta información en la toma de decisiones, modelar la
serie, simular series con propiedades similares, pronosticar valores futuros, etc.

2. Tendencia secular: es el movimiento general de la serie durante un período sufi-


cientemente prolongado de tiempo. Variación estacional: son fluctuaciones lentas
de la serie, durante períodos prolongados, caracterizados por crestas y valles alre-
dedor de la curva de tendencia. Variación estacional: son fluctuaciones estacionales
de la serie, que se manifiestan dentro de un año, cuyo patrón tiende a repetirse año
tras año. Variación irregular: son fluctuaciones aleatorias que no pueden ser explica-
das por las componentes anteriormente mencionadas.

3. Se trata de identificar y modelar las componentes presentes en una serie.

4. Efectuando una regresión lineal o no lineal, de acuerdo al comportamiento de la


serie.

5. Calculando y graficando índices que pongan en evidencia las oscilaciones de la


serie, como por ejemplo los residuos cíclicos.

6. Datos anuales, como mínimo.

7. Utilizando índices que describan el grado de variación estacional de la serie,


como por ejemplo los índices relativos al promedio móvil de la serie. Para este tipo
de análisis es necesario disponer de datos semanales, mensuales, trimestrales, etc.,
es decir para intervalos menores al año.

8. Los promedios móviles permiten suavizar las irregularidades de una serie, po-
niendo más en evidencia las componentes presentes en la serie.

9. Es una serie a la cual se le ha removido el patrón estacional, lo que permite


estudiar mejor el efecto de las demás componentes de la serie.

10. Es muy difícil representar la componente aleatoria, siendo necesario recurrir a


modelos que no son abordados en esta materia. Una práctica útil es identificar
aquellos puntos que presentan un comportamiento atípico, identificar la causa, y
usar esta información como elemento de juicio adicional al efectuar pronósticos.

11. Autocorrelación es la correlación entre dos valores de una misma variable,


medida para un cierto intervalo de diferencia -retardo-. La FAC es una función que

215
Claves de Resp.

asigna valores de autocorrelación para diferentes retardos.

12. La FDE es una función que distribuye la varianza total de la muestra sobre el
rango de frecuencias de aparición de cada valor.

13. Para analizar la estructura de una serie temporal, e identificar las principales
componentes que están presentes en la serie.

14. No se deben realizar pronósticos o extrapolaciones basados únicamente en el


análisis matemático efectuado sobre la serie, sino que también es necesario incor-
porar una buena dosis de sentido común, tratando de ponderar en que medida el
comportamiento pasado se va a repetir en el futuro, considerando el efecto de
posibles factores puntuales de variación, y evaluando los riesgos o consecuencias
de adoptar como definitivo los diferentes pronósticos que se pueden realizar para
una misma situación.

15. Analizando la serie se advierte una suave tendencia creciente en los datos. Se
ajusta un modelo lineal simple, que queda de la siguiente forma:

y = 99.83 + 0.009 x

16. Analizando conjuntamente la FAC y la FDE, se puede concluir de que no hay


evidencia en los gráficos sobre la existencia de alguna componente muy definida.
Por lo tanto, se puede asumir que el último tramo de la serie presenta un comporta-
miento totalmente aleatorio.

216
UNIDAD
CLAVES DE
RESPUESTAS 4
Claves de Resp.

1. Calidad es cumplir con los requisitos del cliente, en tiempo y forma, y al menor
costo.

2. Es un conjunto de actividades tendientes a asegurar que se cumplan con los


requisitos del cliente.

3. Históricamente se hacía una inspección final del producto terminado. Actual-


mente la tendencia es controlar el producto en cada una de sus etapas de elabora-
ción.

4. Detección se refiere a la identificación de problemas al final del proceso de


producción, mientras que prevención implica detectar los problemas ni bien ocu-
rren, para poder actuar preventivamente sobre el proceso. En este último caso
existe una retroalimentación del sistema.

5. Trabajar en todos los niveles de una organización, y sobre los diferentes proce-
sos de producción, para lograr la satisfacción del cliente, y tratar de mejorar per-
manentemente.

6. El diagrama de Pareto permite clasificar los problemas de calidad de un produc-


to de acuerdo con la frecuencia de ocurrencia. El diagrama de espina de pez, o de
causa-efecto, sirve para identificar todas las fuentes de variación que afectan a una
variable.

7. Es una variable, numérica o no, relacionada con alguna propiedad funcional de


un producto que resulta importante para su correcto desempeño.

8. Conocer la variabilidad de una característica es fundamental para entender su


comportamiento, determinar sus propiedades, y establecer si se está trabajando en
condiciones razonables o no.

9. Reducción de la variabilidad, mejoramiento continuo de procesos, disminución


de índices de rechazo, reducción de costos, satisfacción total del cliente.

10. Es la aplicación de técnicas estadísticas para controlar la variabilidad de un


proceso.

11. Las causas comunes son los factores de variación permanente, de carácter
aleatorio, que actúan sobre un proceso. Las causas especiales son fuentes intermi-
tentes que introducen una variación excesiva en el proceso, y a las que se puede
asignar con facilidad su origen.

217
Claves de Resp.

12. Es un método gráfico para comprobar si un proceso opera bajo la acción de


causas comunes de variación, o si están presentes causas especiales.

13. Un proceso se dice que está estable, o bajo control estadístico, cuando solo
actúan las causas comunes de variación. Si operan también causas especiales, el
proceso está inestable o fuera de control.

14. La carta es una prueba de hipótesis realizada en forma gráfica, a través de la


cual se comprueba si un determinado parámetro asociado al proceso ha variado
significativamente o no a lo largo del tiempo.

15. Se puede hacer una diferenciación básica entre cartas de control por variables,
que sirven para controlar parámetros numéricos, y cartas por atributos, que se usan
para controlar variables categóricas.

16. Son dos diagramas que permiten controlar el centrado y la dispersión de una
característica de calidad de tipo numérica.

17. Es necesario comprobar que la característica de calidad tenga distribución


Normal.

18. Los límites se trazan generalmente a 2, 3 ó 4 desvíos de la media, o del rango


medio. Actúan como límites entre la zona de aceptación y de rechazo, para decidir
si el proceso se encuentra o no bajo control estadístico.

19. Pueden ser valores estándar, impuestos por el cliente o el responsable del
proceso. Por lo general lo que se hace es poner en marcha el proceso, medir duran-
te un cierto tiempo, y calcular esos valores en base a la información relevada.

20. Para disminuir la probabilidad del error tipo II, con el fin de evitar dar alarmas
injustificadas.

21. Es un punto fuera de los límites de control, o cualquier patrón de comporta-


miento no aleatorio detectado en la carta de control, que indiquen la acción de
causas especiales de variación. Las señales más usadas son: un punto fuera de
alguno de los límites de control; una racha de puntos por encima o por debajo de la
media; una racha de puntos en orden ascendente o descendente; muchos puntos en
el tercio central; muchos puntos fuera del tercio central, o fuera de los dos tercios
centrales; ciclos, saltos, o cualquier otro patrón sospechoso.

218
Claves de Resp.

22. Conviene comenzar analizando el comportamiento de los rangos. Si los rangos


están estables, se pasa a ver el comportamiento de las medias. Si los dos diagramas
están estables, el proceso está bajo control, es decir que opera únicamente bajo la
acción de las causas comunes de variación.

23. Para controlar la evolución de la fracción rechazada, o proporción de piezas no


conformes.

24. Permiten conocer la variabilidad natural de un proceso, determinar si se está


trabajando en condiciones normales o no, poner en evidencia la acción de causas
especiales de variación, actuar preventivamente sobre el proceso antes de que se
produzcan salidas de control, conocer la evolución del proceso en el tiempo, veri-
ficar el impacto de la implementación de acciones correctivas o de mejora. Ade-
más, si el proceso está estable, remplazan al control 100 % con la misma eficacia.

25. a. x = 99.938 R = 0.368


Diagrama de Medias: LCsup =100.151 Línea Central = 99.938
LCinf = 99.726

Diagrama de Rangos: LCsup = 0.368 Línea Central = 0.778


Análisis de la carta de rangos: los rangos están estables, si bien se nota algu-
nas oscilaciones bruscas al inicio de la serie.
Análisis de la carta de medias: la carta está inestable. Al principio se nota una
racha de puntos por debajo de la media, y una tendencia creciente de los
valores. Después de la muestra Nº 10, en que se hizo un ajuste en el proceso,
la media se estabiliza alrededor de un nuevo valor. Esto origina nuevas seña-
les de inestabilidad, debido a la modificación del centrado que se produjo
después del ajuste.

b. x = 99.987 R = 0.375
Diagrama de Medias: LCsup = 100.203 Línea Central = 99.987
LCinf = 99.770
Diagrama de Rangos: LCsup = 0.375 Línea Central = 0.793

Los dos diagramas están estables, lo que significa que, después del ajuste
realizado, el proceso opera únicamente bajo la acción de causas comunes de
variación.

219
Claves de Resp.

26. LCsup = 0.1186 p = 0.052 LCinf = No hay

La carta se inestabiliza hacia el final de la misma, debido a la presencia de


una racha de puntos por debajo de la media. Es una señal de inestabilidad
positiva, ya que indica que el índice de rechazo ha comenzado a disminuir
durante las últimas jornadas de fabricación.

220
UNIDAD
CLAVES DE
RESPUESTAS 5
Claves de Resp.

1. Dado un sistema, el diseño de experimentos consiste en la realización de


pruebas controladas, tendientes a comprobar cómo cambian los valores de
una variable de respuesta frente a cambios introducidos deliberadamente en
las variables de estado del sistema.

2. Aplicaciones científicas: en la investigación, para verificar determinadas


hipótesis. Aplicaciones prácticas: en la industria, para mejorar el rendimiento
de un proceso, o diseñar nuevos procesos o productos.

3. Los factores son las variables de proceso, y están asociadas a las condi-
ciones bajo las cuales se desarrolla el mismo, como por ejemplo la materia
prima, la mano de obra, el método de trabajo, etc. La respuesta es la salida
del proceso.

4. Identificar cuáles son los factores que tienen una influencia considerable
sobre la respuesta, y determinar los mejores valores de los factores contro-
lables de modo tal que la respuesta esté cerca del valor nominal, que la varia-
ción de la respuesta sea pequeña, y que se minimice el efecto de los factores
no controlables.

5. Análisis detallado del problema y formulación clara de los objetivos del


estudio, selección del diseño apropiado, ejecución del experimento, análisis
e interpretación de los resultados, elaboración de las conclusiones finales.

6. Diseños a un solo factor o unifactoriales, y diseños a dos ó más factores o


multifactoriales.

7. A un conjunto particular de condiciones de los factores a los que se some-


te a una unidad experimental.

8. Es la diferencia que existe entre las respuestas observadas en unidades


sometidas al mismo tratamiento, debido a la existencia de errores concep-
tuales, de medición, de ejecución, o a la falta de uniformidad en las unidades
experimentales, etc.

9. Significa asignar por sorteo los tratamientos a las distintas unidades expe-
rimentales. Es fundamental para no introducir un sesgo en los resultados,
especialmente cuando las unidades no son demasiado uniformes.

10. Se pone bajo prueba la igualdad de medias poblacionales de la respues-


ta, correspondientes a cada uno de los tratamientos o niveles del factor.

221
Claves de Resp.

11. La igualdad de medias de los tratamientos se comprueba indirectamente, efec-


tuando el análisis de varianza de los datos. Se construye la tabla de ANOVA, que
es donde se vuelcan por resultados necesarios para el análisis, y se interpreta el
contenido de la misma.

12. La base del análisis de varianza está en la descomposición de la variación total


de la respuesta en dos componentes: una variación debida a los tratamientos y una
variación debida al error experimental. Se calculan dos estimaciones de la varianza,
considerando cada una de las componentes de variación. Luego se comparan
estas dos estimaciones, y si son parecidas significa que no hay diferencias significa-
tivas entre las medias de los diferentes tratamientos, que es la hipótesis nula del
problema.

13. No. Para que el análisis y las conclusiones sean válidas, hay que verificar ade-
más que se cumplan todos los supuestos del modelo.

14. Es la verificación que se hace de los errores, para comprobar el cumplimiento


de los supuestos básicos, y verificar la idoneidad del modelo.

15. El tamaño muestral o número de repeticiones de cada tratamiento conviene que


sea lo más grande posible, para que las inferencias sobre las poblaciones sean más
precisas. Su valor se puede establecer con mayor precisión usando curvas de ope-
ración característica.

16. a. Tabla de análisis de varianza:


———————————————————————————————
Source of variation Sum of Squares d.f. Mean square F-ratio Sig. level
———————————————————————————————
Between groups 1068.1250 3 356.04167 4.221 .0139
Within groups 2361.7500 28 84.34821
———————————————————————————————
Total 3429.8750 31

Como se ve, el estadístico F no toma un valor muy elevado, y su probabilidad a


quedado con un valor sospechoso, ya que se da el caso particular de que según
cuál sea el nivel de significación elegido para la prueba, se puede terminar aceptan-
do o rechazando la hipótesis de igualdad de medias. Sin embargo, analizando la
tabla de medias y los gráficos que resumen los resultados de los 4 tratamientos, se
ve claramente que el Programa Nº 1 ha producido puntajes mayores al resto, y por
lo tanto es el que ha arrojado los mejores resultados.

222
Claves de Resp.

b. El análisis de los residuos permite comprobar que son normales, tienen media
cero y varianza constante. Por otra parte, no presentan ningún patrón extraño de
comportamiento, así que pueden suponerse independientes. Por lo tanto se puede
afirmar que no se ha violado ninguno de los supuestos del modelo, tomándose
como válidos los resultados del ANOVA.

223

También podría gustarte