Estadística Aplicada
Estadística Aplicada
Estadística Aplicada
MAESTRÍA EN
INGENIERÍA EN CALIDAD
2006
PROBABILIDAD
Y ESTADÍSTICA
APLICADA
Docentes:
Lic. Fernando Kornblit ferk@inti.gov.ar
Ing. Gustavo Vázquez ogustavovazquez@yahoo.com.ar
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Cada vez son más las decisiones que diariamente deben tomarse en las empresas, a
diferentes niveles y, paralelamente, cada vez es mayor la exigencia de que esas
decisiones sean correctas. En consecuencia, los responsables deben estar dotados de
las herramientas adecuadas capaces de asistirlos en la toma de esas decisiones.
Desestimar su uso significa otorgar ventajas considerables.
Objetivos particulares
Autor: F. Kornblit 2 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 3 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
USO DEL EXCEL: El Excel será utilizado en este módulo para ejemplificar los
temas y realizar ejercicios. En el marco de la metodología desarrollada más arriba,
entendemos como muy importante la ejercitación con datos concretos, tomados
muchos de ellos de la práctica industrial. La elección de esta herramienta se
fundamenta en el hecho de ser el programa de manejo de datos y cálculos más
conocido y utilizado. Además, contiene las funciones y herramientas estadísticas
necesarias para este módulo.
Por lo tanto, se recomienda fuertemente que los alumnos tengan conocimientos
mínimos del uso de Excel (versión 95 o posterior). Muchos de los ejercicios que
plantearemos para su resolución están pensados para ser resueltos en ese
Autor: F. Kornblit 4 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
TRABAJOS PRÁCTICOS: Junto con este material se presenta un archivo Excel con
5 ejercicios de Trabajos Prácticos cuya resolución grupal es obligatoria. Cada uno
de estos ejercicios corresponde a un problema práctico en empresas ficticias. Para
la resolución de los mismos se requiere la aplicación de algunas de las
herramientas estadísticas vistas durante el curso. La solución hallada por el grupo
deberá elaborarse de forma tal que simule ser un informe para la empresa en
cuestión (realizado por un grupo de la misma empresa, o por consultores externos,
etc). Estos informes deberán contener, al menos, los siguientes 4 puntos:
Autor: F. Kornblit 5 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 6 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
DEBATE:
Preguntas para el debate:
1¿Qué entiende por “eficiencia” y “eficacia”?
2 Dar ejemplo de “características medibles” de los procesos de la empresa
en que used trabaja o que usted conoce
3 dar ejemplos de “variabilidad de procesos”, tanto para procesos
productivos como de gestión
Autor: F. Kornblit 7 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
veces, los análisis descriptivos constituyen el primer paso de un estudio más global.
En este módulo veremos las herramientas más comunes
Autor: F. Kornblit 8 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
g) Diseño de experimentos: estudios llevados a cabo para evaluar, con cierto nivel
de confianza, características de productos, procesos o sistemas, a partir del
conocimiento de la respuesta de los mismos ante la variación planificada de algunas
de sus magnitudes de influencia. En el módulo Diseño de Experimentos
Tecnológicos se verán con detalles estas metodologías
Autor: F. Kornblit 9 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
4. ¿Qué es la Estadística?
Ese universo objeto de estudio es llamado población. Por ejemplo, si una fábrica de
pantalones desea estudiar la cantidad de defectos superficiales de la tela en la
producción de un mes, la población está formada por todos los pantalones producidos
ese mes. Si se desea saber con qué frecuencia un horno supera una dada
temperatura admisible, la población a todas las posibles operaciones posibles del
horno. Si se quiere estudiar el grado de satisfacción de nuestros clientes con alguno
de nuestros productos, la población abarca la totalidad de nuestros clientes (reales o
potenciales)
5. Objetivos de la Estadística:
Haciendo una gran simplificación, podemos decir que la Estadística persigue alguno
de los dos objetivos siguientes:
Autor: F. Kornblit 10 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
El segundo de los objetivos implica un estudio más global que comprende, así como
la evaluación de la representatividad de la muestra observada, el estudio de las
características de la población de la que esa muestra fue extraída, dado que la
decisión que se tomará afectará a la totalidad de la población, no solamente a la
muestra. Llamamos Inferencia Estadística a esta disciplina (ver 2b) Dado que la
aplicación de técnicas de Inferencia Estadística requiere tener conocimientos
previos sobre la población en estudio, se vuelve necesario dominar algunos
elementos de la Teoría de la probabilidad, que serán dados en este módulo a partir
del Capítulo 2.
Autor: F. Kornblit 11 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Una respuesta típica de un problema estadística puede ser dada, por ejemplo, “con
un 95% de confianza”, o “con un 99% de confianza”. Al trabajar con datos
aleatorios, hay siempre un nivel de riesgo de que las conclusiones no sean
correctas. Sin embargo, en tren de asegurar confianza al usuario de la herramienta
en cuestión, deberemos elegir la misma con niveles altos de confianza.
NOMINALES (pertenencia)
CUALITATIVOS MODELO
ORDINALES (ranking) BINOMIAL
Autor: F. Kornblit 12 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
DAT
OS DE ITEMS DEFECTUOSOS
DISCRETOS
(resultados de
conteos) DE DEFECTOS MODELO
DE
CUANTITATIVOS
POISSON
CONTINUOS
(resultados de
mediciones)
MODELO NORMAL
(GAUSSIANO)
Autor: F. Kornblit 13 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
que se cuenta la de cantidad de fallas. Los datos discretos aparecen cada vez
que se hacen controles o inspecciones “por atributos” esto es, detectando la
presencia o ausencia de una falla u otro atributo no numérico.
4. Por último, los datos continuos son aquellos que pueden tomar cualquier valor
numérico, no necesariamente entero. En general, los datos continuos aparecen
como resultados de mediciones (físicas, químicas, biológicas, etc). Por
ejemplo, diámetros de piezas, temperaturas de procesos, concentraciones de
impurezas, caudales de tuberías, etc. Si bien no hay un único modelo
matemático para caracterizar las propiedades probabilísticas de estos
sistemas, el de la Distribución Normal (o Gaussiana) se aplica en la mayoría
de los casos.. Los datos continuos aparecen cada vez que se hacen controles
o inspecciones “por variables” esto es, midiendo características numéricas en
las muestras bajo ensayo
Autor: F. Kornblit 14 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 15 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 16 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Distinguimos dos técnicas básicas para describir datos. Por un lado, las técnicas de
cálculo de “estadísticos” o medidas de tendencia, y por otro lado las técnicas
gráficas.
1.Estadísticos: Son valores obtenidos por cálculo, a partir de los datos muestrales,
que sirven para representar las características básicas de la muestra.
x
i 1
i
x=
n
El uso del promedio como medida de localización está justificado en el hecho de que,
al promediar los valores, los "pequeños desvíos" que influyen en cada repetición, se
compensan, anulándose mutuamente. Desde el punto de vista de la teoría estadística,
el promedio tiene muchas propiedades deseables para caracterizar la posición o
tendencia central de una muestra. Debemos prevenir, sin embargo, la posible
presencia de valores anómalos o no consistentes con el resto de la serie (outliers),
pues el promedio es muy sensible ante este tipo de irregularidades. Supongamos por
ejemplo que tenemos 5 valores:
El cálculo da 3,28. Si observamos bien los datos, vemos que el cuarto de ellos difiere
de los demás, posiblemente por algún error o accidente grosero al que no podemos
catalogar de "aleatorio". Esto produce una diferencia significativa con el promedio que
se obtendría de los restantes 4 valores, de 3,21. Este ejemplo nos dice que debemos
analizar los datos antes de emplear mecánicamente una técnica estadística.
Cálculo del promedio con datos agrupados: Supongamos que se arrojó 20 veces
un dado, y se obtuvieron los siguientes resultados:
1 2 2 5 6 6 4 3 5 4
1 3 2 1 6 4 4 5 3 1
Autor: F. Kornblit 17 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
x=
1+ 2 + 3 + 5 + 6 + 6 + 4 + 3 + 5 + 4 + 1+ 3 + 2 + 1 + 6 + 4 + 4 + 5 + 3 + 1
=
20
1 4 + 2 2 + 3.4 + 4 4 + 5.3 6.3
=
20
4 2 4 4 3 3
= 1 +2 +3 +4 + 5 6 =
20 20 20 20 20 20
= 1 fr( 1 ) + 2 fr( 2 ) + 3 fr( 3 ) + 4 fr( 4 ) + 5 fr( 5 ) 6 fr( 6 )
= i fr(i) 3,95
donde fr(1), fr(2), etc representan a las frecuencias relativas de cada resultado, esto
es, la cantidad de veces que ocurrió cada resultado dividida por la cantidad total de
datos:
1.1.2. Mediana. Otra medida de tendencia central es la mediana de una muestra. Para
calcular la mediana se debe ordenar la muestra de menor a mayor; si el tamaño de la
muestra es impar, la mediana es el valor central de la muestra ordenada. Si es par, el
promedio de los dos valores centrales. En el ejemplo anterior ( 3,21 3,26 3,18 3,55
3,20), la mediana es m = 3,21. Eliminando el cuarto valor, la mediana llega a
ser m'=(3,20+3,21)/2 = 3,205 . Se observa en el ejemplo una característica de la
mediana: su poca sensibilidad ante la presencia de valores anómalos. Observemos
que si el cuarto dato, en lugar de 3,55 fuera 1000,55 , la mediana m seguiría siendo
3,21 . Entonces, la ventaja de la mediana respecto de la media es, además de ser más
fácil su cálculo, su alta resistencia a modificaciones groseras en los datos. En cambio,
es un estadístico menos eficiente que la media dado que utiliza menos información de
la muestra (solamente el o los valores centrales). Se utiliza la mediana cuando hay
una gran probabilidad de que en la muestra haya valores anómalos, o cuando los
datos no se distribuyen simétricamente.
Autor: F. Kornblit 18 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Cálculos en Excel:
Para calcular el promedio y la mediana de una muestra usando las
funciones estadísticas del Excel, realice lo siguiente: (Intente con los 5 datos
del ejemplo anterior)
1. Ingrese a la hoja de cálculo los datos los datos cuyo promedio (o mediana)
desea calcular. Éstos ocuparán un rango de celdas (por ejemplo, si ingresa 5
valores y los ubica desde la primera celda de la hoja y hacia abajo, el rango de
celdas será A1:A5). Luego, sitúe el cursor o el mouse en cualquier otra celda.
2.Haga doble click en el Asistente de Funciones, correspondiente al ícono
siguiente:
Ejercicio:
En una empresa mediana trabajan 70 personas. Los siguientes datos muestran el
salario de los empleados, según sus categorías:
40 personas ganan $400
15 personas ganan $800
5 personas ganan $1500
5 personas ganan $2000
3 personas ganan $3000
1 persona gana $4000
1 persona gana $5000
Calcular, usando la computadora, el promedio y la mediana de los sueldos del
personal. ¿qué conclusiones puede sacar?
Autor: F. Kornblit 19 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Proveedor 1 0.15 0.17 0.26 0.29 0.22 0.17 0.18 0.27 0.19 0.21 0.30 0.19 0.21 0.18 0.16
Proveedor 2 0.03 0.11 0.14 0.04 0.07 0.12 0.12 0.09 0.07 0.14 0.03 0.12 0.06 0.12 0.05
Ahora, intente calcular, por medio del Excel, los promedios y medianas para
ambos proveedores (puede copiar directamente la tabla con los datos al Excel)
y verificar que, (redondeando al segundo decimal):
x1 0,21 med1 0,19
x1 0,09 med1 0,09
Es evidente que, tanto el promedio como la mediana permiten caracterizar la
diferencia entre ambos proveedores. Compare los resultados de este caso con
el de los sueldos. ¿Qué conclusiones puede sacar?
Máquina I 2,31 2,33 2,30 2,31 2,32 2,32 2,33 2,31 2,34 2,30
Máquina II 2,33 2,35 2,36 2,40 2,32 2,31 2,28 2,25 2,23 2,27
Los promedios obtenidos para ambas muestras son semejantes entre sí: 2,32 y 2,31
Sin embargo, un mero análisis visual nos revela una diferencia: Los valores de la
muestra I son más cercanos entre sí que los de la II. Podemos decir que la muestra I
está más concentrada alrededor de su promedio, o que la II tiene más dispersión, por
lo tanto, será preferible la máquina 1, que producirá resultados más predecibles.
Este ejemplo nos muestra la necesidad de introducir estadísticos que nos den una
idea de la dispersión de los datos muestrales.
Autor: F. Kornblit 20 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
R = max(x1,...,xn) - min(x1,...,xn)
Notas: a. Para calcular s con ayuda de una calculadora con funciones estadísticas,
se debe usar la tecla n-1
b. A pesar de la nota anterior, debemos advertir que, no debe confundirse la
desviación standard s aquí definida con la desviación standard de una población, , la
cual estudiaremos más adelante.
Autor: F. Kornblit 21 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
2. Técnicas gráficas.
a)Se detecta primero el valor máximo y el valor mínimo medidos. A la diferencia entre
ambos se la denomina rango de las mediciones.
c)Una vez fijadas las clases, se clasificarán los valores dentro de las mismas,
calculando las frecuencias y/o frecuencias relativas de cada intervalo (el número o
proporción de observaciones que caen en en cada intervalo) Es claro que la suma de
las frecuencias de todas las clases iguala el número total de datos:
f(i) = n,
fr(i) = 1
Autor: F. Kornblit 22 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 23 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Las propiedades estadísticas de casos como este serán estudiadas con gran detalle
más adelante.
Autor: F. Kornblit 24 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Se trata de agrupar las fallas registradas por tipos, y ordenar en forma decreciente las
proporciones de cada tipo de falla. Esta herramienta será vista nuevamente en un
módulo posterior, pero decimos acá que puede ser entendida como un histograma
para datos por atributos
Autor: F. Kornblit 25 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 26 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 27 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 28 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 29 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
MUESTRA En general, por más que tratemos con poblaciones finitas, resulta
imposible o impracticable la inspección de todos los elementos de una
población. Una muestra es un subconjunto de elementos extraídos de la
población. En los ejemplos anteriores, una muestra está formada por los 80
pantalones que serán inspeccionados buscando defectos, o por 30
repeticiones del proceso de horneado en las que se medirá la temperatura
máxima.
Al número de elementos de la muestra (80 o 30 en los ejemplos) se lo llama
tamaño de la misma. Notaremos x1,...,xn a una muestra típica, de tamaño n.
Nota: Debemos distinguir entre muestra física y muestra estadística. Para un
estadístico, una muestra es un conjunto numérico, producto de observaciones o
mediciones sobre los elementos físicos. En el ejemplo de los pantalones, si nos
interesa la cantidad de defectos superficiales, en nuestra muestra x1,...,x80 cada
xi representa la cantidad de defectos en la i-ésima unidad inspeccionada. En
cambio, si nos interesara estudiar la resistencia de las costuras, deberíamos
realizar un ensayo de fuerza en cada unidad, siendo x i la fuerza que debió
hacerse para vencer la costura en la i-ésima. La misma muestra física (80
pantalones) generó 2 muestras estadísticas distintas.
(Sub)proceso de muestreo:
POBLACIÓN MUESTRA
El proceso de muestreo debe ser encarado de forma tal que garantice que la
muestra sea lo más representativa posible de la población. Si eligiéramos por
ejemplo los 20 primeros pantalones producidos el primer día del mes, no
estaríamos haciendo lo correcto estadísticamente, dado que la muestra
obtenida no registraría cambios en la producción posteriores a su obtención.Se
trata de elegir la muestra al azar entre la población, esto es, de forma tal que
cada elemento de la población tenga igual chance de ser elegido. En cada
proceso de muestreo se deberá prestar atención a cómo generar muestras
representativas, atento a las características que estemos estudiando.
DATOS En la clase anterior vimos con detalle los tipos de datos a utilizar, por
lo que no habláremos en detalle aquí. Sólo diremos que los datos son
resultados de la medición de la muestra.
Autor: F. Kornblit 30 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
MUESTRA D ATOS
DATOS POBLACION
Decisión. Por último, recordemos que toda inferencia deriva en alguna toma de
decisión sobre la población, y que, si cualquiera de las etapas anteriores ha
sido ejecutada en forma incorrecta, se corre el riesgo de que la decisión sea
equivocada.
Autor: F. Kornblit 31 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 32 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Para comenzar a tratar el tema, les pedimos que respondan la siguiente: ¿Cuál es la
probabilidad de que salga un 4 al tirar un dado?
Autor: F. Kornblit 33 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Valor medio
Vimos en al capítulo anterior el concepto de “promedio muestral” Este concepto
también tiene una versión poblacional. Suponiendo que fuera posible medir la
totalidad de la población y aplicar la misma fórmula que para el cálculo del promedio
muestral con esta totalidad, obtendríamos así el promedio o media poblacional,
denotado .
N
x i
= i=1
N
donde N es el tamaño de la población. En rigor, esta última fórmula es puramente
teórica, dado que no es posible conocer la totalidad de la población (la cual a veces se
considera infinita: N = ). Sin embargo, la media poblacional suele relacionarse con
modelos matemáticos de la población, que permiten realizar cálculos teóricos, o bien
relacionarse con valores históricos. Es muy común, por ejemplo, asumir como a la
media histórica de un proceso.
Es de esperar que, si la muestra es representativa de la población, el promedio
muestral sea numéricamente cercano al poblacional, y que esta cercanía sea mayor
cuanto mayor sea n (tamaño muestral):
x
Esta propiedad, conocida como Ley de los Grandes Números, justifica el hecho de
estimar la media poblacional (difícil o imposible de calcular) a partir de la media
muestral.
Autor: F. Kornblit 34 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Dispersión
De manera similar, si tuviéramos la información sobre la población entera, y
aplicáramos las fórmulas de la varianza y desviación standard a estos datos,
podríamos calcular la varianza y el desvío standard poblacionales, llamados 2 y
respectivamente:
2
( x i - x ) ( x i - x )
2
=
2
=
N N
Notas:
a) Valen las mismas consideraciones sobre el carácter teórico de estas fórmulas, que
hacíamos en el caso del promedio poblacional.
b) Observar que el denominador de estas fórmulas es N en lugar de por N-1. Dado
que N, el tamaño de la población, será siempre un número muy grande (a diferencia
de n, tamaño de la muestra, que puede ser pequeño), la diferencia entre dividir por N y
por N-1 será mínima.
c) Se suele confundir, en la práctica y en alguna bibliografía, las notaciones s con ,
designadas para desvíos standard muestrales y poblacionales respectivamente.
Nosotros mantendremos esta notación. Al igual que ocurre con la media, el desvío
standard muestral es un estimador del poblacional.
s ;s 2 2
Distribuciones de probabilidad
Siguiendo los razonamientos anteriores, si tuviéramos la información de la población
entera, podríamos imaginar la realización de un histograma con todos estos datos. La
forma del gráfico resultante es llamada distribución de la población en estudio (o
distribución de probabilidad). La distribución caracteriza estadísticamente el
comportamiento de la población. El histograma obtenido a partir de una muestra se
convierte en una aproximación de la distribución poblacional, así como la media o la
desviación standard muestral estiman la media o la desviación standard
poblacionales.
Esto se puede visualizar en el siguiente gráfico, donde se observan histogramas
correspondientes a datos continuos.
Autor: F. Kornblit 35 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
No todas las distribuciones relacionadas con procesos industriales son simétricas. Hay
muchos casos donde hay simetría hacia la izquierda (asimetría positiva) o hacia la
derecha (asimetría negativa). En distribuciones con simetría positiva. la media es
mayor que la mediana, mientras que, con simetría negativa, sucede al revés.
Ejemplos típicos de asimetría (positiva) son distribuciones relacionadas con tiempos
de vida útil de una población de productos fabricados, los que serán estudiados en
Confiabilidad
Autor: F. Kornblit 36 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
ENFOQUES
Características poblacional muestral
(parámetros) (teórico) (experimental)
De proporción probabilidad frecuencia relativa
De valor medio x
De dispersión s
De “forma” distribución histograma
Basado en variables aleatorias observaciones
Ejemplos:
a) El ejemplo más simple de experiencia aleatoria es lanzar una moneda al aire y
observar de que lado cae. El espacio muestral está formado por los eventos "cara" y
"seca".
b) Si tiramos un dado, el espacio muestral consiste en los números enteros del 1 al 6.
c) Si la experiencia consiste en tirar una moneda la cantidad de veces necesaria
hasta obtener cara por primera vez, y contar el número de tiradas, los resultados
posibles son 1, 2, 3,... En este caso el espacio muestral es infinito, dado que, en teoría,
cualquier número entero positivo podría ocurrir.
d) Si la experiencia consiste en conectar una bombita de luz y registrar cuánto tiempo
pasa hasta que se queme, el espacio muestral consiste en todos los números positivos
y el 0.
e) De un lote de 10000 neumáticos fabricados se extrae una muestra de 30 a los que
se les realiza un ensayo de presión, contabilizando el número de defectuosos. El
espacio muestral consiste en el conjunto de números enteros entre 0 y 30.
f) Se cuenta el número de roturas o defectos en un largo tramo de tubos de gas. En
este caso, nuevamente, cualquier número entero positivo ( o 0) puede ser el resultado.
Autor: F. Kornblit 37 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
PROBABILIDAD
Todos los ejemplos anteriores tienen en común su aleatoriedad. Si repitiéramos
cualquiera de ellos varias veces, aunque las condiciones sean idénticas, seguramente
los resultados no serán los mismos, sino que variaran dentro de los límites del espacio
muestral en cada caso.
Llamamos evento o suceso a un grupo de uno o varios resultados, esto es, a un
subconjunto del espacio muestral. Sacar un número impar con el dado (ejemplo b), u
obtener un diámetro mayor a 30 mm (ejemplo g), son ejemplos de eventos. La
probabilidad de un evento es un número comprendido entre 0 y 1, relacionado con la
chance de ocurrencia de ese evento.
número de elementos en A # A
P A
número de elementos en S # S
P(cara)= 1/2
En los otros ejemplos, los espacios muestrales no son equiprobables. En c, por caso,
intuitivamente resulta claro que será más probable sacar cara por primera vez en la
Autor: F. Kornblit 38 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Por ejemplo podemos decir, indistintamente, “la probabilidad de que un trabajo sea
defectuoso es igual a 0,08 o del 8%”.
Probabilidad y frecuencia relativa: Como vimos antes, hay una directa relación entre
probabilidad y frecuencia relativa, Si tiramos un dado n veces la frecuencia relativa del
resultado "6", por ejemplo, se asemejará a la probabilidad teórica de obtener 6, 1/6 .
En general, si un dado experimento aleatorio es repetido un número grande (n) de
veces, y consideramos cualquier evento A, vale que:
fr(a) P(A)
y más cercanos estarán ambos valores cuanto mayor sea n. En el límite (si
pudiésemos repetir la experiencia infinitas veces) diremos que fr(A) "converge" a P(A).
Esta es otra consecuencia de la Ley de los Grandes Números, mencionada más
arriba.
Repetimos pues que se presentan entonces dos enfoques para el mismo concepto. Si
queremos saber cuál es la probabilidad de obtener un 6 en el dado por ejemplo,
podríamos hacer el cociente 1/6 (probabilidad), o bien tirar el dado un número grande
de veces y dividir la cantidad de veces que salió 6 por la cantidad total de tiradas
(frecuencia relativa). Supongamos que lo tiramos 100 veces y obtenemos 10 seis.
fr(6)=0.16, mientras que P(6)= 1/6 0.17
En relación al ejemplo anterior,
“la probabilidad de que un trabajo sea defectuoso es igual a 0,08 o del 8%”.
Autor: F. Kornblit 39 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Si, al tirar el dado 100 veces, obtenemo en cambio, una frecuencia relativa
fr(6) = 0,1
p = 1/6 = 0,17
habría lugar para dos conclusiones diferentes, si queremos explicar la diferencia entre
lo observado y lo esperado:
a) podemos suponer que esa diferencia es "aleatoria", esto es, que la frecuencia
relativa resultó baja sólo por azar, y que, si repetimos la experiencia más veces,
seguramente obtendríamos resultados más similares al valor esperado
Si se nos permite ilustrar este tema con una referencia poética, citamos un texto de
Borges:
Autor: F. Kornblit 40 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
A modo de ejemplo, si sabemos que, en un proceso, la masa del 95% de las piezas
fabricadas en serie se encuentra entre 100g y 102g, pero luego de un cambio de
repuesto en la maquinaria se fabricaron dos piezas más, pesando 101,9 g y 102,0 g;
podemos preguntarnos: si tal resultado, diferente de lo anterior, fue sólo por azar, o
si el cambio de repuesto produjo alguna modificación significativa en la maquinaria.
Propiedades De La Probabilidad
La probabilidad asigna entonces un número a cada evento del espacio muestral, y
debe cumplir con las siguientes propiedades, las cuales serán útiles para la resolución
de los ejercicios próximos.
2/6 = 1 - 4/6
P( A o B ) = P(A) + P(B)
Autor: F. Kornblit 41 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
dado que los eventos {par} y {3} son excluyentes; en cambio no ocurre lo mismo con
la probabilidad de obtener {impar o menor que 3} pues el evento {impar o menor que
3} consiste en {1,2,3,5}, siendo su probabilidad igual a 4/6, mientras que
P(impar) + P(menor que 3) = 3/6 + 2/6 =5/6.
P( A y B) = P(A. P(B)
Por ejemplo la probabilidad de sacar cara las dos veces que se tiró la moneda es:
P(2 caras)
= P(cara la primera vez). P(cara la segunda vez)
= 2/4 . 2/4
= 1/4.
Autor: F. Kornblit 42 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
En símbolos:
Como las tiradas se consideran independientes (lo que sale en una tirad no influye
sobre el resultado de las demás), se puede aplicar la fórmula del producto:
P(funcionen todas) = P(la 1ª. pieza funcioe y la 2ª. pieza funcione y.........y la 30ª
pieza funcione) = 0,95 . 0,95 . 0,95...... . 0,95== 0,95 30 = 0,21 (o 21%)
Autor: F. Kornblit 43 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autoevaluación de Probabilidad:
1. En un lote de 200 tornillos hay 30 tornillos defectuosos. ¿cuál es la probabilidad
de que, al extraer un tornillo al azar, este resulte defectuoso?
2. Al realizar una encuesta a 500 clientes de una empresa de servicios, se observó
que 145 de ellos quedaron disconformes con el servicio brindado. Estimar la
probabilidad de que un nuevo cliente quede disconforme, si la empresa no toma
acciones correctivas.
3. Para estimar la calidad de un proveedor, quien entrega semanalmente lotes de
30 piezas de un producto, se tomó nota de la cantidad de piezas defectuosas
entregadas en las últimas 20 semanas:
i. 0 1 3 0 1 1 2 1 2 1
ii. 1 2 5 1 0 0 2 3 2 1
Autor: F. Kornblit 44 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
a) “Dicen que una de cada cinco personas nació en China. Estoy seguro que eso
no es posible. Yo tengo como 15 amigos, 20 parientes, Don Tito el carnicero y su
familia, la barra del club, y los González. Todos juntos son cerca de 80, y
ninguno de ellos nació en China“
Autor: F. Kornblit 45 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 46 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Para responder a estas preguntas, cada variable aleatoria está caracterizada por una
distribución de probabilidad, que asigna un valor de probabilidad a cada resultado
posible.
resultado x 1 2 3 4 5 6
probabilidad p(x) 1/6 1/6 1/6 1/6 1/6 1/6
Está claro que, como la probabilidad total debe ser siempre igual a 1, debe valer que
p(k) = 1
donde p es la distribución de probabilidad, y la suma se realiza sobre todos los
resultados posibles La distribución de probabilidad cumple un papel similar al del
histograma de la distribución poblacional cuando la población es infinita. Si tiramos un
dado un número grande de veces y realizamos el histograma correspondiente a los
resultados, éste se asemejará al gráfico de la distribución de probabilidad.
Autor: F. Kornblit 47 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
donde E(X) se lee "esperanza de X", la suma se da sobre todos los x del espacio
muestral, y p(x) es la distribución de probabilidades de la v.a. X. La esperanza de una
variable puede ser también interpretada como su valor esperado, esto es, como el
valor que esperaríamos que tome la variable antes de la realización del experimento.
En nuestro ejemplo del dado, la esperanza es:
DISTRIBUCIONES ESPECIALES
Veremos ahora algunas de las distribuciones más utilizadas en la práctica. En primer
lugar, trataremos con distribuciones discretas.
V: DISTRIBUCIÓN BINOMIAL
X » Bi (n,p)
Autor: F. Kornblit 48 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
= n.p ; ² = n.p.(1-p)
Autor: F. Kornblit 49 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
p = 8%
(En base a la experiencia previa de otras sucursales, se toma éste último como
parámetro poblacional)
Primero estimaremos, a partir de este dato, con qué frecuencia se pueden esperar
los posibles valores para el número de empleados ausentes en la nueva sucursal.
Frecuencia (x)
10
9
8
7
6
5
4
3
2
1
0 1 2 3 4 5 6 7 8 9 10 11 12
(x)
f x
fr x
n
Autor: F. Kornblit 50 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 51 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
x p(x)
0 1.5%
1 6.7%
2 14.3%
3 19.9%
4 20.4%
5 16.3%
6 10.6%
7 5.8%
8 2.7%
9 1.1%
10 0.4%
11 0.1%
12 0.0%
Autor: F. Kornblit 52 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
DISTRIBUCIÓN DE POISON
Otra distribución discreta útil es la distribución de Poison, que suele describir los
experimentos aleatorios relacionados con conteos del número de defectos en una
unidad, o el número de errores en un proceso, o el número de accidentes producidos
por unidad de tiempo, etc. La distribución de Poison , P() , responde a un parámetro,
, y la fórmula de su distribución es:
-
e .
i
p(i) = ; i = 0,1,2,3,.
i!
La esperanza de una v.a. de Poison es , y la varianza , nuevamente, es
Autor: F. Kornblit 53 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 54 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
1 x
2
f(x) = e
2. .
En el caso particular en que =0 y , la distribución correspondiente se denomina
normal standard ( N(0,1) ).
Autor: F. Kornblit 55 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Otras propiedades, que serán útiles en el Capítulo 5, son las representadas en los
gráficos siguientes
Autor: F. Kornblit 56 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 57 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
DATOS POBLACION
Es de esperar que haya un error de estimación, dado que las muestras sobre
los que se calculan los estadísticos siempre están sujetas a variaciones aleatorias.
Es por esta última razón que generalmente no alcanza con dar un valor puntual para
estimar un parámetro, sino que es conveniente dar un intervalo, un rango de valores
que, con una probabilidad alta, cubra al parámetro.
Por ejemplo, partimos de una muestra aleatoria (o sea, una muestra X 1, ..., Xn de
variables aleatorias todas ellas con distribución N queremos dar un intervalo tal
que podamos asegurar que el verdadero parámetro , poblacional, esté contenido en
ese intervalo con probabilidad 0.95 .
Partiendo de una muestra aleatoria con distribución N(), donde resulta conocida,
un intervalo de confianza para la media es:
IC( ) = X - z/2 ; X + z/2
n n
Autor: F. Kornblit 58 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
En otros casos puede ser necesario dar un intervalo de confianza para estimación de
2 o . Para esto introducimos la distribución " 2", cuyas tablas se encuentran en el
apéndice. La misma depende también de un parámetro n, llamado número de grados
de libertad, y relacionado con la precisión en la estimación de por s. A diferencia de
las distribuciones normal y t, ésta no es simétrica. El valor X2,n es aquél que deja un
área igual a a su izquierda en el gráfico de su distribución. El intervalo
correspondiente a ² es:
s
2
s
2
IC( 2 ) = (n - 1) ; (n - 1)
n -1,1-/2
2
n -1,/2
2
Autor: F. Kornblit 59 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
En primer lugar debemos formular las 2 hipótesis a ser testeadas, por ejemplo:
Hay que tener en cuenta que, como todo método basado en muestras estadísticas,
existe la posibilidad de cometer errores aleatorios en resultado del test. Reconocemos
4 posibles situaciones :
c) la concentración media real es realmente mayor que la máxima tolerada, pero, por
errores estadísticos, nuestro test nos dirá que es menor o igual.
Autor: F. Kornblit 60 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Sintéticamente:
RESULTADO DEL TEST
REALIDAD a. sin error b. error II
c. error I d. sin error
Como se ve, hay dos errores posibles. Uno de estos dos por lo general es considerado
más "grave", y será aquél que queramos controlar en lo posible. En nuestro ejemplo, el
error más "grave" será el c ("no darnos cuenta que la concentración supera la
tolerada"). Muchas veces la formulación de cuál es el error más grave es subjetiva y
no debe tomárselo en forma estricta. Por ejemplo, si un fabricante y un comprador
deciden hacer un test para chequear si determinado producto alcanza o no un
determinada característica de calidad, lo más "grave" para el fabricante será que del
test surja que no se alcanza la característica anunciada cuando en realidad sí se
alcanza, y por tanto se rechacen productos buenos; para el comprador, lo más grave
será que del test surja que se alcanza la característica esperada, cuando esto no es
cierto, y por tanto comprará productos malos.
En cualquier caso, una vez elegido el error cuyo riesgo se quiera controlar, al mismo
se le asigna el nombre "ERROR I", o "ERROR ". Al otro, al menos "grave", se lo
llama "ERROR II", o "ERROR "
Una vez nombrados los dos tipos de error, nombraremos las dos hipótesis.
Llamaremos Hipótesis Nula (H0) a la hipótesis verdadera del ERROR I. Llamaremos
Hipótesis Alternativa (Ha) a la hipótesis verdadera del ERROR II. O, en otras palabras,
ambos errores posibles pueden describirse como:
Autor: F. Kornblit 61 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
A diferencia que no es elegido al comienzo del test, sino que toma un valor de
acuerdo a la muestra tratada. Cuanto más pequeño se exija que sea mayor será
Los otros dos elementos que necesitamos para plantear un test son: el estadístico del
mismo, o sea aquel valor numérico que calcularemos a partir de la muestra, y la región
de rechazo o criterio de rechazo. El criterio de rechazo es aquella condición que
deberá cumplir el estadístico del test, para rechazar la hipótesis nula. Posiblemente
esto se aclare bastante al empezar a plantear tests en concreto.
Supongamos que tenemos una muestra aleatoria X1,..., Xn, de variables todas ellas
con distribución N(). El desvío standard es conocido, y queremos testear :
Ho:
A: vs.
Ha:
al nivel (o sea, tal que el riesgo , o probabilidad de decidir 0 cuando en realidad
0, sea ). Decíamos antes que era razonable rechazar Ho cuando el
promedio muestral es "grande", mayor que alguna cantidad límite, y aceptar Ho en
caso contrario. Esa cantidad límite se elige de manera tal, que la P(ERROR I) sea si
0. Da acá surge el criterio de rechazo que define nuestro test :
Se rechaza H 0 si : Z > z
Autor: F. Kornblit 62 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
puesto que, si 0, la media muestral tiene distribución N(n), y por tanto, Z
tiene distribución N(0,1).
Hay otras dos posibilidades para el planteo de las hipótesis. Estas son:
Ho:
B: vs.
Ha:
y
Ho:
C: vs.
Ha:
Autor: F. Kornblit 63 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
está de más decir que, en este tema, es conveniente una buena ejercitación para
refirmar los conceptos.
El caso desconocido.
Si no conocemos , usamos es estadístico T, igual que en Intervalos de Confianza,
X - 0
T =
s/ n
s
Se rechaza H 0 si : X > t ,n-1 + 0
n
El caso asintótico:
Hasta ahora hemos trabajado con muestras X1,...Xn con distribución normal. Puede
ocurrir que esto no ocurra. Pero, si n es suficientemente grande, en virtud del Teorema
Central del Límite, es posible suponer distribuciones aproximadamente normales para
los promedios, obteniendo el mismo test que anteriormente.
Tests para :
También puede ser necesario testear hipótesis sobre , como:
Ho:
A: vs.
Ha:
El criterio de rechazo para este test es: Se rechaza H 0 si : X > ,n-1 donde el valor
2
Autor: F. Kornblit 64 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
INTERVALOS DE CONFIANZA
a) Para conocido, distribución normal X z 2
n
s
b) Para desconocido, distribución normal X t 2 ,n 1
n
p 1 p
c) Para paproximación normal de la binomial) p z 2 ; p X n
n
TESTS DE HIPOTESIS
Criterios de rechazo:
X 0
T
s n
Criterios de rechazo:
A: T > tn-1
B: T < -tn-1
C: T > tn-1
Autor: F. Kornblit 65 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Criterios de rechazo:
Criterios de rechazo:
Autor: F. Kornblit 66 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Ha: 2
X1 X 2
T
1 1
sp
m n
m 1 s2x n 1 s2y
sp
m n2
Criterios de rechazo:
Criterios de rechazo:
Autor: F. Kornblit 67 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
n 1
Desviación estándar
poblacional (de una Raíz cuadrada positiva de la varianza
(sigma) poblacional
variable aleatoria)
s Desviación estándar (poblacional o muestral)
Desviación estándar de un ; asignada a la variable aleatoria obtenida como
promedio n n promedio de otras n variables aleatorias
Distribución de probabilidad de la variable
aleatoria discreta que cuenta el número de ítems
con determinado atributo, de una muestra
Distribución binomial DB(n,p) ensayada de tamaño n, cuando la probabilidad
de ocurrencia de tal atributo en la población es
igual a p. Los ensayos de los diferentes ítems
deben ser independientes
Distribución de Poison DP() Distribución de probabilidad de la variable
Autor: F. Kornblit 68 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 69 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 70 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 71 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 72 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
ocurrencia de un suceso
Promedio aritmético, valor Suma de los valores que componen una muestra
x dividida por el tamaño de la misma
medio, promedio muestral
Probabilidad de que un ítem de una población
Proporción poblacional p cumpla con determinado atributo
Diferencia entre el mayor y el menor valor de
Rango R una muestra
Probabilidad de que, por efectos aleatorios, un
Riesgo del comprador lote sea aceptado, a pesar de que su calidad es
inferior a la especificada
Probabilidad de que, por efectos aleatorios, un
Riesgo del proveedor lote sea rechazado, a pesar de que su calidad es
igual o superior a especificada
Subconjunto del espacio muestral. Hecho que
Suceso puede o no ocurrir, de acuerdo a una
determinada probabilidad
Par de sucesos que no pueden ocurrir al mismo
Sucesos excluyentes tiempo
Par de sucesos para los cuales la ocurrencia o
Sucesos independientes no de uno de ellos no afecta para nada la
probabilidad de ocurrencia del otro
Número de ítems que componen una población
Tamaño de la población N (siempre y cuando la misma no sea infinita)
Tamaño de una muestra n Número de ítems que componen una muestra
Procedimiento estadística que pretende decidir si
una determinada hipótesis acerca de la
Tests de hipótesis distribución de una población debiera ser
aceptada o rechazada
Límite probabilístico del promedio muestral,
cuando el tamaño de la muestra tiende a
Para variables aleatorias discretas, se calcula
Valor esperado de una mediante la fórmula pi xi donde pi es la
variable aleatoria
función de probabilidad puntual de la variable
(esperanza matemática, o aleatoria X evaluada en xi
valor medio poblacional) Para variables aleatorias continuas, se calcula
mediante la fórmula x f x donde f es la
función de densidad de la variable aleatoria X
Variables que pueden tomar cualquier valor en
Variables aleatorias x1,...,xn un conjunto de valores especificado y que tiene
asociada una distribución de probabilidad
Variables aleatorias que pueden tomar cualquier
Variables aleatorias
valor dentro de un intervalo de valores posibles
continuas (Ver: Datos continuos)
Variables aleatorias Variables aleatorias que sólo puede tomar
discretas valores aislados (Ver: Datos discretos)
Estimador de la varianza poblacional, calculada
Varianza muestral s2 a partir de la fórmula s 2 xi x
2
n 1
Autor: F. Kornblit 73 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
aleatoria)
Autor: F. Kornblit 74 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 75 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 76 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 77 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
90 128.3 124.1 118.1 113.1 107.6 73.3 69.1 65.6 61.8 59.2
4a.Valores críticos superiores de la Distribución F, con = 0.05 (dejan a la derecha
un área igual al 5% del total)
g.l. numerador
=0.05
1 2 3 4 5 6 7 8 9 10 15 20 30 40 50
1 161 199 216 225 230 234 237 239 241 242 246 248 250 251 252
2 199.5 19.0 9.6 6.9 5.8 5.1 4.7 4.5 4.3 4.1 3.7 3.5 3.3 3.2 3.2
3 215.7 19.2 9.3 6.6 5.4 4.8 4.3 4.1 3.9 3.7 3.3 3.1 2.9 2.8 2.8
4 224.6 19.2 9.1 6.4 5.2 4.5 4.1 3.8 3.6 3.5 3.1 2.9 2.7 2.6 2.6
5 230.2 19.3 9.0 6.3 5.1 4.4 4.0 3.7 3.5 3.3 2.9 2.7 2.5 2.4 2.4
6 234.0 19.3 8.9 6.2 5.0 4.3 3.9 3.6 3.4 3.2 2.8 2.6 2.4 2.3 2.3
7 236.8 19.4 8.9 6.1 4.9 4.2 3.8 3.5 3.3 3.1 2.7 2.5 2.3 2.2 2.2
8 238.9 19.4 8.8 6.0 4.8 4.1 3.7 3.4 3.2 3.1 2.6 2.4 2.3 2.2 2.1
9 240.5 19.4 8.8 6.0 4.8 4.1 3.7 3.4 3.2 3.0 2.6 2.4 2.2 2.1 2.1
g.l. denominador
10 241.9 19.4 8.8 6.0 4.7 4.1 3.6 3.3 3.1 3.0 2.5 2.3 2.2 2.1 2.0
11 243.0 19.4 8.8 5.9 4.7 4.0 3.6 3.3 3.1 2.9 2.5 2.3 2.1 2.0 2.0
12 243.9 19.4 8.7 5.9 4.7 4.0 3.6 3.3 3.1 2.9 2.5 2.3 2.1 2.0 2.0
13 244.7 19.4 8.7 5.9 4.7 4.0 3.6 3.3 3.0 2.9 2.4 2.2 2.1 2.0 1.9
14 245.4 19.4 8.7 5.9 4.6 4.0 3.5 3.2 3.0 2.9 2.4 2.2 2.0 1.9 1.9
15 245.9 19.4 8.7 5.9 4.6 3.9 3.5 3.2 3.0 2.8 2.4 2.2 2.0 1.9 1.9
16 246.5 19.4 8.7 5.8 4.6 3.9 3.5 3.2 3.0 2.8 2.4 2.2 2.0 1.9 1.9
17 246.9 19.4 8.7 5.8 4.6 3.9 3.5 3.2 3.0 2.8 2.4 2.2 2.0 1.9 1.8
18 247.3 19.4 8.7 5.8 4.6 3.9 3.5 3.2 3.0 2.8 2.4 2.2 2.0 1.9 1.8
19 247.7 19.4 8.7 5.8 4.6 3.9 3.5 3.2 2.9 2.8 2.3 2.1 1.9 1.9 1.8
20 248.0 19.4 8.7 5.8 4.6 3.9 3.4 3.2 2.9 2.8 2.3 2.1 1.9 1.8 1.8
30 250.1 19.5 8.6 5.7 4.5 3.8 3.4 3.1 2.9 2.7 2.2 2.0 1.8 1.7 1.7
40 251.1 19.5 8.6 5.7 4.5 3.8 3.3 3.0 2.8 2.7 2.2 2.0 1.8 1.7 1.6
50 251.8 19.5 8.6 5.7 4.4 3.8 3.3 3.0 2.8 2.6 2.2 2.0 1.8 1.7 1.6
Autor: F. Kornblit 78 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
g.l. numerador
=0.01
1 2 3 4 5 6 7 8 9 10 15 20 30 40 50
1 4052 199 216 225 230 234 237 239 241 242 246 248 250 251 252
2 98.5 19.0 19.2 19.2 19.3 19.3 19.4 19.4 19.4 19.4 19.4 19.4 19.5 19.5 19.5
3 34.1 9.6 9.3 9.1 9.0 8.9 8.9 8.8 8.8 8.8 8.7 8.7 8.6 8.6 8.6
4 21.2 6.9 6.6 6.4 6.3 6.2 6.1 6.0 6.0 6.0 5.9 5.8 5.7 5.7 5.7
5 16.3 5.8 5.4 5.2 5.1 5.0 4.9 4.8 4.8 4.7 4.6 4.6 4.5 4.5 4.4
6 13.7 5.1 4.8 4.5 4.4 4.3 4.2 4.1 4.1 4.1 3.9 3.9 3.8 3.8 3.8
7 12.2 4.7 4.3 4.1 4.0 3.9 3.8 3.7 3.7 3.6 3.5 3.4 3.4 3.3 3.3
8 11.3 4.5 4.1 3.8 3.7 3.6 3.5 3.4 3.4 3.3 3.2 3.2 3.1 3.0 3.0
9 10.6 4.3 3.9 3.6 3.5 3.4 3.3 3.2 3.2 3.1 3.0 2.9 2.9 2.8 2.8
g.l. denominador
10 10.0 4.1 3.7 3.5 3.3 3.2 3.1 3.1 3.0 3.0 2.8 2.8 2.7 2.7 2.6
11 9.6 4.0 3.6 3.4 3.2 3.1 3.0 2.9 2.9 2.9 2.7 2.6 2.6 2.5 2.5
12 9.3 3.9 3.5 3.3 3.1 3.0 2.9 2.8 2.8 2.8 2.6 2.5 2.5 2.4 2.4
13 9.1 3.8 3.4 3.2 3.0 2.9 2.8 2.8 2.7 2.7 2.5 2.5 2.4 2.3 2.3
14 8.9 3.7 3.3 3.1 3.0 2.8 2.8 2.7 2.6 2.6 2.5 2.4 2.3 2.3 2.2
15 8.7 3.7 3.3 3.1 2.9 2.8 2.7 2.6 2.6 2.5 2.4 2.3 2.2 2.2 2.2
16 8.5 3.6 3.2 3.0 2.9 2.7 2.7 2.6 2.5 2.5 2.4 2.3 2.2 2.2 2.1
17 8.4 3.6 3.2 3.0 2.8 2.7 2.6 2.5 2.5 2.4 2.3 2.2 2.1 2.1 2.1
18 8.3 3.6 3.2 2.9 2.8 2.7 2.6 2.5 2.5 2.4 2.3 2.2 2.1 2.1 2.0
19 8.2 3.5 3.1 2.9 2.7 2.6 2.5 2.5 2.4 2.4 2.2 2.2 2.1 2.0 2.0
20 8.1 3.5 3.1 2.9 2.7 2.6 2.5 2.4 2.4 2.3 2.2 2.1 2.0 2.0 2.0
30 7.6 3.3 2.9 2.7 2.5 2.4 2.3 2.3 2.2 2.2 2.0 1.9 1.8 1.8 1.8
40 7.3 3.2 2.8 2.6 2.4 2.3 2.2 2.2 2.1 2.1 1.9 1.8 1.7 1.7 1.7
50 7.2 3.2 2.8 2.6 2.4 2.3 2.2 2.1 2.1 2.0 1.9 1.8 1.7 1.6 1.6
Autor: F. Kornblit 79 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
Autor: F. Kornblit 80 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
más del 99 %?
más del 99.5 %?
3. Una cadena de hamburguesas y comida rápida está por abrir una nueva sucursal.
En base a estudios de mercado estima que serán necesarias 24 personas por turno
para cubrir todas las tareas. Por otro lado, los registros de otras sucursales indican un
porcentaje de ausentismo del 6% diario. Por lo tanto, para cubrir a los empleados
faltantes, deben contratarse algunas personas más que 24 por turno.
a) Si se contratan 25 personas por turno, ¿cuál será la probabilidad de que en un
turno cualquiera no se cubran las tareas necesarias?
b) Ídem, si se contratan a 26, 27, ..., 30 empleados por turno. ¿cuántos empleados
deberán contratarse para cumplir el objetivo de que sólo un día laborable por
mes no puedan cubrirse las tareas necesarias?(1 mes = 20 días laborables)
4. Dado que no todos los pasajeros de una aerolínea abordan el vuelo que han
reservado, la aerolínea vende 125 boletos para un vuelo de 120 asientos. Se sabe que
la probabilidad de que un pasajero no aborde el vuelo es de 0,10 y el comportamiento
es independiente.
a) ¿Cuál es la probabilidad de que todos los pasajeros quieran abordar el vuelo?
a) ¿Cuál es la probabilidad de que el vuelo quede vacío?
6. Si el número de baches en una ruta se toma como una variable aleatoria con media
de 2 baches por kilómetro:
a) Calcular la probabilidad de que no haya baches en un tramo de 5 km
b) Calcular la probabilidad de que haya al menos un bache en un tramo de 0,5 km.
7. En función de registros anteriores, se sabe que, en cierto tipo de tela, aparece una
media de 2 defectos de hilado por m2 de tela (se asume distribución de Poisson). Si
se inspecciona una muestra de 8 m2 de tela, ¿cuál será la probabilidad encontrar más
de 15 defectos en esa muestra? ¿y más de 20?
Autor: F. Kornblit 81 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
µ % NC (aproximado)
proveedor
(mm) (mm) inferior superior Total
A 5,600 0,005
B 5,85 0,05
C 5,8 0,1
9. Un proveedor entrega una determinada materia prima en paquetes. Por contrato, los
paquetes deben pesar más de 650 g . Sin embargo, el peso de cada paquete es una
variable aleatoria normal con µ = 656,5 g, y 2,5 g. Para una inspección de
recepción, se extraen 50 paquetes, si 48 o más de ellos cumplen con la especificación
prevista en el contrato, se acepta el envío. Calcular la probabilidad de que esto ocurra.
10. El peso neto de cereal una caja sigue una DN con µ= 600 g. El proceso de llenado
de cajas debe ser diseñado para que sólo una caja de cada 100 quede fuera del
intervalo 590 g - 610 g ¿Cuál deberá ser el del proceso para alcanzar este objetivo?
11. a) Las tolerancias de un proceso son 1.500 0.005 . Un estudio basado en gran
cantidad de datos de ese proceso informó una media µ=1.502 y una desviación
estándar de =0.002 . ¿cuál será la fracción defectuosa del proceso, suponiendo
distribución normal?
b) Si es posible corregir el centrado del proceso, poniendo a punto la máquina, ¿cuál
será ahora la fracción defectuosa del proceso?
c) Un estudio de capacidad de 4 máquinas similares arroja los siguientes resultados:
Máquina µ
1 1,4950 0,0006
2 1,5021 0,0012
3 1,5000 0,0020
4 1,4979 0,0020
Ordenar las máquinas de peor a mejor, en el caso de que sea posible corregir el
centrado, y en el caso de que no lo sea.
12. En la fabricación de una alfombra se usa una fibra con una resistencia a la tracción
Autor: F. Kornblit 82 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
que tiene una distribución normal con media 75,5 psi y desviación estándar 3,5 psi.
Encuentre la probabilidad de que en una muestra aleatoria de n = 6, la media de la
resistencia a la tracción sea mayor que 75, 75 psi.
¿Cómo cambia la desviación estándar de la media muestral si el tamaño de la muestra
pasa a n = 49?
15. Se desea dar un intervalo de confianza del 95% para el diámetro exterior de un
cierto tipo de roscas.
a) Si una muestra de 10 roscas presenta un diámetro promedio de 257 mm, y una
desviación estándar de 12 mm, ¿qué límites tiene el intervalo? ¿Qué suposición
estadística debe hacerse sobre los diámetros individuales de las roscas?
b) Si en lugar de utilizar la desviación estándar de la muestra dada se utiliza un valor
histórico de = 13 mm como desvío estándar de los diámetros, ¿cómo cambia el
intervalo?
Autor: F. Kornblit 83 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
17. Para llenar recipientes con un determinado producto líquido, se utiliza una máquina
llenadora. Se elige una muestra 10 recipientes, obteniendo un volumen de llenado
promedio de 1,026 litros. Si la desviación estándar histórica del proceso de llenado es
0,06 litros, obtener un intervalo de confianza para la media del proceso, y deducir si es
necesario tomar la decisión de ajustar la máquina llenadora.
18. Contestar si es V o F
a. Al aumentar el nivel de confianza de un intervalo, disminuye la precisión
b. Para duplicar la precisión de un intervalo de confianza para µ del 90%, hay que
duplicar el tamaño de la muestra.
c. (7.38 ; 8.21) es un intervalo de confianza del 95% para la media µ de un proceso.
Esto significa que el 95% de las mediciones realizadas están entre estos valores.
d. (7.38 ; 8.21) es un intervalo de confianza del 95% para la media µ de un proceso.
Esto significa que la probabilidad de que µ esté entre 7.38 y 8.21 es del 95% .
e. Si se repite 100 veces el proceso de estimación de la media µ de un proceso, por
intervalos de confianza del 95%, en aproximadamente 95 de las repeticiones el
intervalo obtenido cubre a µ.
f. Un intervalo de confianza puede ser utilizado para decidir si una determinada
característica de calidad se aparta significativamente de una especificación.
19. Un fabricante de tubos de gas afirma que la longitud de sus tubos tiene una
desviación estándar de 0.04 m. Un cliente que dispone de 7 tubos comprados a ese
fabricante, decide medirlos y obtiene una desviación estándar muestral de 0.054 m.
¿Alcanzan estos datos para refutar la afirmación del fabricante, al nivel 0.05? ¿y al
nivel 0.10? (suponer distribución normal)
22 a).Un posible comprador desea, antes de efectuar la compra de fibras que serán
Autor: F. Kornblit 84 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
24.a) Según una especificación, el valor medio de un proceso no debe bajar de 120.
Ante la sospecha de un posible descenso en ese valor medio, se quiere justificar
adecuadamente la decisión de ajustarlo, con un nivel del 5%. Para esto, se mide una
muestra de n =10 unidades, obteniendo un promedio de 119,6, con una desviación
estándar muestral de 1 ¿está debidamente justificada la decisión de ajustar la media
del proceso?
b) Repetir la respuesta anterior si la muestra tomada fue de n =36 unidades, habiendo
obtenido un promedio de 119,6, con una desviación estándar muestral de 1
Autor: F. Kornblit 85 / 86
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
APÉNDICE V. BIBLIOGRAFIA
Autor: F. Kornblit 86 / 86