Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Apunte Modelamiento Probabilistico en I.M.

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 99

Universidad Técnica Federico Santa María Renato Allende Olivares

Ingeniería de Mantenimiento Humberto Villalobos Torres


Probabilidad y Estadística

2. I NTRODUCCIÓN
En un mundo orientado a la globalización, se presentan - segundo a segundo -
millones de datos que desean ser interpretados. La estadística es una ciencia que nos
permite pensar en forma clara y disciplinada, y ofrece diversas técnicas, cuya correcta
aplicación, reduce la complejidad presente en los datos, para que estos puedan ser
interpretados.

El presente apunte está orientado a un conjunto de técnicas de análisis


estadístico. En su primer módulo está destinado a reconocer las raíces mismas del
dato, características de éste, cómo y cuántos datos obtener para poder obtener
conclusiones científicamente válidas.

En el segundo y tercer módulo, se enfatiza el análisis exploratorio de datos


como un primer paso en todo resumen de datos, utilizando para ello la disponibilidad
de ordenadores, software estadístico con posibilidades de representación gráfica y
tratamiento conjunto de datos multivariados.

Las posibilidades didácticas del análisis exploratorio de datos se deben


principalmente: sencillez del aparato matemático requerido, importancia dada hoy día
en estadística a los sistemas de representación múltiple, las conexiones de carácter
transversal en todas las áreas del quehacer humano, el trabajo en equipo y la
posibilidad de desarrollo de proyectos por parte de los profesionales que requieren de
información para sus proyecciones futuras.

A partir del tercer módulo, con la experiencia y visión obtenida en los


módulos anteriores, se comienza a presentar medidas de probabilidad, para luego
mostrar modelos que habitualmente se utilizan en ingeniería y los elementos
esenciales de inferencia estadística.

1
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

3. PRIMER MÓDULO
3.1 Proceso de Medición

En todo ámbito de la vida del hombre, constantemente los medios de


comunicación invaden las percepciones de la gente con todo tipo de indicadores, tales
como: cantidad de libros que en promedio leen alumnos de enseñanza media,
porcentaje de mujeres que sufren de maltrato psicológico, variaciones de precios
(IPC), índices de delincuencia o seguridad ciudadana, niveles de aceptación respecto
a la gestión realizado por funcionarios públicos, etc.

En la empresa, estos indicadores han surgido como un eficaz medio para


evaluar y controlar su desempeño, en fenómenos que a juicio de los ejecutivos son de
interés para la viabilidad de ésta, es así como, en empresas productivas el porcentaje
de bienes defectuosos son un indicador importante, mientras que en empresas de
servicio, el número promedio de reclamos, son un indicador del buen o mal servicio
que se está prestando.

Todos estos indicadores que irrumpen en la vida, son producto de mediciones


realizadas con algún instrumento. Sin embargo, el concepto mismo – medición – ha
sido apartado de los indicadores, dando por hecho que éstos son un reflejo puro de la
realidad, en el instante donde se produce la medición, lo cual puede considerarse
como un ideal, pero no necesariamente real..

No se puede administrar lo que no se mide, las mediciones son la clave. Si no


se puede medir, no se puede controlar. si no se puede controlar, no puede gestionar.
Si no puede gestionar, no es posible mejorarlo. La falta sistemática o ausencia
estructural de estadísticas en cualquier organización impide una adecuada
administración de las mismas.

Es lamentable que la colección de datos en las áreas de mantenimiento


sea débil en muchas empresas, esto no permite contar con información adecuada para
la toma de decisiones y genera en los profesionales del área la sensación que no se
requiere y que para ser un buen mantenedor basta solo con ser asertivo.

Dirigir sólo en base a una revisión parcial de los datos, tomar decisiones
basadas más en la intuición o en simples extrapolaciones, y tomar decisiones
desconociendo las probabilidades de éxito u ocurrencia, son sólo algunos de los
problemas o inconvenientes más comunes hallados actualmente en cualquier empresa
y más aun en el ámbito del mantenimiento.

Es por esta razón, que en general, se debe tener claro la selección y diseño de
la técnica de medición, para estar seguro de que estas mediciones sean eficientes para
cumplir con el objetivo de aclarar el suceso, hecho u objeto bajo estudio , con
limitaciones propias de la relación propuesta entre el mundo empírico y el mundo
abstracto.

2
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

La medición es la asignación de símbolos (números) a sucesos, hechos u


objetos del mundo empírico, sobre la base de reglas y procedimientos.

Características de las Mediciones

Nuestro sistema numérico está compuesto por los dígitos : 0, 1, 2, 3, 4, 5, 6,


7, 8, 9; que tienen básicamente cuatro propiedades esenciales que permiten definir
las siguientes escalas de medición.

Tipos de Escala

Escala Nominal.- Es aquella en que los números sirven solamente como etiqueta para
catalogar o identificar los objetos o sucesos.

Ejemplos: Regiones, Comunas, Marcas, Tipos de almacenes, sexo, etc.

En clasificaciones nominales no se puede establecer prioridad alguna de las


categorías asignadas. Una proporción importante de variables de mercadeo requiere
una medición en escala nominal, en situaciones tales como medir: marcas, tipos de
almacenes, tipos de clientes, etc.

Escala Ordinal.- Además de lo anterior, define una relación ordenada entre los
sucesos y/o objetos que comprenden la característica de orden. En este tipo de escala,
se mide si hay más o menos de la característica, en relación con los otros objetos.
Ejemplo: Aptitudes, preferencias, etc.
Grupo Social; 1 Bajo, 2 Medio, 3 Alto. No se puede decir que 2 es el
doble de 1, sólo que 2 tiene más que 1.
En este nivel tienen sentido los conceptos del conteo de elementos, de tal
forma que, ordenados puedan ir acumulando, lo que da origen a medidas de posición
basadas en los llamados "cuantiles" o clase cuantil. A modo de ejemplo, un quintil
divide la población en cinco segmentos, de tal forma que bajo un quintil especifico se
encuentra un porcentaje conocido de datos observados..

Escala Intervalar.- Además de todo lo anterior, comprende la utilización de los


números para clasificar objetos o sucesos de manera que la distancia entre los
números corresponde a la distancia entre los objetos o sucesos en relación con la
característica que se está midiendo.
Ejemplo:
- Escala de temperatura (ºC, ºF);
0 ºC → punto de congelación del agua ← 32 ºF.
- Números índices; IPC, IPM, PIB, etc.
Las mediciones en esta escala, poseen todas las propiedades de la escala
ordinal, además de la característica de igual diferencia propia del sistema numérico.

3
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Escala de Razón.- Tiene todas las propiedades de la escala de intervalos, además del
cero absoluto. En esta escala sólo se puede asignar arbitrariamente la unidad de
medición o distancia, pues una vez determinado este número, se establecen
completamente las asignaciones numéricas restantes.

Ejemplo:
- Ventas → pesos, dólares, etc.
- Estatura → unidad
- Peso → unidad

Además de la clasificación de las mediciones según escala, que es una


característica propia del dato, éste también puede ser clasificado como un dato
cualitativo ó cuantitativo. Los datos cualitativos, se asocian siempre a datos cuya
medición sea en escala nominal u ordinal, mientras que los datos cuantitativos, se
relacionan siempre a datos cuya medición sea en escala intervalar o de razón, ya sean
discretos o continuos.

Diagrama de escalas de medida

4
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

3.2 Estadística y Ciencia

De la gran variedad de procedimientos científicos, vinculados a distintas


técnicas de metodología de investigación se pueden destacar puntos esenciales en
común, que son:

1. Revisión de los hechos y teorías propuestas.

2. Formulación de hipótesis sujetas a pruebas.


3. Evaluación objetiva de las hipótesis y conclusiones.

Las respuestas a interrogantes relacionadas con el problema a investigar, por


lo general, se hacen mediante una descripción de; las relaciones, los hechos, los
procesos relacionados del problema.

La Estadística, se ocupa de los métodos y procedimientos para recoger,


clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la
variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de
realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de
decisiones y en su caso formular predicciones.

3.3 Introducción al Muestreo

Los métodos o técnicas de muestreo son un pilar fundamental dentro de los


métodos estadísticos, ya que dependiendo del tipo problema, el escoger una adecuada
técnica de muestreo es resolver parte importante del problema.

Las técnicas de muestreo se preocupan de la selección de muestras de una


población bajo estudio y de las estimaciones de las características poblacionales de
interés en la forma más confiable y al más bajo costo posible.

La forma como se escogen las unidades muestrales permiten clasificar los


métodos de muestreo en: Muestras científicas ó probabilística y Muestras no
probabilísticas.

Muestreo no Probabilístico: Es el típico muestreo que se realiza a la salida de un


centro comercial, salida o ingreso del metro, en una esquina de una calle, etc., en
donde los resultados obtenidos sólo representan el pensamiento de los encuestados,
pero no necesariamente el de la población en estudio.

5
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

• Muestreo Probabilístico: La aleatorización es vital, pues, las


inferencias que se realicen abarcarán al comportamiento de la
población total. Es por ello, que una mala aleatorización o el no
cumplimiento de lo establecido por la aleatorización, puede llevar a
obtener conclusiones erróneas, al considerarse estas muestras como
sesgadas. En este muestreo cada uno de los elementos de la
población de interés, o población objeto, tiene una probabilidad
conocida, y frecuentemente igual, de ser elegido en la muestra.

Encuesta Opinión Pública


• ¿Está el comercio regional
deprimido?
1. Salida Mall
2. Calle

Figura 2.4 Las encuesta de opinión pública son por lo general aleatorias

En el muestreo probabilístico se utilizan básicamente cinco técnicas de


muestreo:
1. Muestreo Aleatorio Simple (m.a.s.).
2. Muestreo Aleatorio Sistemático (m.a.st.).
3. Muestreo Aleatorio Estratificado (m.a.e.).
4. Muestreo Aleatorio por Conglomerado (m.a.c.).
5. Muestreo Aleatorio Multietápico o con Sub-Muestreo (m.a.pe).

La elección de una técnica de muestreo, se basa en el grado de conocimiento


que se tenga del comportamiento de la característica de interés dentro de la población
objetivo, el grado de precisión que se desea obtener en los estimadores utilizados,
costos asociados a su aplicación, etc.,.

6
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

3.3.1 Tipos de Muestreos

Muestreo aleatorio simple, también llamado muestreo al azar irrestricto, los


elementos se escogen al azar de la totalidad de la población, es decir, se escogen sin
ningún privilegio y cada uno posee la misma probabilidad de formar parte de la
muestra en cada una de las posibles muestras.

A modo de ejemplo: Es recomendado cuando la característica de interés se


encuentra distribuida de forma homogénea dentro de los elementos de la población,
como se muestra en la Figura 2.5.

Figura 2.5 Representación esquemática del muestreo aleatorio simple.

La selección al azar es similar a la que se realiza en la extracción aleatoria de


números en una lotería. Sin embargo, en el muestreo estadístico, por lo general se
utiliza un programa computarizado de números aleatorios o un generador de
números aleatorios para identificar los elementos numerados de la población que se
eligen para la muestra.

Muestreo aleatorio sistemático, es un plan de muestreo al azar, en la cual se


eligen los elementos de la población a intervalos uniformes, a partir de un listado, tal
como elegir cada k-ésimo elemento después de un arranque aleatorio.

Eesquemáticamente se puede visualizar como; de una población de ‘N’


elementos, se desea obtener una muestra de ‘n’ elementos, entonces la cantidad de
intervalos o grupos ‘k’, en que se divide la población, está dada por k = N / n. Luego
del primer grupo de k elementos se escoge un elemento al azar, mientras que los n – 1
elementos faltantes en la muestras, se escogen a intervalos regulares de k elementos,
después del primer escogido, como se muestra en la Figura 2.6.

1 .… r …. k 1 …. r …. k … 1 …. r …. k … 1 …. r …. k
1… k+1… (g – 1)k + 1 … (n – 1)k + 1 …
…k … 2k (g – 1)k + k … nk = N
1 2 … g n
Figura 2.6: Esquematización Muestreo Aleatorio Sistemático

7
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Las principales razones por la que utiliza el muestreo sistemático, es: su


sencilla aplicación y supervisión., a prueba de errores y flexible

Este plan de muestreo presenta falencias, que aunque son superables,


presentan molestias en su aplicación, como por ejemplo, que el tamaño de población
‘N’ no sea múltiplo de ‘k’, que la lista de la población puede tener muchos elementos
blancos o extraños, también puede presentar errores sistemáticos, producto que el
azar sólo se encuentra en la selección de la primera muestra y puede existir un factor
periódico o cíclico en la lista de la población que pudiera conducir a un error
sistemático en los resultados muéstrales,etc.

Muestreo aleatorio estratificado, la característica que se está midiendo en la


población objetivo, presenta mucha dispersión y se distinguen estratos o grupos en
ésta, por lo tanto, lo primero que se debe hacer es estratificar los elementos de la
población en grupos separados y excluyentes de acuerdo al comportamiento que
presenta la característica dentro de estos grupos.
Posterior a la estratificación, se obtiene por separado una muestra aleatoria
simple o sistemática de cada estrato. Por lo general el tamaño de la muestra que se
requiere para lograr un determinado nivel de precisión en el muestreo estratificado es
menor que con muestreo aleatorio simple, con la consiguiente reducción en los costos
del muestreo.
En términos generales, se puede distinguir las siguientes etapas:
1. Dividir los elementos de la población en las subpoblaciones distintas que
llamamos estratos.
2. Dentro de cada estrato se selecciona una muestra separada a partir de
todas las unidades distintas que componen ese estrato.

Figura 2.7 Representación esquemática del muestreo aleatorio estratificado.

8
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Muestreo aleatorio por conglomerados, es un muestreo aleatorio en el cual la


unidad de muestreo, que es la unidad de selección, contiene más de un elemento de la
población, por lo tanto la unidad de muestreo es un grupo de elementos también
llamados conglomerados. En este caso cada elemento de la población debe estar
identificado unívocamente con una, y sólo una, unidad de muestreo.

En la aplicación de este tipo de muestreo, lo habitual es que los elementos de


la población se agrupan en forma natural en subgrupos de tal manera que forman una
masa que es difícil descomponer ó no se puede acceder directamente a ellos. Así, se
eligen al azar en primer lugar los conglomerados, y luego los elementos dentro de
éste. Una manera de esquematizar este plan de muestreo, se muestra en la Figura 2.8,
donde se pueden observar que existen conjuntos de elementos, difíciles de separar.

Figura 2.8 Representación esquemática del muestreo aleatorio por conglomerados.

La selección de conglomerados en primer lugar y de elementos dentro de éstos


conglomerados, requiere de dos etapas de selección, aunque puede extenderse
rápidamente a más etapas, es conocido como muestrea aleatorio polietápico, que
consiste en una jerarquía de diferentes tipo de unidades; cada unidad de primera etapa
se divide, o es potencialmente divisible, en unidades de segunda etapa, etc. Las
unidades de muestreo de la primera etapa se llaman unidades de muestreos primarias,
mientras que en las etapas siguientes se llaman de segunda Etapa,, tercera Etapa, etc.

9
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

4. SEGUNDO MÓDULO
4.1 Resumen de Datos

En estadística descriptiva, a partir de un conjunto de datos, se busca encontrar


resumes sencillos, que permitan visualizar las características esenciales de éstos.

En el resumen de datos se siguen dos enfoques: el primero, más orientado al


análisis exploratorio de datos, con un conjunto de técnicas encaminadas a la
visualización de los datos mediante tablas o gráficos que permitan realizar un
diagnóstico de ellos; el segundo desarrolla un conjunto de indicadores descriptivos de
diversas características importantes de los datos, cuyo fin es complementar el
diagnóstico de éstos.

4.2 Organización de Datos

La organización de datos trata de acomodar éstos, para que puedan revelar sus
características informativas fundamentales y de esta manera simplificar los análisis
para la obtención de conclusiones.

Una manera de acomodar los datos es construir un arreglo ordenado; esto es,
organizando los datos con un orden natural- cuando la escala de medición lo permite.

Si el número de datos es grande, el arreglo puede ser difícil de manejar y poco


útil en cuanto a la información que pueda entregar; por eso a menudo se utilizan
tablas de frecuencia como una primera aproximación general a la organización de
datos.

4.2.1 Tablas de Frecuencia

Las respuestas observadas en la población (muestra), se denominaran clases,


las cuales se simbolizan por: C1, C2,..., Ck, donde k es la cantidad de categorías
(respuestas) distintas. En la construcción de tablas se utilizan las clases junto con dos
frecuencias asociadas a éstas, estas son:

Frecuencia Absoluta: Se llama frecuencia absoluta de la clase Ci, al número de


elementos en la población (muestra) que pertenecen a la clase Ci. Este número lo
denotaremos por ni y cumplen la propiedad:
k

∑n = n
i =1
i

10
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Frecuencia Relativa: Se llama frecuencia relativa de la clase Ci, a la cantidad de


elementos en la población (muestra) que pertenecen a la clase Ci, relativo al total de
elementos en la población (muestra).Este número lo denotaremos por fi y cumplen la
propiedad:
k k

∑f ∑
n ni
fi = i ⇒ i = = 1.0
n n
i =1 i =1

APLICACIÓN 4.1 En la fabricación de cremas para manos influyen una serie de


factores en su calidad, como: densidad de la crema, viscosidad de la crema, etc.
Mediante un proceso de batch o lotes, se producen cuatro tipos de cremas, que varían
según su calidad. Los datos representan aquellos tipos de crema que han vuelto a ser
procesada por no cumplir el estándar de su respectiva crema en muestreos de su lote.

Humectante Económica Nocturna Humectante


Humectante Económica Económica Nocturna
Aceite de Emú Humectante Nocturna Económica
Humectante Económica Nocturna Aceite de Emú
Económica Nocturna Aceite de Emú Económica
Económica Humectante Económica Humectante
Nocturna Humectante Económica Humectante
Aceite de Emú Humectante Humectante Humectante

Tabla 4.1 Frecuencias de lotes reprocesados según el tipo de crema

Tipo de Crema Frecuencias Absoluta Frecuencias Relativa


Económica 10 31,25%
Aceite de Emú 4 12,50%
Humectante 12 37,50%
Nocturna 6 18,75%

Estas dos frecuencias asociadas a la organización (resumen) de datos son


comunes e independientes de la escala de medición , es lo mínimo que una tabla de
frecuencia puede tener, sin embargo, cuando se trabaja con datos en escala al menos
ordinal, se pueden agregar otras frecuencias adicionales, a saber:

Frecuencia Absoluta Acumulada: Se llama frecuencia absoluta acumulada hasta la


clase Ci, al número total de elementos en la población (muestra) que pertenecen a las
clases C1, C2,..., Ci. Este número lo denotaremos por Ni y cumplen la propiedad:
i
Ni = n1 + n2 +... + ni = ∑n
j =1
j , j = 1, 2,..., i, i = 1, 2,..., k

Nk = n1 + n2 +... + ni +... + nk = n

11
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Frecuencia Relativa Acumulada: Se llama frecuencia relativa acumulada hasta la


clase Ci, a la cantidad de elementos en la población (muestra) que pertenecen a las
clases C1, C2, ... , Ci, con respecto al total de elementos en la población (muestra).
Este número lo denotaremos por Fi y cumplen la propiedad:
i
Fi = f1 + f2 +... + fi = ∑f
j =1
j , j = 1, 2,..., i, i = 1, 2,..., k

Fk = f1 + f2 + ... + fi + ... + fk = 1.0

APLICACIÓN 4.2 En un conjunto de clientes, el interés es determinar la


clasificación de éstos según su cumplimiento en el pago. Estos son clasificados
como: Malos (M), Regulares (R), Buenos (B) y excelentes (E). Los datos son:

B R B E E E M B E R
R M M R R M R B B B
B B E B B B E B E R
E M B B E B B B B B
M R M B B B B E M R

Tabla 4.2 Clasificación de clientes por su cumplimiento en el pago.

Frecuencias Frecuencias Acumuladas


Clasificación Absoluta Relativa Absoluta Relativa
Malo 8 16% 8 16%
Regular 9 18% 17 34%
Buenos 23 46% 40 80%
Excelentes 10 20% 50 100%

Las aplicaciones anteriores están orientadas a la organización de variables


cualitativas, en una primera aplicación en datos nominales, y en un segundo caso, a
datos en escala ordinal. Sin embargo, estos mismos conceptos pueden ser aplicados a
variables discretas, siempre que en número de datos tomando distintos valores no sea
excesivamente grande.

APLICACIÓN 4.3 Suponga que en un conjunto de clientes, el interés es determinar el


número de veces que éstos se han atrasado en el pago de su cuenta. Los datos son los
siguientes:
0 0 2 4 4 7 0 1 4 0 0 0 0 0 0
0 0 0 2 0 0 0 4 1 1 0 7 3 8 0
7 0 3 3 7 1 0 3 0 3 0 0 0 0 1
2 0 8 0 0 0 4 0 0 3 2 3 3 0 0

12
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Tabla 4.3 Número de veces que clientes se han atrasado en el pago de su cuenta.
Número de Frecuencias Frecuencias Acumuladas
Atrasos Absoluta Relativa Absoluta Relativa
0 32 53,4% 32 53,4%
1 5 8,3% 37 61,7%
2 4 6,7% 41 68,4%
3 8 13,3% 49 81,7%
4 5 8,3% 54 90,0%
5 0 0,0% 54 90,0%
6 0 0,0% 54 90,0%
7 4 6,7% 58 96,7%
8 2 3,3% 60 100,0%

En variables continuas, la organización de datos es un poco más compleja, se


dividen los datos en k grupos o segmentos disjuntos, como se muestra Figura 4.1.
Estos grupos representan las clases y se determina la frecuencia de datos asociado a
cada grupo, conformando una tabla de frecuencia agrupada.

Figura 4.1 Segmentación en grupos de datos continuos.

En este tipo de datos las clases están compuestas por intervalos, luego es
necesario buscar un representante de la frecuencia asociada a este intervalo, el cual se
conoce como marca de clase. Es común utilizar como marca de clase al valor medio
del segmento (intervalo). En la construcción de una tabla de frecuencia, lo primero
que se tiene que tener claro es la cantidad de segmentos (intervalos) a considerar.

Habitualmente, la regla de Sturges, k = 1 + 3,3 log(n), es utilizada para


establecer la cantidad de clases iniciales, las cuales pueden modificarse, si por la
estructura de los datos resulta poco informativa, generando tablas de frecuencia de
distinta amplitud.

Los siguientes límites se obtienen sumando la amplitud hasta completar las k


clases a utilizar. La tabla de frecuencia genérica resultante queda:

13
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Tabla 4.4 Tabla de frecuencia genérica.


Frecuencias Frecuencia Acumulada
Clases Absoluta Relativa Absoluta Relativa
[ LI1 − LS1 [ n1 f1 N1 F1
[ LI2 − LS2 [ n2 f2 N2 F2
[ LI3 − LS3 [ n3 f3 N3 F3
….

….

….

….

….
[ LIk − LSk ] nk fk Nk Fk

APLICACIÓN 4.4 Suponga que los datos representan tiempos de espera (en
segundos) para la atención de clientes.

Tiempos (Segundos)
47 43 33 52 70 24 55 48 52 52 49 47
34 48 42 57 65 45 48 63 54 54 46 55
55 65 36 47 66 51 39 11 44 44 45 44
53 45 44 43 56 59 56 54 23 23 32 49
55 49 57 57 55 46 42 52 56 56 42 53
61 46 53 57 54 49 49 45 36 36 47 52
25 66 44 54 52 41 54 54 57 57 45 46
42 54 70 41 49 51 44 52 58 58 44
55 70 34 68 29 36 52 32 45 45 52
52 57 41 39 42 37 43 35 38 57 69

A través de un procedimiento de conteo de los datos que se encuentre en cada


uno de los intervalos se establecen las frecuencias. Este procedimiento es
extremadamente rápido mediante la utilización de algún software.

Tabla 4.5 Tiempo de espera antes de ser atendido.


Frecuencia Frecuencia Acumulada
Marca
Tiempos (seg.) Absoluta Relativa Absoluta Relativa
de Clase
[ 10,4 − 19,0 [ 14,7 1 0,85% 1 0,85%
[ 19,0 − 27,6 [ 23,3 4 3,42% 5 4,27%
[ 27,6 − 36,2 [ 31,9 11 9,40% 16 13,67%
[ 36,2 − 44,8 [ 40,5 22 18,80% 38 32,47%
[ 44,8 − 53,4 [ 49,1 39 33,33% 77 65,80%
[ 53,4 − 62,0 [ 57,7 30 25,64% 107 91,44%
[ 62,0 − 70,6 ] 66,3 10 8,56% 117 100,00%

14
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

4.2.1 Gráficos

Un gráfico es otra forma de representar y resumir datos, en el gráfico se


pueden se hacer evidentes ciertas características que en una tabla de frecuencias
pueden pasar inadvertidas.
La representación gráfica de los datos ha logrado un uso creciente en los
medios de comunicación y eso se debe en gran parte, a la popularidad y uso de
software con amplias representaciones gráficas.

Gráficos de barras y la gráfica de pastel (circular), son los gráficos más


comunes y sencillos, usualmente utilizados en datos categóricos. Cuando los datos se
presentan en escala nominal, la secuencia en que se presentan las clases es totalmente
arbitraria, sin embargo, cuando los datos se presentan en escala ordinal, las clases
deben mantener el orden de la escala. A continuación se presentan dos aplicaciones
que exponen una serie de gráficos y variaciones de estos.
APLICACIÓN 4.6 La tabla muestra la proporción de clientes asociados sector de
ubicación.

Tabla 4.6 Sector de ubicación del cliente.


Sector 1 2 3 4 5 6
Proporción (%) 10% 15% 40% 20% 10% 5%

Sector de Cliente Sector de Cliente


6 5%
40%
5 10%
Porcentaje

1 10%
Sector

20%
15% 2 15%
10% 10%
5% 4 20%

3 40%
1 2 3 4 5 6
Sector Porcentaje

Figura 4.3: Gráficas de barra asociada de ubicación del cliente.

Las gráficas de barras anteriores son dos variantes, la primera (de izquierda a
derecha), es un gráfico de barra habitual donde se sigue la secuencia del sector, en la
segunda forma, ahora escrito en el eje de las abscisas, se escriben los sectores de
acuerdo a su importancia relativa.

Los gráficos circulares, son otra opción para los datos anteriores, En estos
gráficos, el más común es el primero (de izquierda a derecha), por su sencillez y fácil
interpretación, sin embargo, particularmente en periódicos de economía y negocios se
ha popularizado el segundo, por su atractivo visual.

15
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Sector de Cliente
Sector de Cliente
5%
10% 1 14% 19%
28% 2 10%
3
14%
4 24%
5%
5 28%
6
1 2 3 4 5 6
19%
24%

Figura 4.4: Gráficas circulares asociadas al sector del cliente

APLICACIÓN 4.7 Suponga que estamos interesados en el grado de satisfacción de


los clientes con respecto a los servicios adicionales que presta la empresa. En este
caso a una muestra de 77 clientes se les pide que califiquen el grado de satisfacción
como: Insatisfecho (I), Indiferente (II), Normal (N), Satisfecho con reparos (SR) y
Totalmente Satisfecho (TS). Los datos son:

Tabla 4.7 Grado de satisfacción por servicios adicionales de la empresa.


Frecuencia
Grado Absoluta Absoluta Acumulada
Insatisfecho (I) 19 19
Indiferente (II) 21 40
Normal (N) 33 73
Satisfecho con Reparos (SR) 2 75
Totalmente Satisfecho (STS) 4 77

En la Figura 4.5, se muestran dos gráficas asociadas, para cuando la variable


bajo estudio está en escala ordinal, razón por la cuál, existe un orden en la
distribución del grado de satisfacción.

Grado de Satisfacción Grado de Satisfacción


TS 4
3% 5%
SR 2 24%
I
N 33
II
II 21
N
I 19 41% SR
TS
0 10 20 30 40
27%
Frecuencia

Figura 4.5: Gráficas circulares asociadas al sector del cliente.

16
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

En la representación gráfica de tablas de frecuencia de datos cuantitativos


(continuos), existen dos gráficos habituales. El primero, los constituye el histograma
de frecuencia junto con el polígono de frecuencia; el segundo, lo constituye gráfica de
frecuencias acumuladas junto con la ojiva. Se muestra a continuación estas graficas
para los datos de tiempos de espera (Tabla 4.5)

H isto grama d e F recuencia


50

40
Frecuencia

30

20

10

0
10,4 -19,0 19,0 - 27,6 27,6 - 36,2 36,2 - 44,8 44,8 - 53,4 53,4 - 62,0 62,0 - 70,6

Tie m pos [s e g .]

Figura 4.6: Histograma de frecuencia y polígono de frecuencia para tiempos de espera.

Polígono de Frecuencia
Frecuencia Acumulada
120

100
80
Frecuencia

60
Ojiva
40
20

0
10,4 -19,0 19,0 - 27,6 27,6 - 36,2 36,2 - 44,8 44,8 - 53,4 53,4 - 62,0 62,0 - 70,6

Tiempos [s eg.]

Figura 4.7: Gráfica de frecuencia acumulada y ojiva para los tiempos de espera

17
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

4.3 Medidas de Desempeño

Los indicadores de desempeño han adquirido gran importancia a partir del


establecimiento de la filosofía de gestión, calidad total y la aplicación de normas
nacionales o internacionales. Son herramientas para la evaluación de la gestión, que
proveen valores de referencia con el cual se puedan comparar o proponer metas.

Las medidas de desempeño son otro medio con el cual se resumen los datos,
ya que a través de ellos se establece una medida resumen de alguna particularidad en
los datos. Estos indicadores se dividen en tres tipos: medidas de posición, resumen de
los datos que representa un lugar definido importante dentro de ellos; medidas de
variabilidad o riesgo, que como se podrá apreciar son muy importantes ;y medidas de
forma, que tienen una importante relación con un grupo de medidas de posición.

4.3.1 Medidas de Posición

Una medida de posición es un valor simple que se calcula para un grupo de


datos y que se utiliza como una manera de resumir los datos. Normalmente se desea
que el valor sea representativo de todos los valores incluidos en el grupo, estos
valores pueden estar relacionados con posiciones de particular interés como los
extremos, los cuales se asocian a cuantiles, o valores del centro, llamados de
tendencia central.

La Media Aritmética: La media aritmética, o promedio, se define como el cuociente


de la suma de todos los valores entre el número total de valores. En estadística, un
"promedio” es una medida de Tendencia central para un conjunto de datos.

En estadística es normal representar una medida descriptiva de una población,


(o parámetro poblacional), mediante letras griegas, en tanto que se utilizan letras
romanas para las medidas descriptivas de estadísticas muestrales. Así, la media
aritmética para una población de valores se presenta mediante el símbolo µ, en tanto
que la media aritmética de una muestra se representa mediante el símbolo X . Las
expresiones para el cálculo de la media de una población y de una muestra son:
N n

∑ ∑ Xi
1 1
µ = Xi X=
N n
i = 1 i =1

APLICACIÓN 4.8: Los pagos de consumo, en una muestra de 15 cuentas, fueron:


$1000, 1000, 2500, 2500, 2500, 3500, 4000, 5300, 9000,12500, 13500, 24500,
27500, 30900, y 41000.
15
∑ Xi
El promedio muestral es: X = i =1 = $ 12.080.
15

18
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Cuando se agrupan datos en una distribución de frecuencias, se utiliza el


punto medio de cada clase como aproximación de todos los valores contenidos en
ella. El punto medio o marca de clase se representa con el símbolo mi, en donde el
subíndice i indica la "clase i", y se utiliza la letra ni para representar la frecuencia
absoluta observada en la clase respectiva.

Las fórmulas para la media de la población y de la muestra para datos


agrupados son:

k k

∑ ∑
ni mi ni mi
µ= X=
N n
i =1 i =1

APLICACIÓN 4.9: Considerando los datos del tiempo de espera (en segundos)e:

Frecuencia
Tiempos (seg.) Marca de Clase Absoluta Relativa
[ 10,4 − 19,0 [ 14,7 1 0,85%
[ 19,0 − 27,6 [ 23,3 4 3,42%
[ 27,6 − 36,2 [ 31,9 11 9,40%
[ 36,2 − 44,8 [ 40,5 22 18,80%
[ 44,8 − 53,4 [ 49,1 39 33,33%
[ 53,4 − 62,0 [ 57,7 30 25,64%
[ 62,0 − 70,6 ] 66,3 10 8,56%


ni mi 14, 7 × 1 + 23,3 × 4 + . . . + 66,3 × 10
X= = = 48,4 [ segundos]
n 117
i =1

La gran desventaja de este indicador es su gran sensibilidad a la presencia de


datos extremos. Un dato extremo se manifiesta inmediatamente en el promedio,
poniendo en duda el ser un valor representativo del centro de los datos.

La Mediana: La mediana de un conjunto de datos es el valor que ocupa el lugar


central, cuando se ordenan en orden de magnitud. Para conjunto de datos, con un
número par de elementos, la mediana se calcula como el promedio de los valores
centrales.

En el caso de estar trabajando con datos dispersos, la expresión para


determinar la posición de la mediana en el conjunto de datos, donde los paréntesis en
el subíndice, muestra el lugar que ocupa la mediana dentro del conjunto de datos
ordenados, está dada por:

19
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

⎧X n + 1 si n es impar
⎪ ⎛⎜ ⎞

⎪ ⎝ 2 ⎠
Me = ⎨
⎪ 1 (X
⎪2

n +
2
( ) X
( ))
n
2
+1
si n es par

APLICACIÓN 4.10: Considerando los pagos de consumo, en una muestra de 15


cuentas en un restaurante: $1000, 1000, 2500, 2500, 2500, 3500, 4000, 5300,
9000,12500, 13500, 24500, 27500, 30900, y 41000.

Me = X ⎛ n + 1⎞ = X ⎛ 15 + 1 ⎞ = $ 5.300
⎜ ⎟ ⎜ ⎟
⎝ 2 ⎠ ⎝ 2 ⎠

La mediana es una medida de tendencia central, este indicador no es afectado


por datos extremos (indicador robusto).

La Moda: Medida de tendencia central, que está dada por el valor o clase que se
presenta con mayor frecuencia.

Cuantiles: Los cuantiles son medidas de posición que dividen los datos en grupos
bajo los cuales se encuentra una determinada proporción de éstos, por lo se requiere
que los datos se encuentren en al menos escala ordinal.

La mediana es un cuantil que divide la distribución de los datos en dos partes


de igual frecuencia acumulada, y luego bajo/sobre la mediana se encuentra
acumulado el 50% de los datos. Los cuartiles, la dividen en cuatro cuartos; los
quintiles, dividen la población en cinco; los deciles, la dividen en diez décimos; y los
puntos percentiles, la dividen en cien partes. Estos, en el caso de datos dispersos, son
expresados por:

Qi (cuartil i ) = X ⎛ i ( n + 1) ⎞ i : 1, 2, ... , 4
⎜ ⎟
⎝ 4 ⎠

Ki (quintil i ) = X ⎛ i ( n + 1) ⎞ i : 1, 2, ... , 5
⎜ ⎟
⎝ 5 ⎠

Di (dencil i ) = X ⎛ i ( n + 1) ⎞ i : 1, 2, ... , 10
⎜ ⎟
⎝ 10 ⎠

Pi ( percentil i ) = X ⎛ i ( n +1) ⎞ i : 1, 2, ... , 100


⎜ ⎟
⎝ 100 ⎠

20
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Estas expresiones son exactas en la medida que los factores de proporción:


⎛ i (n + 1) ⎞ ⎛ i (n + 1) ⎞ ⎛ i (n + 1) ⎞
⎜ ⎟ ; ⎜ ⎟ ; ⎜ ⎟ sean números enteros, en caso contrario una
⎝ 4 ⎠ ⎝ 10 ⎠ ⎝ 100 ⎠
buena aproximación (aunque no la única) la entrega el promedio entre el entero
superior e inferior de la respectiva fracción, tal como se presenta en la aplicación
siguiente.

APLICACIÓN 4.13: Considerando los pagos de consumo: $1000, 1000, 2500, 2500,
2500, 3500, 4000, 5300, 9000,12500, 13500, 24500, 27500, 30900, y 41000.

Q3 = X⎛ 3(15 + 1) ⎞ = X(12) = $ 24.500


⎜ ⎟
⎝ 4 ⎠

Luego, el 75% de los pagos por consumo son menores o iguales a $ 24.500.
X (6) + X (7)
D4 = X⎛ 4(15 + 1) ⎞ = X(6,4) = = $ 3.750
⎜ ⎟ 2
⎝ 10 ⎠
X (10) + X (11)
P68 = X⎛ 68(15 + 1) ⎞ = X(10,88) = = $ 13.000
⎜ ⎟ 2
⎝ 100 ⎠

4.3.2 Medidas de Variabilidad

Las medidas de tendencia central ó de posición que se presentaron son útiles


para identificar un valor “típico” ó “particular” de un conjunto de datos, las medidas
de variabilidad se ocupan de describir la dispersión (riesgo, precisión) de los datos
con respecto a una medida del centro o un valor particular.

A modo de ejemplo, suponga que dos máquinas empacadoras dan como


resultado productos con un peso promedio de 10 gramos, pero que en un caso los
productos se encuentran dentro de un rango de 0,1 gramos con respecto a este peso
promedio, en tanto que en el otro los pesos pueden variar hasta en un gramo. Como se
observa en la Figura 4.11, en el primer caso los datos son menos dispersos respecto al
valor de 10 gramos que en el segundo caso, lo que implicaría que suposiciones
realizadas al primer caso serían de menor riesgo que las del segundo.

Figura 4.11: Visualización de la variabilidad en un conjunto de datos

21
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Existen varios indicadores para medir la magnitud de la variabilidad en


conjuntos de datos. Las que se describen a continuación son: rango, rango
modificado, desviación media, varianza, desviación estándar y coeficiente de
variación.

El Rango: El rango (R), es la diferencia entre el mayor y menor valor del conjunto
de datos. Sí Máx.{xi} representa el mayor, y Min.{xi} representa el menor, el rango
de los datos está dado por:

⎧Max{xi } − Min{xi } datos dispersos



R= ⎨
⎪LS − LI datos agrupados
⎩ k 1

APLICACIÓN 4.15: Considerando los pagos de consumo, en una muestra de 15


cuentas en un restaurante: $1000, 1000, 2500, 2500, 2500, 3500, 4000, 5300,
9000,12500, 13500, 24500, 27500, 30900, y 41000, el rango está dado por:

R = Máx.{xi} – Min.{xi} = 41000 - 1000 = $ 40.000

Rangos Modificados: Un rango modificado es un rango para el cual se elimina cierto


porcentaje de los valores en cada uno de los extremos de la distribución y es
simbolizado por R mod. ( j % central). Algunos rangos modificados típicos son: el
50% central, el 80% central y el 90% central.

Para determinar el rango modificado, primero se debe ubicar los dos puntos
percentiles de interés para, después, calcular el rango entre ellos.

APLICACIÓN 4.17: Considerando los pagos de consumo, en una muestra de 15


cuentas en un restaurante: $1000, 1000, 2500, 2500, 2500, 3500, 4000, 5300,
9000,12500, 13500, 24500, 27500, 30900, y 41000, el rango modificado al 50%
central está dado por:

P75 = X ⎛ 75 ( n + 1) ⎞ = X(12) = $ 24.500.


⎜ ⎟
⎝ 100 ⎠
P25 = X ⎛ 25 ( n + 1) ⎞ = X(4) = $ 2.500.
⎜ ⎟
⎝ 100 ⎠
R Mod (50% central) = P75 - P25 = 24500 – 2500 = $ 22.000.

22
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

El rango modificado al 50% central, también es conocido como rango


intercuartilico, mientras que el rango modificado al 80% es conocido como rango
interdecil. Los rangos modificados, en general, buscan anular el efecto de valores
extremos de los datos, que producirían un fuerte efecto en el rango tradicional, como
medida de variabilidad.

La Varianza y la Desviación Estándar: La varianza es similar a la desviación


media porque se basa en la diferencia entre cada uno de los valores del conjunto de
datos y la media del grupo, La diferencia consiste en que, antes de sumarlas, se eleva
al cuadrado cada una de las diferencias, Para una población de tamaño N, se
representa la varianza mediante V(X) o, típicamente por la letra σ2; la fórmula de
cálculo es:
N 2

2 ( xi − µ )
V(X) = σ =
N
i =1

A diferencia de otras estadísticas muestrales que se han analizado, la varianza


de una muestra no es, en términos de cálculo, completamente equivalente a la
varianza de la población, La varianza muestral se representa mediante S2, y está dada
por:
n
( xi − x )2
2
S = ∑
i =1
n −1

Se utiliza con mayor frecuencia la raíz cuadrada de la varianza, representada


mediante la letra griega σ para el caso poblacional y S para una muestra, y se le
denominada desviación estándar, Las fórmulas son:

σ= V(X) S = Varianza muestral

La desviación estándar, además de ser una medida de dispersión que utiliza


toda la información (en contraposición con los rangos) y ser expresada en igual
unidad de medida que los datos originales, es especialmente útil cuando se le utiliza
junto con la denominada distribución normal.

23
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

EXACTITUD Y PRECISIÓN – ESTRATIFICACIÓN

I.- EXACTITUD Y PRECISIÓN

En muchas ocasiones no es posible tener mediciones fidedignas debido a


problemas de diversa índole propios de los datos que se están analizando, por
ejemplo, en el caso de utilizar instrumentos de medición mecánicos: éstos se pueden
descalibrar (por uso y/o falta de mantenimiento); mal manejo de los aparatos;
inadecuada instalación de éstos, etc. Mayor es el problema cuando el instrumento de
medición depende necesariamente de criterios o factores humanos, pues la
subjetividad propia del ser siempre afecta las mediciones.

En este sentido, en la toma de datos se deben tener presentes dos conceptos


básicos importantes, que son la exactitud y precisión de la medición. Particularmente
cuando la población en estudio esta claramente estratificada, éstos conceptos son de
gran utilidad en la comparación de los estratos. La exactitud, esta relacionada con el
grado de cercanía que tienen las mediciones con respecto a un valor objetivo que no
necesariamente debe ser el promedio, aunque sea este último una buena medida para
medir la exactitud del estrato. La precisión de las mediciones esta relacionada con el
grado de dispersión presente en los datos recopilados. Estos conceptos se pueden
apreciar esquemáticamente en la siguiente figura.

De estos conceptos se deben desprender dos aspectos importantes. El primero


es que no se puede hablar de exactitud y precisión en datos que no sean
cuantitativos. Si bien es cierto en el pasado se definieron medidas como la desviación
modal, no es sensato determinar ésta en datos ordinales o nominales, pues las
características que cumplen estos datos no son de distancia, por tanto difícilmente se
podría hablar de dispersión.

El segundo, es que cuando se habla de la precisión en las mediciones, es decir,


la dispersión – ¿dispersión respecto a que? – comúnmente la varianza es una buena
medida, sin embargo, dado que se está en una población estratificada, no sería
extraño en ningún caso que se obtengan promedios distintos en cada estrato, por lo

24
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

tanto si la dispersión es distinta en cada estrato, no habría de extrañarse que la


varianza también sea distinta en cada estrato. En este sentido una medida de
variabilidad de gran uso y utilidad en la comparación de poblaciones o
subpoblaciones en el caso de estratos, está dada por el coeficiente de variación (CV),
que indica la magnitud relativa de la desviación estándar con respecto a la media de la
distribución. La fórmula de cálculo se expresa por:

σ s
Población CV = Muestra CV =
µ x

A P L I C A C I Ó N 1 : Para 2 acciones de empresas, el precio promedio de cierre en


el mercado de valores durante un mes fue, para la acción A, de $15.000, con
desviación estándar de $500. Para la acción B, el precio promedio fue de $5.000, con
desviación estándar de $300. Haciendo una comparación absoluta resultó ser superior
la variabilidad en el precio de la acción A, debido a que muestra una mayor
desviación estándar. Pero con respecto al nivel de precios, deben compararse los
respectivos coeficientes de variación:

500 300
CV (A) = = 0,033 y CV(B) = = 0,060
15000 5000

Puede concluirse que el precio de la acción B ha sido casi 2 veces más


variable que la acción A (entonces ¿más riesgosa?).

Nota: El coeficiente de variación permite comparar poblaciones aunque estén en


distintas unidades.

A P L I C A C I Ó N 2 : Se toman dos muestras de materiales fabricados con tipos


distintos de acero para analizar la resistencia a la ruptura. Los siguientes gráficos
resumen los tiempos máximos que soportan dichos materiales antes de fragmentarse,
cuando son sometidos a la tensión:

Acero Tipo I Acero Tipo II


0,50
0,5 0,5
0,4 0,4
0,30
0,3 0,25 0,3 0,25
0,20
0,2 0,15 0,2
0,10 0,10 0,10
0,1 0,1 0,05
0,0 0,0
0 - 4 4 - 8 8 - 12 12 - 16 16 - 20 0 - 4 4 - 8 8 - 12 12 - 16 16 - 20
Resitencia [ua] Resistencia [ua]

25
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Claramente se puede apreciar que la distribución de los datos dentro del rango
de la tabla no es distinta para ambos tipos de acero, es más se puede observar una
clara simetría positiva en el acero tipo 2. Los cálculos de las medidas utilizadas para
el coeficiente de variación son:

x1 = 10, 60 s1 = 4,779 CV1 = 45,08%


x2 = 8, 00 s2 = 3,899 CV2 = 48,74%

Ejercicio: A fin de controlar la calidad de un particular tipo de hilo


producido en serie, en control de calidad toman una muestras al azar de tamaño 7,
correspondientes a cada uno de los cuatro turnos que los operarios realizan y se mide
la resistencia a la tensión [en libras], cuyos datos se muestran a continuación. Se tiene
que la media por especificaciones debe ser de 48.00 [libras].

Observación 1 2 3 4 5 6 7
Turno 1 44 46 48 52 49 47 48
Turno 2 44 43 42 43 46 45 44
Turno 3 42 48 46 53 54 49 44
Turno 4 51 52 48 49 47 47 50

En la siguiente tabla se muestran algunas medidas de resumen de cada turno


asociado al problema antes expuesto.

Desviación Coeficiente de
Observación Media St
estándar variación
Turno 1 47,71 2,50 5,23% 2,33
Turno 2 43,86 1,35 3,07% 4,34
Turno 3 48,00 4,43 9,24% 4,11
Turno 4 49,14 1,95 3,97% 2,13

i) Discuta la precisión y exactitud de la resistencia del hilo fabricado en cada


turno.

ii) ¿ A qué turno asignaría mayor atención para mejorar su desempeño.

II.- MEDIA Y VARIANZA ESTRATIFICADA

Como se observó en los casos anteriores cuando la variable de estudio está


claramente dividida en estratos, y en cada uno de éstos se pueden obtener medidas de
tendencia central y dispersión, o bien cuando se tiene información (medidas de
resumen) sólo de los estratos por separado y no se cuenta con los datos (ver figura),
medidas de resumen de la población total se obtienen de resúmenes anteriores de la
población (medias y desviaciones estándar de cada estrato) estas son la media y
varianza total, también llamadas media y varianza ponderada.

26
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

1.- La Media Ponderada: La media ponderada o promedio ponderado es una


media aritmética, en la cual se considera a cada uno de los valores de acuerdo
con su importancia en el grupo. Las fórmulas para la media ponderada
poblacional y muestral son idénticas y están dadas por:

h h

∑pµ
i =1
i i ∑ px
i =1
i i
µp = xp =
h h

∑p
i =1
i ∑p
i =1
i

la importancia del grupo en la población total está dada por los pesos expresados por
‘pi’, que generalmente se escogen de acuerdo al tamaño del grupo.

A P L I C A C I Ó N 4 : En una compañía que maneja 4 productos, los márgenes de


utilidad correspondientes a cada uno de ellos durante el año fiscal anterior fueron:
Producto A, 4,2%; Producto B, 5,5%; producto C, 7,4%; y producto D, 10,1%.

27,2
El margen de utilidad promedio, no ponderado, es: µ = = 6,8%
4
Sin embargo, este promedio no ponderado es incorrecto porque se vendieron
cantidades distintas de los 4 productos.
Suponiendo los totales de ventas y margen de utilidad que aparecen en la
Tabla siguiente, se encuentra que el promedio ponderado describe en forma correcta
el promedio global.

27
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Margen de
Producto Ventas (p) pX
utilidades (%)
A 4,2 $ 30.000.000 $ 1.260.000
B 5,5 $ 20.000.000 $ 1.100.000
C 7,4 $ 5.000.000 $ 370.000
D 10,1 $ 3.000.000 $ 303.000

∑pµ
i =1
i i
3.033.000
µp = = = 5,2%
h 58.000.000
∑p
i =1
i

De manera análoga se puede obtener una ponderación de acuerdo a las ventas


por producto, obteniéndose idéntico resultado.

Producto Margen de Ventas (p) pi


utilidades (%)
A 4,2 $ 30.000.000 0,5173
B 5,5 $ 20.000.000 0,3448
C 7,4 $ 5.000.000 0,0862
D 10,1 $ 3.000.000 0,0517

2.- La Varianza: La varianza es una varianza descompuesta y ponderada, en la cual


se considera a cada una de las medidas de dispersión de los estratos de acuerdo
con su importancia en el grupo, además de una descomposición de la
variabilidad debido a la variabilidad propia del estrato, también llamada
variabilidad dentro o Intra, y una variabilidad propia entre los estratos, también
llamada variabilidad entre o Inter. Las fórmulas para la varianza ponderada
poblacional y muestral son idénticas y están dadas por:

h h
2
Sp = ∑
i =1
2
pi s i + ∑ p (x
i =1
i i
2
− x p ) , donde

∑ps
i =1
2
i i = Representa la variabilidad dentro.

∑ p (x
i =1
i i − xp)
2
= Representa la variabilidad entre estratos.

28
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Por esta descomposición de la variabilidad total, se pueden obtener los


porcentajes de variabilidad debido a la variabilidad propia de los estratos y a la
variabilidad propia de la estratificación –

Ahora bien, si considerando las medidas de resumen del ejemplo 4


– Margen de utilidad y volumen de ventas para 4 productos – se obtiene
que el mayor aporte (en porcentaje) a la variabilidad esta dada por la
variabilidad propia del margen de utilidad. ¿

Margen de Pi
Producto Ventas (p) Varianza (%)
utilidades (%)
A 4,2 $ 30.000.000 4,02 0,5173
B 5,5 $ 20.000.000 5,20 0,3448
C 7,4 $ 5.000.000 6,85 0,0862
D 10,1 $ 3.000.000 9,08 0,0517

ST2 = Dentro + Entre


ST2 = 4,934 + 2,206
ST2 = 7,140 [%]2

Dentro ⇒ 69,1% Entre ⇒ 30,9%

4.3.3 Asociación de Variables

En estadística descriptiva multivariada se trabaja con un vector de


información para cada un de las ‘n’ unidades, a las cuales se les miden p
características o variables.

Si se consideran pares de variables que al menos se encuentren en escala


ordinal, una de las gráficas más útiles para observar el tipo de asociación que existe
entre un par de variables, son las llamadas gráficas de dispersión, que consiste en
tomar los pares ordenados de las variables, los cuales son gráficos en el plano
cartesiano x e y, es decir:.

(x1, y1), (x2, y2), ... , (xn, yn)

el diagrama de dispersión se muestra en la Figura 4.12.

29
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Figura 4.12 Gráfica de dispersión de pares ordenados.

Una de las medidas de asociación más comunes y útiles, cuando se consideran


pares de variables es el coeficiente de correlación lineal de Pearson, que mide el
grado de asociación lineal entre un par de variables, que se encuentren en escala al
menos intervalar.

La deducción y propiedades de este coeficiente, tiene sus fundamentos en


matemáticas. El cálculo de este coeficiente se obtiene mediante:
n
∑( yi
n
- y ) ( xi - x )
i =1
∑ yi xi - ny x
r = , r = i =1
n n n n
2 ∑( yi - y ) 2
2 ∑( xi - x ) 2
2 ∑ yi2 - n y 2 2 ∑ xi2 - nx2
i =1 i =1 i =1 i =1

Este coeficiente tiene la propiedad que se encuentra intervalo de –1 a 1,


considerándose que existe una buena asociación lineal positiva ó negativa, si el valor
de ‘r’ está cercano a 1 ó –1 respectivamente.

Una manera muy práctica de ver la existencia de asociación entre un par de


variables, es mediante las gráficas de dispersión.

Gráfica de D ispersión Gráfica de Dispersión


Y
Y

r = -1
r¸1

X
X

30
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Gráfica d e D ispersión Gráfica de Dispersión


Y
Y
r ¸ -1 r=1

X
X

Gráfica de Dispersión Gráfica de Dispersión


Y
Y

r=0
r=0

X X

4.3.4 Elementos Básicos de Regresión

Considere un experimento, en el cual se considera una variable independiente,


la cual trata de explicar una variable dependiente (a predecir), se tienen mediciones
realizadas simultáneamente, que conforman las variables “x” e “y” para un rango de
diferentes condiciones experimentales. Si se hacen n mediciones, éstas se pueden
expresar por:

( xi, yi) con i = 1 , . . . , n ,

que son los correspondientes n pares ordenados de observaciones. Se construye un


modelo estadístico paramétrico para esta situación, proponiendo una relación
funcional – f(x; β) – para la media de Y.

El primer paso en el análisis, es realizar un gráfico de dispersión de y versus x,


si el gráfico muestra una relación entre las dos variables se puede considerar un
modelo estadístico adecuado para esta relación. En el caso presentado se estudia el
modelo de regresión lineal simple.

31
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

En esta situación el modelo estadístico a utilizar está dado por:

Modelo : Yi = f(x) + &i = "0 + "1 xi + &i . i = 1, ... , n,

Además, es posible realizar supuestos distribucionales verificables


estadísticamente acerca de los errores &i, en particular, por ejemplo, que tienen una
distribución Normal, que es la base para poder llegar a realzar inferencias respecto al
modelo, sus parámetros y sus predicciones. A partir de estos supuestos es posible
visualizar a partir del siguiente diagrama de dispersión estos conceptos.

Estimación de Parámetros

El método comúnmente usado para la estimación de parámetros en los


modelos de Regresión Lineal es denominado Mínimos Cuadrados Ordinarios
(MCO), aunque este método coincide con la estimación de los parámetros "0 y "1 del
modelo lineal a través del método de Máxima Verosimilitud, que se basa en
supuestos asociado a errores &i ( modelos aleatorios).

32
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Mínimos Cuadrados Ordinarios

En este ejemplo a partir de un modelo de Regresión Lineal simple de la forma:

Yi = " 0 + " 1 xi+ &i (4.1)

Se busca determinar los estimadores "0 y "1 que minimicen la suma de errores
&i al cuadrado. Esto se resuelve mediante herramientas matemáticas, minimizando la
función g (ε i2 ) con respecto a los cada parámetros "0 y "1, es decir, minimizando:

n n
g (ε i2 ) = ∑
i =1
ε i2 = ∑(y − β
i =1
i 0 − β1 xi ) 2

las soluciones para los estimadores MCO de β0 y β1 son:


n
∑ ( yi − y )( x i − x )
Sx y ,
"0 = y - x "1
" = i=1 =
1 n Sx x
∑ ( xi − x)2
i=1

La regresión lineal ajustada, es posible escribirla en la siguiente forma.

yˆ i = βˆ 0 + βˆ1 xi (4.2)

yˆ i = y + βˆ1 ( x i − x ) (4.3)

La ecuación (4.3), muestra la clara evidencia de la importancia del parámetro


β1 en la ecuación de regresión. Es decir, una estimación β1 de muy cercana a cero,
implicaría la poca relación ‘lineal’ entres las variables.
Recordando indicadores de asociación lineal, se tiene que el coeficiente β1
posee una estrecha relación con el coeficiente de asociación lineal de Pearson, como
se visualiza a continuación

sx sy
r p = β̂ 1 ⇒ β̂ 1 = r p
sy sx

sx
yˆ i = y + r p ( xi − x ) (4.4)
sy

33
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

APLICACIÓN 4.18: La Gerencia de Airlines S.A., considera que existe una relación
directa entre los gastos publicitarios, en miles de US$ (P [MUS$]), y el número de
pasajeros, en miles (Q [M]), que escogen viajar con Airlines S.A. Los datos son:

P [MUS$] 10 12 8 17 10 15 10 14 19 10 11 13 16 10 12
Q [M/] 15 17 13 23 16 21 14 20 24 17 16 18 23 15 16

A través del diagrama de dispersión, como se observa a continuación:

Diagrama de Dispersión
26
22
Q [M]

18
14
10
7 9 11 13 15 17 19 21
P[MUS$]

Modelo Propuesto: Yi = β0 + β1 xi + &i

Para el ajuste se requieren los cálculos siguientes

Sxx = ∑ ( x − x ) = 137,7333
i
2
Syy = ∑ ( y − y)
i
2
= 171,7333

Sxy = ∑ ( y − y )( x − x ) = 148,9333
i i y = 17,8667 x = 12,4667

Con los que se obtiene:

S xy S xy
βˆ1 = = 1,0813 ⇒ β̂ 0 = y - βˆ1 x = 4,3865 ⇒ rp = = 0,9684
S xx S yy S xx

Luego la regresión ajustada estaría dada por:


ŷ i = 4,3865 + 1,0813 xi

ŷ i = 17,8667 + 1,0813 (xi – 12, 4667)

Se puede visualizar que para un gasto en publicidad de 9 [M], se tendría una


estimación del número de pasajeros que viajaría de:

ŷ i = 17,8667 + 1,0813 (9 – 12, 4667) = 14,1182. [M]

34
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

APLICACIÓN 4.19: Los datos representan una muestra de los tiempos de transporte y
el porcentaje de capacidad no utilizada por camiones de una empresa de transporte.

% de Capacidad 7,75 18,75 11,15 14,95 10,85 8,05 14,10 12,55


Transporte 60,505 1,315 15,055 2,145 17,050 53,145 1,495 5,050
% de Capacidad 13,60 8,35 15,55 16,70 22,45 9,10 11,65
Transporte 7,550 41,470 0,450 0,250 3,745 20,310 4,595

Del diagrama de dispersión, se puede visualizar el tipo de relación que existe


entre ambas variables, como se observa a continuación:

Diagrama de Dispersión
80
Tiempos de

60
Transporte

40
20
0
7 9 11 13 15 17 19 21 23
% de Capacidad no Utilizada

Modelo Propuesto: Yi = exp{-(β0 + β1 xi + &i)}

⎛ 1 ⎞
ln (Yi) = – ("0 + "1 xi + &i) ⇔ ln ⎜⎜ ⎟⎟ = "0 + "1 Xi + &i
⎝ Yi ⎠
⎛ 1 ⎞
⇒ Yi* = "0 + "1 Xi + &i Yi* = ln ⎜⎜ ⎟⎟
⎝ Yi ⎠

Con los que se obtiene:


15

∑y x * *
i i − ny x
− 265,1626 − 15 × −1,7400 ×13,0367 75,0986
βˆ1 = i=1 = = = 0,304
15 2 246,8773
2796,1975 − 15 × (13,0367)

i=1
xi2 − n x 2

βˆ 0 = y*i − βˆ1 x = – 1,7400 – 0,304 × 13,0367 = – 5,706

yˆ i* = −5,706 + 0,304 xi

35
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Además, a través la estimación del coeficiente de β1 se puede obtener el grado


de asociación lineal entre el porcentaje de capacidad no utilizada y el logaritmo del
inverso del tiempo de transporte, el cuál está dado por:

sx 17,6341
r p = β̂ 1 = 0,304 = 0,7581
sy 2,8356

Luego con la ecuación de regresión ajustada se puede realizar una estimación


para el logaritmo del inverso del tiempo de transporte, cuando se tiene el porcentaje
de capacidad no utilizada del camión del 19,5%, la cual está dada por:

ŷ* = – 5,706 + 0,304 × 19,5 = 0,222


luego,
⎛ 1 ⎞
Yi* = ln ⎜⎜ ⎟⎟ = 0,222
⎝ Yi ⎠

ŷ = exp{– 0,222} = 0,80 [u.t.]

APLICACIÓN 4.20: La rentabilidad promedio semanal, de una acción en el tiempo,


para las últimas 16 semanas expresados en la Tabla 1.

Tiempo 1988 1989 1990 1991 1992 1993 1994 1995


Rentabilidad 6,0 7,1 10,7 7,0 11,9 13,5 9,2 15,8
Tiempo 1996 1997 1998 1999 2000 2001 2002 2003
Rentabilidad 17,8 13,2 21,4 17,0 25,1 21,4 27,8 16,6

Del diagrama de dispersión, se puede visualizar el tipo de relación que existe


entre ambas variables, sin embargo, como se observa en la gráfica de dispersión los
tiempos son transformados a la escala 1, … , n, particularmente para las estimaciones
de los parámetros:

Diagrama de Dispersión
30
Rentabilidad

20

10

0
0 2 4 6 8 10 12 14 16 18
Tiempo

36
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Modelo Propuesto: Yi = β0 + β1 xi + &i

15

∑ y i* x i − n y * x
2451,7 − 16 × −8,5 × 15,094 398,92
βˆ1 = i =1 = = = 1,1733
15 1496 − 16 × (8,5) 2 340,00

i =1
x i2 − n x 2

βˆ 0 = y − βˆ1 x = 15,094 – 1,1733 x 8,5 = 7,767

con los datos se puede obtener la ecuación de regresión ajustada a la rentabilidad de


la acción en el tiempo, la cual está dada por:

ŷ i = 7,767 + 1,1733 x i

Luego si se desea estima la rentabilidad de la acción para el año 2004, se debe


tener especial cuidad en el reemplazo del año codificado (17) en la ecuación anterior,
es decir: ŷ17 = 7,767 + 1,1733 × 17 = 27,71%.

37
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

5. TERCER MÓDULO
5.1 Elementos de Probabilidad

En la investigación científica, por lo general, se requiere de modelos que


ayuden a comprender el fenómeno bajo estudio. En general, no es posible contar con
modelos exactos, también conocidos como modelos determinísticos. En tales
situaciones, las mediciones obtenidas presentan perturbaciones no controlables, lo
que lleva a que la observación presente variabilidad en los resultados. En
experimentos en condiciones supuestamente idénticas, el azar o aleatoriedad en el
resultado de la medición, dificulta la posibilidad de predecir el resultado con certeza.

Por ejemplo, en el problema de determinar la resistencia a la ruptura de una


barra de acero (con alguna especificación de la misma), es muy creíble, que en la
medición de diez barras, ninguna resulte igual, luego, si se quiere ofrecer una
especificación de la resistencia de las barras que se producen: ¿cuál es el valor de la
resistencia de las barras que se ofrecería?, ¿la resistencia de la barra 1, 2, 3, ... , 10?,
¿la mínima resistencia?, ¿la máxima resistencia?. Posiblemente una respuesta común
sería, la resistencia media, aunque tal vez, éste no sea el mejor indicador.

En el campo de investigaciones, donde no es posible utilizar modelos


determinísticos, es natural esperar que en la predicción no sea exacta, sin embargo,
por más que no sea posible prever el resultado con certeza en cada medición, cuando
se está en presencia de fenómenos aleatorios o estocásticos, no significa que dichas
mediciones no posean ninguna ‘regularidad’, el objetivo de determinar el patrón de
dicha regularidad, es lo que en el futuro conoceremos como ‘ley de probabilidad’.

Enfoque Clásico

El enfoque clásico, tiene la característica esencial, que basa en la asignación


de medida de ocurrencia para un resultado, sobre los antecedentes que aporta un
experimento que se realiza de la manera más metódica posible, en donde los posibles
resultados del mismo son ‘igualmente probables’, situación que también se conoce
como un experimento equiprobable. Este es el caso típico de los juegos de azar en
que asumimos que todos los resultados elementales son igualmente probables.
;
Notemos que en el enfoque clásico (cuando es aplicable) se determinan los
valores de probabilidad antes de observar los resultados experimentales, por esta
razón se le denomina enfoque a priori.

APLICACIÓN 5.1 En un mazo de cartas bien barajadas que contiene 4 ases y 48


cartas de otro tipo, la probabilidad de obtener un as en una extracción es:

#A 4 1
[Obtener un as] = = = .
# S 52 13

38
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Enfoque Frecuentista

En el enfoque de frecuencia relativa, se determina la probabilidad con base


en la proporción de veces que ocurre un resultado en un determinado número de
observaciones o experimentos. No hay implícita ninguna suposición previa de
igualdad de probabilidades.

Debido que para determinar los valores de probabilidad se requiere de la


observación y de la recopilación de datos, a este enfoque se le denomina también
enfoque empírico. Este enfoque no asigna probabilidades a priori a los posibles
resultados del experimento.

La probabilidad en el enfoque frecuentista se asocia directamente al concepto


de frecuencia relativa ya trabajado en estadística descriptiva, de acuerdo con este
enfoque la probabilidad de que ocurra un resultado determinado, como por ejemplo
llegar atrasado al trabajo es:

Número de atrasos n
[Llegar atrasado al trabajo] = = i .
Número total llegadas n
APLICACIÓN 5.2 Antes de incluir la cobertura de ciertos tipos de problemas
dentales en pólizas de seguros médicos para adultos, una compañía de seguros desea
determinar la probabilidad de ocurrencia de esa clase de problemas, para que pueda
fijarse la prima de seguros. Por ello, un especialista en estadística recopila datos para
10000 adultos y encuentra que 100 de ellos han experimentado el problema dental
específico durante el año anterior. Por ello, la probabilidad de ocurrencia es:

ni 100
[Problema dental] = = = 0,01 ó 1%
n 10000

Enfoque Bayesiano

Tanto el enfoque clásico como el de frecuencia relativa producen valores de


probabilidad objetivos, en el sentido de que señalan la tasa relativa de ocurrencia del
evento a largo plazo. De acuerdo con el enfoque bayesiano, la probabilidad de un
resultado es el grado de confianza que se tiene de que éste ocurra.

Debido a que el valor de la probabilidad es un juicio personal, este enfoque,


es llamado enfoque subjetivo. El desarrollo de la probabilidad mediante este enfoque,
ha recibido mucha atención en los últimos tiempos, y tiene relación con el análisis
bayesiano de decisión.

La probabilidad asignada es conocida como probabilidad a priori, está


probabilidad se actualiza mediante hechos que van acaeciendo en el tiempo,
constituyendo después de cada actualización una probabilidad a posteriori.

39
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Desarrollo Axiomático de Probabilidad

La medida de probabilidad (P), se apoya en argumentos de Teoría de Medida,


que para su definición axiomática requiere de algunas definiciones previas, las cuales
pasamos a recordar.

Definición 5.1: Espacio Muestral. Se define el espacio muestral como el conjunto de


todos los posibles resultados del experimento, y se anota por Ω.

Definición 5.2: Suceso o Evento. Un suceso o evento, es cualquier subconjunto de Ω,


y se anota generalmente con letras mayúsculas. A, B, C etc.

El conjunto, Γ ⊂ 2Ω, será llamado conjunto de sucesos y el par (Ω, Γ )


espacio medible, una función  : Γ ⎯→ (0,1), es una medida de probabilidad si
satisface:

1. 0 ≤ [A] ≤ 1, ∀ A ∈ Γ .

2. [Ω] = 1.

3. A1, A2 …∈ Γ disjuntos ⇒ [ ∪ An] = ∑ [Ai] ∀ i.


i =1 i =1

Dependiendo del número de posibles resultados de un experimento aleatorio,


el espacio muestral Ω puede ser clasificado como:

Finito
Discreto Numerable
Infinito

Acotado
Continuo No Numerable
No Acotado

5.2 Cálculo de Probabilidades

Propiedades de una Medida de probabilidad

Un evento puede ocurrir o no, luego la suma de la probabilidad de ocurrencia


de un evento más la probabilidad de no-ocurrencia es siempre igual a 1.

[A] + [Ac] = 1

40
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

APLICACIÓN 5.3: Suponga que se define como éxito, la extracción de cualquier carta
de un naipe bien barajado de 52 cartas con figura o un as. Como 16 cartas de las 52
son jotas, reinas, reyes o ases, la probabilidad de éxito es 16/52 = 4/13 y la
probabilidad de no éxito es entonces 9/13.

Eventos Mutuamente Excluyentes


Dos o más eventos son mutuamente excluyentes, o disjuntos, si no pueden
ocurrir simultáneamente. Por ejemplo, supóngase que se consideran los eventos “as"
y "rey" en la extracción de una carta de un mazo. Estos dos eventos son mutuamente,
excluyentes porque ninguna carta puede ser al mismo tiempo as y rey.

APLICACIÓN 5.4: En un estudio de la conducta de los consumidores, un analista


clasifica a las personas que entran en una tienda de aparatos de sonido de acuerdo
con su sexo ("masculino" o "femenino") y su edad ("menor de 30" o "30 o mayor”).
Los eventos, “masculino” y “femenino” son mutuamente excluyentes puesto que
ninguna persona podría clasificarse en ambas categorías. De manera similar, los
eventos "menor de 30" y "30 o mayor" son también mutuamente excluyentes. Sin
embargo, los eventos "masculinos" y menor de 30" no son mutuamente excluyentes
porque una persona elegida al azar podría estar en ambas categorías.

Regla de Aditividad

La regla de la adición para eventos mutuamente excluyentes es:

[A o B] = [A ∪ B] = [A] + [B]

APLICACIÓN 5.5: Cuando se extrae una carta de un mazo de barajas, los eventos "as"
(A) y "rey" (R) son mutuamente excluyentes. La probabilidad de extraer ya sea un as
o un rey en una extracción es:

4 4 2
[A ∪ R] = [A] + [R] = + =
52 52 13

Nota: La regla de adición se puede generalizarse a tres o más eventos.


La regla de la adición general que no son mutuamente excluyentes es:

[A o B] = [A ∪ B] = [A] + [B] – [A ∩ B]


APLICACIÓN 5.6: Cuando se extrae una carta de un mazo, los eventos "as" y "trébol"
no son mutuamente excluyentes. La probabilidad de obtener un as (A) o un trébol (T)
(o ambos) en una sola extracción es:
4 13 1 4
[A ∪ T] = [A] + [T] – [A y T] = + − =
52 52 52 13

41
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

En el lenguaje de conjuntos, la probabilidad [A y T] se escribe [A ∩ T], y


se interpreta como la probabilidad de que ocurran simultáneamente.

Nota: La regla de adición en eventos no excluyentes puede generalizarse con


algunas variantes a tres o más eventos.

5.3 Probabilidad Condicional y Eventos Independientes

Dos eventos son independientes cuando la ocurrencia de uno no tiene ningún


efecto sobre la probabilidad de ocurrencia del otro y luego son dependientes cuando
la ocurrencia de uno si afecta la probabilidad de ocurrencia del otro evento.

APLICACIÓN 5.7: Los resultados asociados con el lanzamiento de una moneda, dos
veces seguidas, son claramente eventos independientes, ya que el resultado del primer
lanzamiento no tiene ningún efecto sobre probabilidades del segundo lanzamiento.
Por otra parte la extracción de dos cartas sin reemplazo de un mazo son claramente
eventos dependientes, ya que las probabilidades asociadas con la segunda extracción
dependen del resultado de la primera extracción.

El concepto de probabilidad condicional se emplea para redefinir el cálculo


de probabilidad de ocurrencia de un evento dada cierta condición ( o información).

Si se conoce la probabilidad simple (no condicional) de un primer evento A y la


probabilidad conjunta de dos eventos A y B, entonces se puede determinar la
probabilidad condicional [B / A] mediante:

[B ∩ A]
[B / A]= , [A] > 0
[A]
La expresión [B / A] mide la probabilidad de que el evento B ocurra dado
que el evento A ocurrió. Nótese que "B / A" no es una fracción.

Si los eventos A y B son independientes, la probabilidad condicional


[B / A] es igual a la probabilidad simple (no condicional) [B]. Por lo tanto, una
forma evaluar la independencia de dos eventos A y B consiste en comparar:
?
[B / A] = [B]

lo que conduce a la regla [B ∩ A] = [A] [B].

Regla Multiplicativa

La regla multiplicativa se refiere a la determinación de la probabilidad de la


ocurrencia conjunta de dos ó más eventos .La regla para dos eventos A y B es:
[A ∩ B] = [A] [B / A]

42
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

APLICACIÓN 5.8: Si se lanza dos veces una moneda, la probabilidad de que ambos
resultados sean "cara" es:

1 1 1
[C1 ∩ C2] = [C1] [C2 / C1]= [C1] [C2]= * =
2 2 4

La regla multiplicativa para tres eventos A, B y C es:

[A ∩ B∩C] = [A][B / A] [C / A ∩ B]

Nota: La regla multiplicativa puede generalizarse fácilmente a más de tres eventos.

Los diagramas de árbol son particularmente útiles para ilustrar los posibles
eventos asociados con observaciones o ensayos secuenciales. La figura, es un
ejemplo de estos diagramas para los eventos asociados con el lanzamiento de una
moneda dos veces, donde se identifica los resultados posibles y la probabilidad en
cada punto de la secuencia.

APLICACIÓN 5.9: En la figura, se observa que son posibles cuatro tipos de


secuencias de eventos conjuntos, la probabilidad de ocurrencia conjunta para
cualquiera de esas secuencias es 1/4.

APLICACIÓN 5.10: El Gerente de una empresa de seguridad que presta servicios a


grandes tiendas, para lograr un efectivo control contra robos, debe decidir entre
comprar detectores producidos por Simons ó Eléctrica Universal. La probabilidad de
que el detector producido por Simons, cumpla satisfactoriamente con su propósito es
de 0,90; mientras que la de un detector producido por Eléctrica Universal, es de 0,74.
Las empresas proveedoras (Simons ó Eléctrica Universal) presupuestan que para
tener un control efectivo se deben instalar, de forma que funcionen de manera
independiente, 3 detectores según Simons ó 5 según Eléctrica Universal. ¿Cuál
detector es más conveniente, de manera que maximice la probabilidad de control?.

43
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

ei: {Detector Simons i-ésimo cumple con su propósito}.


ci: {Detector Eléctrica Universal i-ésimo cumple con su propósito}.
T : {Detectores instalados cumplen con su función}.

[ei] = 0,90 [ci] = 0,74 ∀ i = 1 , ...

[T] = [e1 ∪ e2 ∪ e3] = 1 – [ e1c ∩ e c2 ∩ e 3c ].

= 1 – [ e1c ] × [ e c2 ] × [ e 3c ] = 0,9990

[T] = [c1 ∪ c2 ∪ c3 ∪ c4 ∪ c5]

= 1 – [ c 1c ∩ c c2 ∩ c 3c ∩ c c4 ∩ c 5c ]

= 1 – [ c 1c ]× [ c c2 ]× [ c 3c ]× [ c c4 ]× [ c 5c ] = 0,9988.

De los resultados es conveniente usar el detector Simons

La empresa en cuestión se ha adjudicado una importante licitación, sin


embargo ésta exige que la probabilidad de control efectivo sea al menos de
0,9999995. ¿Cuántos detectores Simons deberían ser instalados?

[T] > 0,9999995 ⇔ [e1 ∪ e2 ∪ ... ∪ en] > 0,9999995

1 – [ e1c ∩ e c2 ∩ ... ∩ e cn ] > 0,9999995

∏i =1
[ e1c ] < 0,0000005

∏ 0,1 < 0,0000005


i=1

(0,1) n < 0,0000005

ln(0, 0000005)
⇔ n> ≈7
ln(0,1)

44
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Regla de Bayes

La regla de Bayes permite actualizar ciertas probabilidades a priori para


transformarse en probabilidades posteriori de un evento (experimento).

La importancia de la regla de Bayes consiste en que se aplica en contexto de


eventos secuenciales y además, de que proporciona la base para determinar la
probabilidad condicional de un evento a la luz de un evento especifico que ha
ocurrido. La fórmula de cálculo para el teorema es:
[A ∩ B] [A] [B / A]
[A / B]= =
[B] [A] [B / A] + [Ac] [B / Ac]
Nota: 1. - El denominador es la probabilidad total o global del evento.
2. - La regla de probabilidad total o global puede generalizarse a tres o más
eventos.

APLICACIÓN 5.11: Supóngase que existen 2 urnas U1 y U2. La urna 1 tiene ocho
bolas rojas y dos bolas verdes, en tanto que la urna 2 tiene cuatro bolas rojas y seis
bolas verdes. Si se elige una urna al azar, y después se selecciona al azar una bola de
esa urna escogida, el proceso secuencial y las probabilidades pueden representarse
mediante el diagrama de árbol de la figura. El diagrama de árbol indica que la
probabilidad de elegir cualquiera de las urnas es 0,50 y después, las probabilidades
condicionales de extraer una bola roja (r) o una verde (V) son las que se señalan.

Ahora, supóngase que se observó una bola verde ¿Cuál es la probabilidad de que se
haya seleccionado la urna 1? En símbolos, ¿ [U1 / V2]?

[U1] [V1 I U1] = (0,5)(0, 2)


= 0,25
[U1/V1] =
[U1] [V1 I U1] + [U2] [ V2 I U2] (0,5)(0, 2) + (0,5)(0, 6)

En el análisis bayesiano de decisión esta regla ofrece la base conceptual para


revisar las probabilidades asociadas con diversos eventos, o estados implicados en un
problema de decisión.

45
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

APLICACIÓN 5.12: Considerar la posible falla de un sistema de abastecimiento de


agua para atender la demanda durante un día de verano. El sistema puede fallar de las
siguientes formas:

M1: Suministro inadecuado.


M2: Falla de la bomba.
M3: Sobrecarga en la planta de purificación.

Supongamos que la empresa sanitaria ha efectuado un estudio según el cual


se ha estimado que las probabilidades de falla en el sistema son las que se muestran
en la Tabla 5.1. Además, la probabilidad de que falle la bomba es de 2% y es
independiente del nivel de demanda.

Tabla 5.1: Probabilidades de falla del sistema


Identificación Nivel de P[Di] = P[M1| Di] = P[Suministro P[M3| Di] = P[Sobrecarga
del nivel de demanda P[Nivel de inadecuado | Nivel de en la planta | Nivel de
demanda [m3/día] demanda] demanda] demanda]
D1 100.000 0,6 0,0 0,0
D2 150.000 0,3 0,1 0,0
D3 200.000 0,1 0,5 0,1

La probabilidad de suministro inadecuado es:

[M1] = [M1 / D1] × [D1] + [M1 / D2] × [D2] + [M1 / D3] × [D3]

= 0,0 × 0,6 + 0,1 × 0,3 + 0,5 × 0,1 = 0,080

La probabilidad de falla, cualquiera sea el motivo, cuando el nivel de


demanda es 150.000 [m3/día].

[M1 ∪ M2 ∪ M3/ D2] = [M1 / D2] + [M2 / D2] + [M3 / D2]

= 0,10 + 0,02 + 0,00 = 0,120

La probabilidad de falla del sistema es:

[M1 ∪ M2 ∪ M3] = [M1] + [M2] + [M3] ⇒ Probabilidad de falla

[M3] = [M3 / D1] × [D1] + [M3 / D2] × [D2] + [M3 / D3] × [D3]

= 0,0 × 0,6 + 0,0 × 0,3 + 0,1 × 0,1 = 0,010

⇒ [M1 ∪ M2 ∪ M3] = 0,080 + 0,020 + 0,010 = 0,110


46
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

La probabilidad de falla del sistema si se pone una bomba adicional, para que
opere en caso de que falle la primera bomba, y cuya falla es independiente de la falla
de la primera bomba es:
[M1 ∪ (M21 ∩ M22) ∪ M3] = [M1] + [ M21 ∩ M22] + [M3]

= 0,080 + 0,020 × 0,020 + 0,010


= 0,0904

APLICACIÓN 5.13: Se planea una gran presa, la empresa a cargo se interesa en la


cantera de grava fina para el concreto. Una posible cantera cercana al lugar es difícil
de reconocer con exactitud. Un consultor especializado plantea tres posibles
escenario para la magnitud de la cantera; 50% de lo requerido; lo requerido; ó 150%
de lo requerido. Por indicaciones de superficie y un sólo pozo de sondeo, el consultor
asigna las siguientes probabilidades a estos escenarios:

50% de lo 150% de lo
Escenario Lo requerido
requerido requerido
Probabilidad 0,50 0,40 0,10

De las diferentes posibilidades que indique una muestra (Z1, Z2, Z3)
depende el verdadero escenario (desconocido), sin embargo, por la experiencia de la
empresa, las probabilidades de acierto del consultor con el resultado de la muestra en
los posibles escenarios se indican a continuación:

Resultado Muestrales
Z1, que favorece Z2, que favorece Z3, que favorece
Escenario
al 50% al 100% al 150%
50% de lo requerido 0.50 0.40 0.10
Lo requerido 0.40 0.50 0.10
150% de lo requerido 0.20 0.40 0.40

Antes los resultados de un segundo pozo de sondeo, que muestra un valor


cercano a lo requerido. ¿Cuáles son las nuevas probabilidades de la magnitud de
grava en la cantera?
E1 : {50% de lo requerido};
E2 : {Lo requerido};
E3 : {50% de lo requerido}.

[Z2] = [Z2 / E1] × [E1] + [Z2 / E2] × [E2] + [Z2 / E3] × [E3]

= 0,40 × 0,50 + 0,50 × 0,40 + 0,40 × 0,10 = 0,4400

47
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

[Z2 / E1] × [E1] 0,40 × 0,50


[E1 / Z2] = = = 0,4546
[Z2] 0,4400

[Z2 / E2] × [E1] 0,50 × 0,40


[E2 / Z2] = = = 0,4546
[Z2] 0,4400

[E3 / Z2] = 1 – 0,4546 – 0,4546 = 0,0908

Antes los resultados de un tercer pozo de sondeo, que muestra un valor


cercano a 50% de lo requerido. ¿Cuáles son las nuevas probabilidades de la magnitud
de grava en la cantera?

[Z1] = [Z1 / E1] × [E1] + [Z1 / E2] × [E2] + [Z1 / E3] × [E3]

= 0,50 × 0,4546 + 0,40 × 0,4546 + 0,20 × 0,0908 = 0,4273

[Z1 / E1] × [E1] 0,50 × 0,4546


[E1 / Z1] = = = 0,5320
[Z1] 0,4273

[Z1 / E2] × [E1] 0,40 × 0,4546


[E2 / Z1] = = = 0,4256
[Z1] 0,4273

[E3 / Z1] = 1 – 0,5320 – 0,4256 = 0,0424

5.4 Variables Aleatorias

En el proceso de construcción de medidas de probabilidad, distinguimos los


siguientes elementos:

48
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

El espacio muestral de interés Ω, se puede caracterizar por:

Definición 5.6: Sea X un experimento aleatorio y H un espacio muestral asociado al


experimento. Se dice que X es una variable aleatoria (v.a.) si es una función
(medible) de H en los números reales, es decir:

Nota: En términos más sencillos e intuitivos, se puede definir una variable aleatoria,
como una función que toma valores en probabilidad, es decir, no se puede predecir
con certeza sus valores ó resultados.
Si aceptamos esta segunda definición:

¿En qué situaciones se puede predecir con certeza?

Las variables aleatorias (v.a.) son caracterizadas según los posibles valores que éstas
puedan tomar, es decir, según su recorrido, que se simbolizará por ex.

Definición 5.7: Se dice que X es una v.a. discreta, si su recorrido ex. es numerable
(finito ó infinito).
APLICACIÓN 5.14: Variable aleatoria discreta con. ex finito

49
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

APLICACIÓN 5.15 Ejemplo de una variable aleatoria discreta con. ex infinito

Definición 5.8: Se dice que X es una variable aleatoria continua, si su recorrido ex.
es no numerable, es decir, que estos pueden tomar cualquier valor en intervalos de la
recta real (IR).

APLICACIÓN 5.16 Ejemplo de una variable aleatoria continua:

Funciones de distribución (Probabilidad acumulada)

Supongamos que se tiene que X es una v. a. discreta, donde los valores que
toma son: x1, x2, x3,..., xk, con x1 < x2 < x3 <... < xk, entonces se tiene que en e, se
pueden representar por:

La función de probabilidad acumulada, la probabilidad de que la variable


aleatoria X sea menor o igual a x ∈ e. Notar que es la misma noción de frecuencia
relativa acumulada de estadística descriptiva.

50
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Definición 5.9: Sea X es una v.a., entonces, se define la función de distribución de


probabilidad, como la probabilidad de que la variable aleatoria X sea menor o igual a
x ∈ e, y se simboliza por Fx(x) = [X ≤ x], la cual cumple con las siguientes
propiedades:
1. Fx(x) es una función no decreciente y continua a la derecha.

EJEMPLO En un problema de control de calidad, se tiene una población de 25


artículos, donde se asume que 10 presentan pequeños defectos, si se elige una muestra
al azar de 3 artículos. Determine Fx(x),
donde X:= Número de artículos defectuosos en la muestra.
Notemos en primer lugar que ex = {0, 1, 2, 3}, luego sí:

• x<0 ⇒ Fx(x) = [X ≤ x] = 0

⎛ 10 ⎞ ⎛ 15 ⎞
⎜⎜ ⎟ ⎜ ⎟⎟
⎝ 0 ⎟⎠ ⎜⎝ 3 ⎠ = 0,198
• 0≤x<1 ⇒ Fx(x) = [X ≤ x] =
⎛ 25 ⎞
⎜⎜ ⎟⎟
⎝ 3 ⎠
⎛ 10 ⎞ ⎛ 15 ⎞ ⎛ 10 ⎞ ⎛ 15 ⎞
⎜⎜ ⎟ ⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟
⎝ 0 ⎟⎠ ⎜⎝ 3 ⎠ + ⎝ 1 ⎠ ⎝ 2 ⎠ = 0,655
• 1≤x<2 ⇒ Fx(x) = [X ≤ x] =
⎛ 25 ⎞ ⎛ 25 ⎞
⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟
⎝ 3 ⎠ ⎝ 3 ⎠
⎛ 10 ⎞ ⎛ 15 ⎞ ⎛ 10 ⎞ ⎛ 15 ⎞
⎜⎜ ⎟ ⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟
⎝ 0 ⎟⎠ ⎜⎝ 3 ⎠ +⎝ 1 ⎠ ⎝ 2 ⎠
• 2≤x<3 ⇒ Fx(x) = [X ≤ x] =
⎛ 25 ⎞ ⎛ 25 ⎞
⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟
⎝ 3 ⎠ ⎝ 3 ⎠

⎛ 10 ⎞ ⎛ 15 ⎞
⎜⎜ ⎟ ⎜ ⎟⎟
⎝ 2 ⎟⎠ ⎜⎝ 1 ⎠ = 0,949
+
⎛ 25 ⎞
⎜⎜ ⎟⎟
⎝ 3 ⎠

• x≥3 ⇒ Fx(x) = [X ≤ x] = = 1,000

51
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

La gráfica de Fx(x) está dada por:

Definición 5.10: Sea X una v.a discreta., entonces se define la función de cuantía ó
masa de probabilidad, como la probabilidad de que la variable aleatoria X tome un
valor específico x, que se simboliza por fx(x) = [X = x] y cumple con las siguientes
propiedades:

1. fx(x) = [X = x] ≥ 0 , ∀ x ∈ e.

3. fx(x) = [X ≤ x] – [X ≤ x – 1] = Fx(x) – Fx(x – 1)

De donde se tiene que la función de cuantía toma valores distintos de cero


sólo para x ∈ ex = {0, 1, 2, 3}, y estos son:

⎛ 10 ⎞ ⎛ 15 ⎞ ⎛ 10 ⎞ ⎛ 15 ⎞
⎜⎜ ⎟ ⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟
⎝ 0 ⎟⎠ ⎜⎝ 3 ⎠ = 0,198 ; f (1) = ⎝ 1 ⎠ ⎝ 2 ⎠ = 0,457
fx (0) = x
⎛ 25 ⎞ ⎛ 25 ⎞
⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟
⎝ 3 ⎠ ⎝ 3 ⎠

⎛ 10 ⎞ ⎛ 15 ⎞ ⎛ 10 ⎞ ⎛ 15 ⎞
⎜⎜ ⎟ ⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟
⎝ 2 ⎟⎠ ⎜⎝ 1 ⎠ = 0,293; f (3) = ⎝ 3 ⎠ ⎝ 0 ⎠ = 0,052
fx (2) = x
⎛ 25 ⎞ ⎛ 25 ⎞
⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟
⎝ 3 ⎠ ⎝ 3 ⎠

52
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Donde la gráfica de fx(x) ([X = x]) es:

En el caso de una variable aleatoria continua X, su recorrido ex. es no


numerable, y luego [X = x] = 0 ∀ x ∈ e. Para este caso tenemos la función de
densidad de probabilidad, definida más adelante.

A modo de ejemplo, consideremos la variable aleatoria X:=Tiempo de espera


en la fila de un banco, la cual es claramente una variable aleatoria continua, cuya
función de densidad es fx(x) hipotética, se destaca en la figura.

Definición 5.11: Sea X es una v.a. continua, entonces fx(x) es una función de
densidad de probabilidad (f.d.p.) para X, sí ‘fx(x)’, satisface las propiedades:

1. fx(x) ≥ 0, para casi todo x ∈ e.

53
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Un modelo adecuado para fX(x), la función de densidad asociada a los tiempos


de espera en la fila del banco (en minutos), puede ser:

1 ⎧ x⎫
f ( x) = exp ⎨− ⎬ , x>0
45 ⎩ 45 ⎭
En primer lugar verificamos que fX(x), es f.d.p. En primer término, se puede
observar que fX(x) es decreciente con imagen positiva, y verifica que:

1 ⎧ x⎫
∫ 45
exp ⎨ − ⎬ dx = 1
⎩ 45 ⎭
0
Como fX(x) es f.d.p., podemos calcular probabilidades, como por ejemplo: La
probabilidad que una persona se demore más de 45 minutos, en ser atendida,
simbólicamente [X > 45].


1 ⎧ x⎫
[X > 45] = ∫ 45
45
exp ⎨− ⎬ dx = 0,368.
⎩ 45 ⎭

5.5 Valor Esperado

Definición 5.12: Sea X una v.a, entonces, se define el valor esperado de una función
real, g(X) de X, como:
⎧ ∑ g (x) P [ X = x ]
⎪ x∈ℜ
⎪⎪ x
„[g(X)] = ⎨

⎪ ∫ g (x) f (x) dx
⎪⎩ x∈ℜ x

El valor esperado de g(X) es un número, además existe un conjunto de


funciones g(X) cuyo valor esperado, representa medidas específicas, ya sea de
tendencia central, variabilidad ó forma, etc.

Definición 5.13: Sea X es una v.a, se define el valor esperado ó esperanza


matemática de X, como:

⎧ ∑ x P [X = x]
⎪⎪ x∈ℜ x
„[X] = ⎨
⎪ ∫ x f (x) dx
⎪⎩ x∈ℜ x

54
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Propiedades: Sean a y b constantes y X una variable aleatoria, entonces:

1. „[a] = a

2. „[X] = . = constante.

3. „[aX] = a „[X]

4. „[aX + b] = „[aX] + „[b] = a „[X] + b

Definición 5.14: La varianza( V(X) ) de una variable aleatoria X, se define como el


valor esperado del cuadrado de la diferencia entre la variable aleatoria y su valor
esperado, la cual está dada por:

⎧ ∑ [x - E[X]]2 P [ X = x ]
⎪⎪ x∈ℜ x
V(X)=„[(X – „[X])2] = ⎨
⎪ ∫ [x - E[[X]] f (x) dx
2

⎪⎩ x∈ℜ x

Notemos que en este caso la función cuadrática es g(X)= (X – „[X])2, y que


mediante operaciones algebraicas se puede descomponer en la diferencia de dos
valores esperados, más fáciles de calcular desde el punto de vista del cálculo, como se
demuestra a continuación:

„[(X – „[X])2] = „[(X – „[X]) (X – „[X])] = „[X2 – 2× X× „[X] + („[X])2]

= „[X2] – „[2 × X × „[X]] + „[(„[X])2]

= „[X2] – „[2 × X × .] + „[.2]

= „[X2] – 2× . × „[X] + .2

= „[X2] – 2× . × . + .2

= „[X2] – 2× .2 + .2

= „[X2] – .2 = „[X2] – („[X])2

donde;

⎧ ∑ x 2 P [X = x]
⎪⎪ x∈ℜ x
„[X2] = ⎨
⎪ ∫ x f (x) dx
2

⎪⎩ x∈ℜ x

Propiedades: Sean a y b constantes y X una variable aleatoria cualquiera, entonces:

55
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

1. •[a] = 0

2. •[X] = 52 = constante.

3. •[aX] = a2 •[X]

4. •[aX + b] = •[aX] + •[b] = a2 •[X] + 0 = a2 •[X]

APLICACIÓN 5.16: La función de probabilidad de X, el número de defectos por


cada 10 metros de una tela sintética en rollos continuos de ancho uniforme, es:

x 0 1 2 3 4
X(x) 0,41 0,37 θ 0,05 0,01

¿Cuál debe ser el valor de θ?

En primer lugar θ ≥ 0 , y además debe verificar que:


4
∑ [X = x] = 1 ⇒ 0,41 + 0,37 + θ + 0,05 + 0,01 = 1,00
x= 0
⇒ θ = 0,16

La gráfica de la función de distribución probabilidad, se presenta en forma


escalonada, ocurriendo los saltos en cada uno de los puntos, donde la variable
aleatoria tiene probabilidad positiva, como se muestra a continuación

⎧0, 00 x<0 1.0


⎪0, 41 x <1 0.8

⎪0, 78 x<2 0.6
FX(x)

FX ( x) ⎨
⎪0,94 x<3 0.4

⎪0,99 x<4 0.2



⎩1, 00 x≥4 0.0
-1 0 1 2 3 4
x 5

También es posible realizar el cálculo de algunas probabilidades sencillas


como las que se muestran a continuación:

• [X > 3] = 0.01


[1 < X < 3] [X = 2] 0,16
• [X > 1 / X < 3] = = = = 0,1702
[X < 3] [X < 3] 0,94

56
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Determinar el valor esperado, varianza y la desviación estándar de X.


„[X] = µ = 0 × 0, 41 + 1× 0,37 + ... + 4 × 0, 01 = 0,88 (valor esperado)

„[X2] = 02 × 0, 41 + 12 × 0,37 + ... + 42 × 0, 01 = 1,62

•[X] = σ 2 = „[X2] – („[X])2 = 1,62 – 0,882 = 0,8456 (Variabilidad)

σ = 0.8456 = 0,91956 (desviación estándar)

Además, el costo esperado, si suponemos que el costo por defecto es:

⎧500 si x < 2

G ( X ) = ⎨5000 si x > 2
⎪1500 e.o.c.

„[G(X)] = 500× [X < 2] + 5000× [X > 2]+ 500× [X = 2]

= 500× (0,41 + 0,37) + 5000× (0,05+0,01) + 1500× 0,16

= 930.

APLICACIÓN 5.17: Si suponemos que la función de densidad del tiempo de vida


(horas de operación), hasta que fallen ciertas máquinas en un proceso productivo es:

⎧ 80
⎪ t ≥ 80
f (t ) = ⎨ t 2
⎪⎩ 0 e.o.c.

¿Cuál es la probabilidad de que una máquina elegida al azar funcione más de 120
horas?

Sea T:= v.a tiempo de vida de una máquina [horas de operación], se pide:

120
80 ⎡ 80 120 ⎤ 2
[T > 120] = 1 - [T ≤ 120] = 1 – ∫ t2
dt = 1 – ⎢− ⎥ =
⎢⎣ t 80 ⎥⎦ 3
80

También es posible determinar probabilidades condicionales, como por


ejemplo si se ha observado que cierta máquina lleva funcionando más 150 horas
(condición), la probabilidad de que falle antes de las 200 horas, está dada por:

57
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

[150 ≤ T < 200]


[T < 200 / T ≥ 150] =
1 – [T ≤ 150]

200
80
∫ t2
dt 2
150 15 1
= = =
150
80 8 4
1– ∫ t2
dt 15
80

5.6 Algunos Modelos Comunes en Ingeniería

Los modelos que estudiaremos son frecuentemente utilizados en ingeniería,


están caracterizados por la función de masa de probabilidades en el caso discreto, y
densidad en el caso continuo.

5.6.1 Modelo Hipergeométrico

Es un modelo de característica discreta (distribución), útil para poblaciones


finitas.

Supongamos que N es el número de elementos de la población, por ejemplo;


la producción de artículos en un día determinado, la cantidad de habitantes de una
determinada región, etc. Además, supongamos que k, es el numero de elementos de
la población que cumplen con cierta cualidad observable (k < N), por ejemplo, la
cantidad de defectuosos de la producción de artículos de ese día, etc. Es posible
observar que la población de N elementos ha sido dividida en dos grupos: Aquellos
que pertenecen al grupo 1, ‘E1’, como los artículos no defectuosos, y aquellos que
pertenecen al grupo 2, ‘E2’, como los artículos no defectuosos.

Si de esta población se toma una muestra aleatoria de n elementos, como se


muestra la figura. Entonces la variable aleatoria, X:= Número de artículos en la
muestra que cumplen con la cualidad (ser defectuoso por ejemplo), puede modelarse
por la siguiente función de masa de probabilidad:

⎛ k ⎞ ⎛ N-k ⎞
⎜ ⎟ ⎜ ⎟
a n-a
[X = a] = ⎝ ⎠ ⎝ ⎠,
n
a = 1, 2, ... , min{k, n}
⎛ N⎞
⎜ ⎟
⎝ n ⎠

58
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

APLICACIÓN 5.18: Suponga una caja con 25 artículos de los cuales 10 presentan
una cualidad especial (ser rojos, defectuosos, etc.), entonces si se toma una muestra
de 3 artículos, y se define:

X:= número de artículos que presentan esa cualidad especial en la muestra.

Claramente en la muestra no puede haber más artículos con la cualidad


especial, que el tamaño de la misma. Sin embargo, si en el lote hubiese sólo 2
artículos con esa cualidad especial, en la muestra no puede haber más dos con la
cualidad especial. Las distintas alternativas para este caso son:

⎛ 10 ⎞ ⎛ 15 ⎞ ⎛ 10 ⎞ ⎛ 15 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝ 0 ⎠ ⎝ 3 ⎠ ⎝ 1 ⎠ ⎝ 2 ⎠
[X = 0] = = 0,198; [X = 1] = = 0,457
⎛ 25 ⎞ ⎛ 25 ⎞
⎜ ⎟ ⎜ ⎟
⎝ 3 ⎠ ⎝ 3 ⎠

⎛ 10 ⎞ ⎛ 15 ⎞ ⎛ 10 ⎞ ⎛ 15 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
2 ⎠ ⎝ 1 ⎠ 3 ⎠ ⎝ 0 ⎠
[X = 2] = ⎝ = 0,293 [X = 3] = ⎝ = 0,052
⎛ 25 ⎞ ⎛ 25 ⎞
⎜ ⎟ ⎜ ⎟
⎝ 3 ⎠ ⎝ 3 ⎠
La gráfica de Px(x) (P[X = x]) está dada por:

También es posible demostrar que en el caso general términos la media y


varianza son respectivamente:
k
„[X] = µ = n ×
N
k ⎛ k ⎞ ⎛ N - n⎞
•[X] = σ 2 = „[X2] – („[X])2 = n × × ⎜1 - ⎟×⎜ ⎟.
N ⎝ N ⎠ ⎝ N - 1⎠

59
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

APLICACIÓN 5.19: Considere un fabricante de lanchas que compra motores a una


compañía donde se fabrican bajo estrictas normas de especificación. El fabricante
recibe un lote de 40 motores. Su plan de muestreo para aceptar el lote consiste en
seleccionar ocho motores al azar y someterlos a prueba. Si encuentra que ninguno de
los motores presenta serios defectos, el fabricante acepta el lote, de otra forma lo
rechaza. Si el lote contiene dos motores con serios defectos, ¿Cuál es la probabilidad
de que el lote sea aceptado?

X: El número de motores que presentan defectos en la muestra.

⎛ 2⎞ ⎛ 38 ⎞
⎜ ⎟ ⎜ ⎟
0 8 ⎠
[X = 0] = ⎝ ⎠ ⎝ = 0,6359
⎛ 40 ⎞
⎜ ⎟
⎝ 8 ⎠
¿Cuántos motores se espera sean defectuosos en la muestra?

k 2
„[X] = µ = n × =8 × = 0,4 Motores
N 40

5.6.2 Modelo Binomial

Esta es una de las distribuciones más útiles, pues sus áreas de aplicación
incluyen: medicina, ventas, investigaciones de mercado, inspecciones de calidad, etc.

Consideremos nuevamente una población que cumple con características


dicotómicas, es decir, un grupo de la población cumple con tener la característica y
otro no, llámese ‘éxito’ aquel elemento que cumple con la característica, y ‘fracaso’
el elemento que no cumple. Supongamos además, que la probabilidad de éxito ‘p’ se
mantiene constate en el curso de los ensayos. .

Si de esta población se escogen ‘n’ elementos en forma independiente


(sustitución), y se define la variable aleatoria, X:= Número de éxitos en estos n
ensayos, entonces X sigue un modelo Binomial.

La función de masa de probabilidades se puede deducir de la siguiente forma:


Consideremos el caso particular de que en n ensayos independientes se obtengan ‘a’
éxitos consecutivos en los primeros a ensayos y posteriormente “n – a” fracasos.

Como los ensayos son independientes y la probabilidad de éxito es constante,


la probabilidad en este caso es el siguiente producto:

60
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Extendamos ahora el problema para obtener ‘a’ éxitos en n ensayos sin


restricción. Como se puede apreciar en la figura anterior, esta muestra sólo un orden
donde se cumple con el requisito ‘a’ éxitos, pero no todos los posibles, ya que los
éxitos pueden presentarse en distintas combinaciones en los ‘n’ ensayos. Luego
probabilidad de obtener ‘a’ éxitos en ‘n’ ensayos con el natural requisito de: 0 ≤ a ≤
n, está dada por:

⎛ n⎞
[X = a] = ⎜ ⎟ × pa × (1 – p)n – a, a = 0, 1, 2,.. n
⎝a⎠

APLICACIÓN 5.20: Considere nuevamente el fabricante de lanchas. El fabricante


recibe un lote de 40 motores. Su plan de muestreo para aceptar el lote consiste en
seleccionar ocho motores al azar y someterlos a prueba, si ninguno de los motores
presenta serios defectos acepta el lote, de otra forma lo rechaza. Si el lote contiene
dos motores con serios defectos, ¿Cuál es la probabilidad de 15 lotes muestreados 10
sean aceptados?
Consideramos las siguientes situaciones:

X: número de lotes aceptados.


p: probabilidad que un lote sea aceptado (0,6359 calculado anteriormente), entonces:

⎛ 15 ⎞
[X = 10] = ⎜ ⎟ × 0,635910 × (1 – 0,6359)15 – 10 = 0,2078
⎝10 ⎠
El número medio esperado de lotes que serán aceptados, que está dado por:

„[X] = µ = n × p = 15 × 0,6359≈ 9,54 lotes aceptados (Interpretar)

Además se puede determinar que la varianza es:

•[X] = σ 2 = n × p × (1 – p) = 15 × 0,6359 × 0,3641≈3,47 (Interpretar)

APLICACIÓN 5.21: Suponga que el 65% de un particular tipo de ratas, cuando es


inyectada con una dosis de estimulante, muestra un comportamiento agresivo. Un
experimentador aplica el estimulante a quince ratas, una después de otra y observa la
presencia o ausencia de agresividad en cada uno de los casos. Determine las
siguientes probabilidades (bajo el supuesto de independencia entre las probabilidades
de agresividad de las ratas).

Exactamente dos ratas agresivas.

Sea X:=Número de ratas (experimento) que muestra comportamiento agresivo

61
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

⎛15 ⎞
[X = 2] = ⎜⎜ ⎟⎟ × 0,652 × 0,3513 = 0,0001 (0,0000525)
⎝2⎠

Diez o más ratas son agresivas.

9
⎛ 15 ⎞
[X ≥ 10] = 1 – [X ≤ 9] = 1 – ∑ ⎜ x ⎟ × 0, 65x × 0,3515− x
x =0 ⎝ ⎠

= 1 – 0,4357 = 0,5643 (Uso de Tablas o calculadoras)

Suponga que el experimentador aplicó el estimulante a 80 ratas, de las cuales


muestreó 12. La probabilidad de tener exactamente dos ratas agresivas es:

⎛ 52 ⎞⎛ 28 ⎞
⎜⎜ ⎟⎟⎜⎜ ⎟⎟
2 10
[Y = 2] = ⎝ ⎠⎝ ⎠ = 0,0003
⎛ 80 ⎞
⎜⎜ ⎟⎟
⎝ 12 ⎠

En este último ejemplo, se trabaja con el supuesto que de la población, el


65%, debería tener un comportamiento agresivo, de ahí el hecho que se espera que
existan 52 ratas agresivas de las 80 bajo estudio.

Como se habrá podido apreciar el modelo binomial es muy parecido al


modelo Hipergeométrico, pues en ambos se miden éxitos sobre la base de
poblaciones dicotómicas (éxito v/s fracaso), sin embargo poseen importantes
diferencias, como lo son:
• En el modelo Hipergeométrico se tiene una población finita y el muestreo es
sin reemplazo.
• Si en el modelo binomial, el tamaño de la población es finito, para mantener la
independencia y probabilidad de éxito constante, se debe utilizar un muestreo
con reemplazo.
• Si en el modelo binomial, el tamaño de la población es infinito (muy grande),
sólo debemos garantizar probabilidad de éxito constante.

Las diferencias entre ambos modelos, disminuyen notablemente cuando el


tamaño de la población (N) es grande, y la relación entre el tamaño de la muestra (n),
y el tamaño de la población (N) es pequeño.

k
En este caso se muestra que: X ∼ H(N; k; n) ≈ B(n, ).
N

62
Universidad Técnica Federico Santa María Renato Allende Olivares
Ingeniería de Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

En la Tabla 5.4 se observan las probabilidades para una muestra de 10


elementos, donde la población es de 100 elementos, y hay 20 elementos con la
característica. Se aprecia la aproximación de la distribución Hipergeométrica por la
distribución binomial.

Tabla 5.4: Probabilidades exactas y aproximadas


x Hipergeométrica Binomial
2 0,3182 0,30199
3 0,2092 0,20133
4 0,0841 0,08808
5 0,0215 0,02642
6 0,0035 0,00551
7 0,0004 0,00079
8 0,0000 0,00007
9 0,0000 0,00000
10 0,0000 0,00000

5.6.3 Modelo Poisson

Otro modelo de distribución discreta, que se utiliza en una amplia variedad de


situaciones, donde se cuenta el número de eventos que ocurren aleatoriamente en el
tiempo (área, volumen, etc.) a una tasa constante, es el modelo Poisson. Ejemplos
típicos son:

• Números de Aviones, Buques, Camiones que llegan a un punto.


• Número de defectos en una lámina de algún metal.
• Número de bacterias en un cultivo.
• Número de árboles dañados, etc.

Si se define X:= Número de eventos que ocurren por unidad de tiempo


(espacio, volumen), entonces se prueba que bajo ciertos supuestos:

−λ a
e λ
[X = a] = , a = 0, 1, 2,....
a!
En este modelo se puede probar que el número esperado es „[X] = λ , y la
variabilidad en torno al valor medio es •[X]= λ .

APLICACIÓN 5.22: Suponga que el número de defectos en láminas de 1 metro por


2 metros se distribuyen aleatoriamente en las láminas, con una media de 6 defectos
por lámina. ¿Cuál es la probabilidad de que en una lámina escogida al azar se
encuentren ocho defectos?

63
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

X:= Número de defectos [Por lámina], luego X ≈ c(6)

e −6 6 8
[X = 8] = = 0,1033
8!
Se puede verificar que cuando el tamaño de una muestra es grande, y la
probabilidad que de que cumpla con la característica es pequeña, existe una buena
aproximación entre los resultados de modelo binomial con los resultados de un
modelo Poisson, tal como se muestra a continuación:

X ∼ B(n, p) ≈ c(n × p).


Bajo las idénticas suposiciones se puede apreciar además la siguiente
relación:

X ∼ H (N; k; n) ≈ B (n, p) ≈ c(n× p).

Considere una población de 100 elementos, donde los elementos que cumplen
con una característica son 20 y se toma una muestra de 10 elementos. La
aproximación de la distribución Hipergeométrica con la distribución binomial y con
la distribución Poisson se muestra en la tabla siguiente:

Tabla 5.5: Probabilidades exactas y aproximadas


x Hipergeométrica Binomial Poisson
2 0,3182 0,30199 0,27067
3 0,2092 0,20133 0,18045
4 0,0841 0,08808 0,09022
5 0,0215 0,02642 0,03609
6 0,0035 0,00551 0,01203
7 0,0004 0,00079 0,00344
8 0,0000 0,00007 0,00086
9 0,0000 0,00000 0,00019
10 0,0000 0,00000 0,00004

APLICACIÓN 5.23: Considere nuevamente el fabricante de lanchas que compra


motores a una compañía donde se fabrican bajo estrictas normas de especificación. El
fabricante recibe un lote de 1000 motores. Su plan de muestreo para aceptar el lote
consiste en seleccionar 15 motores al azar y someterlos a prueba. Si encuentra que
ninguno de los motores presenta serios defectos, el fabricante acepta el lote, de otra
forma lo rechaza. Si el lote contiene 40 motores con serios defectos, ¿cuál es la
probabilidad de el lote sea aceptado?

Si definimos X: Número de motores defectuosos en el lote.

Se tiene la aproximación:

64
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

⎛ 40 ⎞ ⎛ 960 ⎞
⎜⎜ ⎟⎟ ⎜⎜ ⎟
⎝ 0 ⎠ ⎝ 15 ⎟⎠
[X = 0] = ≈ exp {-0,60} = 0,5488
⎛1000 ⎞
⎜⎜ ⎟⎟
⎝ 15 ⎠

A modo de ejercicio se compara con el resultado de la probabilidad exacta que


para este caso particular es coincide con el esquema de la aproximación binomial.

⎛ 40 ⎞ ⎛ 960 ⎞
⎜⎜ ⎟⎟ ⎜⎜ ⎟
⎝ 0 ⎠ ⎝ 15 ⎟⎠
[X = 0] = = 0,5397
⎛1000 ⎞
⎜⎜ ⎟⎟
⎝ 15 ⎠

5.6.4 Modelo Normal

La distribución Normal o Gausiana es, sin lugar a dudas, la más importante y


la de mayor uso en los modelos para variables aleatorias continuas. Es la piedra
angular en el análisis de datos, y en la aplicación de la inferencia estadística.

Ejemplos comunes del uso de este modelo, se encuentran en todas las áreas
del conocimiento humano, por ejemplo: datos de temperatura, precipitación pluvial;
datos de voltajes, datos de resistencias, errores de medición, etc.

En general es un modelo muy popular, es inicialmente utilizado para


representar errores o desviaciones en mediciones físicas. El modelo Normal es
representado por la siguiente función de densidad:

1 ⎧⎪ 1 ⎛ x − µ ⎞ 2 ⎫⎪
f ( x) = exp ⎨− ⎜ ⎟ ⎬ ; x ∈ ℜ , µ ∈ ℜ , σ ∈ ℜ+.
2 πσ ⎪⎩ 2 ⎝ σ ⎠ ⎪⎭

Como se puede observar, la curva presenta una cima o máximo, además es


simétrica con respecto a su valor medio µ .

Notación: X ∼ N(µ ; σ 2) , donde µ es su valor medio, y σ es la desviación.

65
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

X −µ
Si tomamos la transformación: Z = , entonces:
σ

Si X∼N (µ ; σ 2), bajo esta transformación la variable aleatoria Z, continúa


siendo normal, con media cero y varianza, es decir Z ∼ N(0, 1).

La variable aleatoria Z, se denomina normal estándar y se encuentra


ampliamente tabulada para el cálculo de probabilidades (tablas, calculadoras), la cuál
mantiene la forma de la normal original centrada en cero.

APLICACIÓN 5.24: El diámetro de un eje metálico empleado en la unidad de disco


de una computadora se supone tiene distribución normal. La media actual del proceso
de fabricación es de 0,1505 [plg.] y coeficiente de variación de 0,004. Se han
determinado los límites de especificación para el diámetro del eje en el intervalo
0,1500 ∓ 0,0015 [plg.]. Calcule la fracción de ejes producidos que cumplen con las
especificaciones.

X: Diámetro de un eje metálico [en plg.]


X ∼ N (0,1505, σ2); CV = 0,004 ⇔ σ = 0,004 µ ⇒ σ = 0,00602

⎡ 0,1485 − 0,1505 ⎤
[X < 0,1485] =  ⎢ Z ≤ ⎥ = [Z ≤ 3,32] = 0,0005
⎣ 0,000602 ⎦

⎡ 0,1515 − 0,1505 ⎤
[X < 0,1515] =  ⎢ Z ≤ ⎥ = [Z ≤ 1,66] = 0,9515
⎣ 0,000602 ⎦

La fracción de ejes producidos que cumplen con las especificaciones es


95,1%.

66
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

APLICACIÓN 5.25: Las bandas de plástico que se utilizan en un dispositivo


electrónico para detección, se fabrican de manera que satisfagan una especificación
de valor máximo de 305,28 mm. y una especificación mínima de 304,55 mm. Si la
dimensión de las bandas es menor que la especificación mínima, se desechan, si son
más grandes, se reelaboran. Se ha probado que las dimensiones de estas piezas están
distribuidas normalmente con una desviación estándar de 0,25 mm. y que sólo el 5%
de las bandas se desechan. ¿Cuál es el tamaño medio de las bandas de plástico?

Sea X:= Dimensión de las bandas de plástico [en mm.] X ∼ N ( µ x , (0,25)2)

⎡ 304,55 − µ x ⎤
[X < 304,55] = 0,05 ⇔  ⎢Z ≤ ⎥ = 0,05
⎣ 0,25 ⎦

304,55 − µ x
⇒ = –1,645 µ x = 304,96 [mm]
0,25

¿Qué porcentaje de bandas se reelabora?

⎡ 305,28 − 304,96 ⎤
[X > 305,28] =  ⎢ Z ≥ ⎥ = 1 – [Z ≤ 1,28] = 0,1003
⎣ 0,25 ⎦

Luego el porcentaje de bandas se reelabora es de 10,03%.

Si se toma una muestra de 24 bandas. ¿Cuál es la probabilidad de que no


menos de 22 cumplan con las especificaciones, sin necesidad de reelaboradas?

Sea Y:= Número de bandas encontradas que cumplen con las especificaciones.

⇒ Y ∼ B (24, p) p = 1 – 0,05 – 0,1003 = 0,8497 ≈ 0,85

⇒ [ Y ≥ 22] = 1 – [Y ≤ 21] = 0,2798

Luego la probabilidad de que no menos de 22 cumplan con las especificaciones


es de 27,98%.

¿Cuál es la probabilidad de que no menos de 5 sean reelaboradas?

Sea Y:= Número de bandas encontradas que son reelaboradas.

⇒ Y ∼ B (24, p) p = 0,1003 ≈ 0,10

⇒ [ Y ≤ 5] = 0,9723

Luego la probabilidad de que no menos de 5 cumplan con ser reelaboradas es de


97,23%.

67
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

.6.5 Modelo Gamma y Exponencial

La distribución Gamma es un modelo muy popular en ingeniería, por ejemplo:


Teoría de colas ó líneas de espera, Confiabilidad, Hidrología, Energía Eólica, etc.

Se presenta en múltiples formas, desde distribuciones totalmente asimétricas


positivas hasta distribuciones completamente simétricas, sin contemplar asimetrías
negativas, dependiendo de dos parámetros: λ, denominado parámetro de escala; y η,
denominado parámetro de forma. Su función de densidad es:

λη xη −1
f(x) = exp{−λx} ; x ∈ ℜ+ , λ ∈ ℜ+ , η ∈ ℜ+.
Γ(η )

λ η
1/2 3/2
1/2 1/2
1/2 1
1/2 4
1/2 6

Como casos particulares; cuando el parámetro de


forma: η = 1, se le llama distribución exponencial de parámetro λ ; cuandoη es un
número natural arbitrio se le llama distribución Erlang.

En el caso de la distribución exponencial, el cálculo de probabilidades es


sencillo al poder determinar su función de distribución de forma explicita, es decir:

f(x) = λ exp{ − λ x} ; x ∈ ℜ+ , λ ∈ ℜ+
x
entonces, para x > 0 ⇒ FX(x) =
∫ λ exp{ − λt}dt = 1 – exp{ − λ x}
0

68
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

La función de distribución de la exponencial permite el cálculo de todos los


cuantiles de esta distribución, mediante el despeje de la función de distribución, es
decir:

Pj ≈ FX(j/100) ⇔ 1 – exp{ − λ P j } = j/100

1 ⎛ j ⎞
⇔ Pj ≈ − ln ⎜1 −
λ ⎝ 100 ⎟⎠

APLICACIÓN 5.26: Una empresa de comida que abastece a los vuelos del
Aeropuerto de Santiago de Chile. El Ingeniero en Calidad de Servicio se encuentra
altamente preocupado, por la cantidad de reclamos que ha recibido la empresa en los
tiempos de entrega de los productos, que afectan directamente la calidad de éste. Los
tiempos de conservación de cada producto son bien modelados por una distribución
exponencial, con un tiempo medio de conservación de τ días. ¿Cuál es la
probabilidad que un producto tenga un tiempo de conservación superior a su tiempo
medio esperado?

T : Tiempo de conservación del producto [en días]


⎧1 ⎫
⇒ T ∼ exp ⎨ ⎬ „[T] = τ días
⎩τ ⎭

⎧ 1 ⎫
[T > τ] = exp ⎨− τ ⎬ = exp {– 1} = 0,3679 (SIEMPRE)
⎩ τ ⎭
Si la probabilidad de que un producto tenga un tiempo de conservación mayor
que 20 días es de 0,445. ¿Cuál es el tiempo medio de conservación de los alimentos?

⎧ 1 ⎫
[T > 20] = 0,445 ⇔ exp ⎨− 20 ⎬ = 0,445
⎩ τ ⎭

−20
⇒ τ= ≈ 24,70
ln(0, 445)

5.6.6 Modelo Weibull y Exponencial

La distribución Weibull popularizada por el físico del mismo nombre,


adquiere particular importancia en modelos relacionados con Tiempos de vida,
Velocidad del viento, Confiabilidad, etc.

La función de densidad f(x), depende de dos parámetros: λ, denominado


parámetro de escala; y α, denominado parámetro de forma, y está dada por:

f(x) = α λα x α −1 exp{−(λx)α } ; x ∈ ℜ+ , λ ∈ ℜ+ , α ∈ ℜ+.

69
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

La distribución muestra características uní modales cuando el parámetro de


forma α es mayor que 1, y a medida que éste crece para un parámetro de escala λ fijo,
la distribución es más simétrica.

λ α
1/2 1/5
1/2 1/2
1/2 2
1/2 4
1/2 6

Observación: Cuando el parámetro α=1, se recupera el modelo exponencial.

En el caso de la distribución Weibull, el cálculo de probabilidades es sencillo


al poder determinar su función de distribución de forma explicita, es decir:

∫ αλ exp{ − (λt )α }dt = 1 – exp{ − (λ x)α }


α α −1
para x > 0 ⇒ FX(x) = t
0

La función de distribución de la exponencial permite el cálculo de todos los


cuantiles de esta distribución, mediante el despeje de la función de distribución, es
decir:

Pj ≈ FX(j/100) ⇔ 1 – exp{ − (λ P j )α } = j/100

−1/ α
1⎛ ⎛ j ⎞⎞
⇔ Pj ≈ ⎜ ln ⎜1 −
λ ⎝ ⎝ 100 ⎟⎠ ⎟⎠

70
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

6. CUARTO MÓDULO
6.1 Inferencia Estadística

En Inferencia clásica y Teoría de decisiones, las observaciones son


postuladas tomando valores en forma aleatoria, la ley ó distribución de la(s)
variable(s) aleatoria(s) observable(s), P, se asume pertenece a una familia
paramétrica conocida en su forma general, pero no se conoce el(los) valor(es) de
parámetro(s). Un objetivo fundamental de la inferencia estadística, es determinar
valor(es) factibles de parámetro(s) a partir de los datos.

La utilidad de los datos, generados a partir de muestras probabilísticas, es


inferir características esenciales, de la distribución de la muestra a la población

Una de las áreas asociadas a la inferencia estadística, es la estimación de


parámetros, para introducirnos en el tema se requieren algunas definiciones.

Definición 6.1Parámetro. Es una característica numérica de la distribución de la


población, que describe, parcial o completamente, la función de masa de probabilidad
de la característica de interés, habitualmente se simboliza por la letra griega ‘ θ ’.

Definición 6.2Espacio Paramétrico. Es el conjunto de posibles valores que puede(n)


ser considerado(s) para el(los) parámetro(s). Se simboliza por la letra griega
mayúscula ‘Θ’.

La Figura 6.1, se muestra esquemáticamente el problema de estimación.

Figura 6.1 El problema de estimación.

Los posibles valores de la muestra aleatoria constituyen el espacio de


información, y utilizando algún resumen apropiado (Estadística), construimos un
estimador de(l) parámetro(s) asociado(s) a la familia de distribución supuesta.

71
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Distinguimos dos métodos en la estimación de parámetros: el primero


conocido como estimación puntual, trata de especificar un valor numérico para el
(los) parámetro(s) que se desea estimar; el segundo, que entrega un conjunto de
posibles valores asociados al parámetro como se muestra en la Figura 6.1.

La estimación puntual de parámetros es, habitualmente, un primer paso para


la utilización de estos estimadores en la construcción de intervalos de posibles
valores asociados al verdadero valor del parámetro.

6.2 Método de Momentos

Es quizás el método más antiguo (al igual que método de mínimos cuadrados)
para la estimación puntual de parámetros, consiste en igualar los momentos
apropiados de la distribución de la población con los correspondientes momentos
muéstrales. Este método conduce a que existan, tantas ecuaciones como parámetros
se deseen estimar de la población.

Definición 6.3Momentos muestrales. Sean X1, X2, … , Xn, una muestra aleatoria con
una función de masa de probabilidad f(x; θ ). Entonces el r-pésimo momento muestral
en torno a cero se define por:

∑X
1 r
Mr = i
n i =1

donde se puede observar, que para el caso de r = 1, se obtiene la media muestral,


mientras que para los casos de r = 2, 3, 4, se obstinen indicadores que ayudan al
cálculo de medidas de variabilidad y forma respectivamente.

Definición 6.4 Momentos Poblacionales. Sean X1, X2, … , Xn, una muestra aleatoria
(variables independientes con idéntica distribución) con una función de probabilidad
f(x; θ ). Entonces el r-ésimo momento poblacional en torno a cero se define por:

µr = „[Xr]

donde se puede observar, que para el caso de r = 1, se obtiene la media , mientras que
para los casos de r = 2, 3, 4, se obstinen indicadores que ayudan al cálculo de
medidas de variabilidad y forma poblacionales.

APLICACIÓN 6.1 Sea X1, X2,..., Xn una muestra aleatoria de tamaño n de una
población la cual se supone tiene función de cuantía de probabilidad dada por:

[X = x] = p x (1 − p )1− x x = 0,1.

72
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Entonces el estimador de momentos p , de p, consiste en igualar el primer


momento muestral al primer momento poblacional, es decir:

„[X] = 1 × p +0 × (1 – p) = p = µ1 ⇒ µ1 = M1

⇒ p = X.

APLICACIÓN 6.2 Sea X1,..., Xn una muestra aleatoria de tamaño 100 de una
población la cual se supone tiene función de densidad de probabilidades:

⎧1 ⎧ x⎫
⎪ exp ⎨− ⎬ x > 0 , θ > 0
f (x) = ⎨θ ⎩ θ⎭
⎪ 0 e.o.c.

Entonces determinar el estimador de momentos θ , de θ , consiste en igualar el


primer momento muestral al primer momento poblacional, es decir:


x ⎧ x⎫
„[X] = exp ⎨− ⎬ dx = θ = µ1 ⇒ µ1 = M1
θ ⎩ θ⎭
α
~
⇒ θ = X

6.3 Métodos de Máxima Verosimilitud

Es uno de los métodos más empleados para obtener estimadores puntuales,


selecciona como estimador el valor(es) del parámetro(s) que tiene(n) la propiedad de
maximizar la probabilidad de lo observado en la muestra aleatoria.
El método de máxima verosimilitud consiste en encontrar el valor(es) del
parámetro(s) que maximiza la función de masa (densidad) de probabilidad conjunta
de la muestra, llamada verosimilitud.

Definición 6.5Función de verosimilitud. Sean X1,…, Xn, una muestra aleatoria con
una función de masa (densidad) de probabilidad f(x; θ ), y sea L( θ ; X1, X2, … , Xn)
la verosimilitud de la muestra como función de θ , la cuál se representa por:

L( θ ; x) = L( θ ; X1, X2, … , Xn) = f(x1; θ ) × f(x2; θ ) × … × f(xn; θ )

El método de máxima verosimilitud busca θˆ (x1,…, xn), que maximiza L( θ ; x).


Para obtener estimadores máximo verosímiles se utilizan las herramientas de cálculo

73
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

matemático, que para simplificar lo cálculos utilizan el logaritmo de verosimilitud,


llamada función de log verosimilitud, representada por:

l( θ ; x) = ln (L( θ ; x)).

APLICACIÓN 6.3 Sea X1,..., Xn una muestra aleatoria de tamaño n de una población
la cual se supone tiene función de densidad de probabilidades:

⎧ 1 ⎧ x ⎫
⎪ exp ⎨ − ⎬ x > 0 , φ > 4
f (x) = ⎨φ − 4 ⎩ φ − 4⎭
⎪ 0 e.o.c.

Utilizando herramientas de cálculo diferencial a la función l( φ ; x), se obtiene


estimador máximo verosímil φˆ , de φ .

⎛ 1 ⎞ 1 n
⎛ n ⎞
l(φ, x) = nln ⎜ ⎟ − ∑ x + ln ⎜ ∏ I + ( xi ) ⎟
⎝φ − 4⎠ φ − 4 i =1 i
⎝ i =1 ⎠

∂ l(φ, x) −n 1 n

=0 ⇒ +
(φ − 4 ) (φ − 4 ) 2 ∑x
i =1
i =0 ⇒ φˆ = X + 4
∂φ

Para verificar que es un máximo local, la segunda derivada evaluada en φˆ es:

∂2 l(φ,x) n 2 n

⇒ – ∑x
(φ − 4) (φ − 4)
2 3 i
i =1
∂φ 2 φ =X

n
n (φ − 4 ) − 2∑ xi
; (φ − 4 ) > 0 ∀ φ > 4
i =1 3

(φ − 4)
3

n
n (φ − 4 ) − 2∑ xi = nX − 2nX= − nX < 0. ⇒
i =1

φˆMV = X + 4

Luego l( φˆMV , x ) es un máximo local, y también se prueba que es máximo global.

74
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

6.4 Estimación por Intervalo

La estimación puntual de un parámetro poblacional adolece del siguiente


defecto: La probabilidad de que el estimador coincida con el verdadero valor del
parámetro es muy pequeña y en el caso continuo nula. Los intervalos de confianza
resuelven este inconveniente, ofreciéndonos un rango para los posibles valores del
parámetro poblacional.

Definición 6.6 Sea X1, X2,..., Xn una muestra aleatoria desde f(x; θ ), donde f(x; θ )
es una función de masa (densidad) de probabilidades dependiendo de un parámetro
desconocido θ . Sean T1 y T2 dos estadísticos tales que T1(x) < T2(x), para casi todo x
y P(T1 ≤ θ ≤T2) = γ , donde γ no depende de θ . Se dice que [T1 , T2 ] es un intervalo
de confianza para θ con 100 γ % de confianza.

Observaciones:

• 1.- T1 y T2 reciben el nombre de cota inferior y superior de confianza.

• 2.- γ recibe el nombre de coeficiente de confianza.

• 3.- [T1 , T2 ] es un intervalo aleatorio, ya que sus extremos son aletorios.

Definición 6.7 En las mismas condiciones de la definición 6.10. Sea T1 un


estadístico que cumple con P (T1 ≤ θ ) = γ . Se dice que T1 es un limite inferior de
confianza para θ con 100 γ % de confianza.

Definición 6.8 En las mismas condiciones de la definición 6.10. Sea T2 un


estadístico que cumple con y P (T2 ≥ θ ) = γ . Se dice que T2 es un limite superior
de confianza para θ con 100 γ % de confianza.

Existen técnicas para construir intervalos (regiones) de confianza, y una de


ellas es la del pivote que pasamos a presentar.
Cantidad Pivotal

Sea X1, X2,..., Xn una m.a. (n) desde f(x; θ ) y Q = Q(X1,..., Xn). Si la
distribución de Q es independiente de θ , se dice que Q es una Cantidad Pivotal.

APLICACIÓN 6.4: Sea X1, X2,..., Xn una m.a.(n) desde familia Normal (N( µ ; σ2)
con media µ y varianza conocida σ2, luego

2
σ
Q= X – µ Î Q ∼ N (0, ) Î Q es cantidad pivotal.
n

75
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

6.4.1 Intervalo de Confianza para la Media Poblacional

Sea X1, X2,..., Xn una m.a.(n) desde una distribución Normal (N( µ ; σ2),
como X es el mejor estimador de µ , entonces si se conoce σ2, se tiene que:

(X - µ ) n
Z= ∼ N (0, 1) Î Z es pivote
σ

Luego dado γ , se requiere determinar los valores más apropiados de q1 y q2


que cumplan con:

(X - µ ) n
[q1 ≤ ≤ q2] = γ
σ

Como se puede observar de las gráficas existen muchos (infinitos) valores de


q1 y q2 que satisfacen lo anterior, sin embargo, se puede probar que si se desea
minimizar la longitud del intervalo de confianza, los valores de q1 y q2 deben ser
aquellos que produzcan igualdad de probabilidades en las colas, es decir:

q2 = Z 1 + γ y q1 = - q2
2

Luego si tomamos α = 1 − γ , se tiene:

(X - µ ) n
[Z α / 2 ≤ ≤ Z1 – α / 2 ] = 1- α
σ

76
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Pero como Zα / 2 = – Z1 – α / 2

σ σ
[ X – Z1 – α / 2 ≤ µ ≤ X + Z1 – α / 2 ] = 1- α
n n

Con lo anterior se concluye que el intervalo del (1- α )% de confianza para la


media poblacional está dado por:
σ
IC ( µ ):= [ X ∓ Z1 – α / 2 ]
n

Si se tiene una m.a.(n) X1, X2, ... , Xn tal que Xi ∼ N( µ , σ2), con varianza
poblacional σ2 desconocida, como sabemos S2 es el mejor estimador de σ2 , luego se
tiene que:

(X - µ ) n
T= ∼ t-Student (n – 1) Î T es cantidad pivotal.
s
Análogo al caso anterior, dado γ (coeficiente de confianza), para determinar
los valores de q1 y q2 que minimicen la longitud del intervalo de confianza, se
escogen con igualdad de probabilidades en las colas, es decir:

q1 = tα / (n – 1) = – t1 – α / (n – 1)
(X - µ ) n 2 2
[q1 ≤ ≤ q2] = γ q2 = t1 – α / (n – 1)
s 2

Se tiene que:

[ X – t1 – α / 2 (n – 1)
s ≤µ ≤ X + t1 – α / 2 (n – 1)
s
] = 1- α
n n

77
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Luego el intervalo de confianza del (1- α )% para la media poblacional es:

s
IC ( µ ):= [ X ∓ t1 – α / 2 (n – 1) ]
n

Si el tamaño de la muestra es grande (mayor que 50), utilizando Teorema del


Limite Central, el intervalo de confianza toma de la siguiente forma:

s
IC ( µ ):= [ X ∓ Z1 – α / 2 ]
n
Notemos que es importante distinguir cuando la varianza poblacional es
conocida o desconocida. Si a partir de la muestra aleatoria se determine una varianza,
ésta es la muestral, por lo tanto lo correcto es utilizar un intervalo de confianza
considerando la distribución t - Student, si el tamaño de la muestra es superior a 40,
entonces empleamos el T.L.C. para aproximar por distribución Normal.

6.4.2 Intervalos de Confianza para una Proporción Poblacional

Sea X1, X2,..., Xn una m.a. (n) desde distribución Binomial (B(1, p)).El
estimador de p sobre la base de la muestra es P̂ = X . La distribución de P̂ = X ,
para muestras grandes (empleando el T.L.C), se puede aproximar por:

⎛ P(1 − P) ⎞
P̂ ∼ N ⎜ P; ⎟
⎝ n ⎠

Nota: Es una aproximación útil pero no completamente satisfactoria, debe utilizarse


con algunas recomendaciones entregadas en clases.

Un inconveniente de ésta aproximación para la construcción de intervalos de


confianza, es que la varianza del estimador depende del parámetro a estimar, lo cual
no permite un despeje sencillo, por lo que se decide estimar la varianza con los datos,
con lo cuál se tiene una doble aproximación:

⎛ P(1ˆ − P)
ˆ ⎞
P̂ ∼ N ⎜ P; ⎟
⎝ n ⎠

Con esta aproximación se obtiene la siguiente cantidad pivotal:

(P̂ - p)
Z= ∼ N (0,1) Î Z es cantidad pivotal
P̂ (1 - P̂)
n

78
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Luego dado (1- α ), los valores de q1 y q2 que minimizan la longitud del


intervalo son, como se observó anteriormente:

P̂ (1 - P̂) P̂ (1 - P̂)
[ P̂ – Z1 – α / 2 ≤ p≤ P̂ + Z1 – α / 2 ]= γ
n n

Luego el intervalo de confianza, del γ % para la proporción poblacional es:

P̂ (1 - P̂)
IC (p):= [ P̂ ∓ Z1 – α / 2 ]
n

Se puede apreciar que los intervalos de confianza anteriores están compuestos


por un estimador puntual, más ó menos cantidad, esta cantidad recibe el nombre de,
error de estimación, que resultara útil para la determinación de tamaños de muestra.

6.4.3 Intervalos de Confianza para la Varianza Poblacional

Como se habrá observado en intervalos de confianza para la media, existen


dos situaciones, dependiendo si la varianza poblacional conocida ó desconocida,
siendo obviamente este último el caso más común.

Sea X1, X2,..., Xn una m.a. (n) desde una distribución Normal (N( µ , σ2)),
existen dos posibilidades para la estimación de la varianza , la primera cuando la
media poblacional es conocida (caso extraño) y el segundo cuando la media
poblacional es desconocida. Ambas cantidades pivotales se expresan respectivamente
por:

2
n Sn 2
2
∼ χ (n) χ 2 (n) Chi-cuadrado con n grados de libertad (g.l.)
σ
2
(n - 1) S n - 1 2
2
∼ χ (n – 1) χ 2 (n – 1) Chi-cuadrado con n – 1 g. l.
σ
n 2 n 2
(X i − µ)
∑=1 ∑=1
2 2 ( X i − X)
donde: Sn = Sn -1 =
n n -1
i i

Como se puede apreciar de las gráficas, la distribución Chi-cuadrado no tiene


la propiedad de simetría, por lo que tomar igualdad de probabilidades en las colas no
conduce a intervalos de longitud mínima, sin embargo son una buena aproximación
cuando la muestra es grande.

79
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Considerando la cantidad pivotal para el caso más realista, es decir, se


desconoce la media poblacional, se obtiene:

2
(n - 1) S n - 1
2
[ χα / 2 (n – 1) ≤ 2
≤ 2
χ 1 - α / 2 (n – 1)] = 1 – α
σ

χ 2 (n − 1) χ 12- α / 2 (n − 1)
[ α / 2 ≤ 1
2
≤ ]=1–α
(n - 1) S n2−1 σ (n - 1) S n2−1

(n - 1) S n2−1 (n - 1) S n2−1
[ ≤ σ2 ≤ ]=1–α
χ 12- α / 2 (n − 1) 2
χα / 2 ( n − 1)

Luego el intervalo del (1- α )% de confianza para la varianza poblacional está


dado por:

2 (n - 1) S n2−1 (n - 1) S n2−1
IC( σ ):= [ ; ]
χ 12- α / 2 (n − 1) 2
χα / 2 ( n − 1)

80
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

APLICACIÓN 6.5: ‘Entradas y Salidas de efectivo de un negocio’. Las entradas (x) y


salidas (y) semanales de efectivo de un negocio [en UF] son variables aleatorias. Los
siguientes datos proporcionan los valores de x e y durante 28 semanas. Suponga que
x e y están normalmente distribuidas.

x y x y x y x y
42 25 23 36 82 72 86 68
65 37 63 70 28 39 68 72
76 83 40 51 61 27 53 60
92 36 70 39 75 38 87 65
37 73 82 36 83 27 63 80
47 23 90 82 60 78 47 62
27 97 68 30 93 20 52 36

Definir las variables asociadas al problema, es siempre el primer paso en el


desarrollo de todo problema.

X:=Entradas semanales en efectivo del negocio [UF] X ∼ N ( µ x , σ x2 )


Y:= Salidas semanales en efectivo del negocio [UF] Y ∼ N ( µ y , σ 2y )

Datos: x = 62,86 sx = 20,75 nx = 28


y = 52,21 sy = 22,45 ny = 28

Determinar intervalos del 95% de confianza para los parámetros.

Sx
I95%C ( µ x )= [ X ∓ t1 – α / 2 (nx – 1) ] ⇔ I95%C(.x) : [54,81 ; 70,90]
nx

Interpretación: Con un 95% de confianza las entradas medias reales del negocio se
encuentra entre los límites 54,81 [UF] y 70,90 [UF].

Sy
I95%C ( µ y ) = [ Y ∓ t1 – α / 2 (ny – 1) ] ⇔ I95%C (.y) = [43,51; 60,92]
ny

Interpretación: Con un 95% de confianza las salidas medias reales del negocio se
encuentra entre los límites 43,51 [UF] y 60,92 [UF].

(n x - 1) S x2 (n x - 1) S x2
I95%C ( σ x2 ) =[ 2
; ] ⇔ I95%C ( σ x2 ) :[269,17 ; 797,90]
χ 1 - α / 2 (n x − 1) χ α2 / 2 (n x − 1)

Interpretación: Con un 95% de confianza las varianzas de las entradas medias reales
del negocio se encuentra entre los limites 269,17[UF]2 y 797,90 [UF]2.

81
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

(n y - 1) S y2 (n y - 1) S y2
I95%C ( σ 2y ) =[ 2
; ] ⇔ I95%C ( σ 2y ) : [315,14 ; 934,16]
χ 1 - α / 2 (n y − 1) χ α2 / 2 (n y − 1)

Interpretación: Con un 95% de confianza las varianzas de las entradas medias reales
del negocio se encuentra entre los limites 315,144 [UF]2 y 934,16 [UF]2.

Determine mediante un intervalo del 90% de confianza la verdadera


proporción de semanas donde se obtuvo pérdida.
X: = Nº de semanas donde se obtuvo pérdida. X ∼ B (28, p)
p̂(1 − p̂)
⇒ p̂ ∼ N (p, )
28
x y x y x y x y
42 25 23 36 Î 4 82 72 86 68
65 37 63 70 Î 5 28 39 Î 7 68 72 Î 9
76 83 Î 1 40 51 Î 6 61 27 53 60 Î 10
92 36 70 39 75 38 87 65
37 73 Î 2 82 36 83 27 63 80 Î 11
12
47 23 90 82 60 78 Î 8 47 62 Î 12 ⇒ p̂ =
27 97 Î 3 68 30 93 20 52 36 28

P̂ (1 - P̂)
I90%C (p) = [ P̂ ∓ Z1 – α / 2 ] ⇔ I90%C(p) = [27,47% ; 58,24%]
n

Interpretación: Con un 90% de confianza la verdadera proporción de semanas donde


el negocio tiene pérdida se encuentra entre los límites 27,47% y 58,24%.

Determine el nivel de confianza con el que se podría afirmar que la


proporción de semanas donde hubo pérdidas se encuentra entre los límites 27,86% y
57,86%.

P̂ (1 - P̂) P̂ (1 - P̂)
Notemos que LS – LI = P̂ + Z1 – α / 2 – ( P̂ – Z1 – α / 2 )
n n

P̂ (1 - P̂)
0.58 –0.28 = 2 × Z1 – α / 2
n

12 28
Z1 – α / 2 = (0.58 – 0.28) ×
2 0.57 × 0.43

α 1
Z1 – α / 2 = 1.603 ⇒ 1– = (0.9452 + 0.9458) ×
2 2
! = 0,1090 ⇒ # = 89,10%

82
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Interpretación: Con un 89,10% de confianza la verdadera proporción de semanas


donde el negocio tiene pérdidas se encuentra entre los límites 27,86 % y 57,86%.

APLICACIÓN 6.6: ‘El especialista de mercadeo’. Un especialista en mercadeo de


cierta universidad, asegura que la proporción de hombres que utiliza una tarjeta de
crédito para hacer compras superiores a US$10 es inferior a la proporción de mujeres
que realiza este mismo tipo de pago. Como parte de un proyecto, el especialista,
encuesta en un centro comercial local a 50 hombres y 100 mujeres respecto a sus
hábitos de compra. De los hombres, 39 dijeron que habían utilizado este tipo de pago
en el último mes, mientras que 84 mujeres admitieron hacer este mismo tipo de pago.
X1 = Nº de mujeres que utiliza la tarjeta de crédito en compras superiores a US$10.

X2= Nº de hombres que utiliza la tarjeta de crédito en compras superiores a US$10.

Supuestos:
p̂ (1 − p̂1)
X1 ∼ B (100, p1) ⇒ p̂ 1 ∼ N (p1, 1 ) ⇒ p̂1 = 0,84
100

p̂ 2 (1 − p̂ 2 )
X2 ∼ B (50, p2) ⇒ p̂ 2 ∼ N (p2, ) ⇒ p̂ 2 = 0,78
50

Intervalos del 90% de confianza para la proporción de mujeres, como para la


de hombres que utiliza el medio de pago en cuestión son:.
I90%C (p1) : [76,81% ; 91,19%]
P̂i (1 - P̂i )
I90%C (p) = [ P̂i ∓ Z1 – α / 2 2 ]=
n I90%C (p2) : [66,52% ; 89,48%]

Interpretación: Con un 90% de confianza se puede decir que la verdadera proporción


de mujeres que utiliza una tarjeta de crédito para hacer compras superiores a US$10 se
encuentra entre los limites 76,81% y 91,19%, mientras que la verdadera proporción
de hombres que utiliza una tarjeta de crédito para hacer compras superiores a US$10
se encuentra entre los limites 66,52% y 89,48%.

Determine un intervalo del 95% de confianza para la verdadera proporción de


personas que no utiliza una tarjeta de crédito para hacer compras superiores a US$10.

X3:=Nº de personas que no usa la tarjeta de crédito en compras superiores a US$10.

p̂ 3 (1 − p̂ 3 )
X3 ∼ B (150, p3) ⇒ p̂ 3 ∼ N (p3, ) ⇒ p̂ 3 = 0,18
150

P̂ (1 - P̂)
I95%C (p) = [ P̂ ∓ Z1 – α / 2 2 ] ⇔ I95%C(p3) : [12,84% ; 23,16%]
n

83
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Interpretación: Con un 95% de confianza, se puede decir que la verdadera


proporción personas que no utiliza una tarjeta de crédito para hacer compras
superiores a US$10 se encuentra contenida entre los límites 12,84% y 23,16%.

Determine el tamaño de muestra necesario para que el error de estimación en


la verdadera proporción personas que no utiliza una tarjeta de crédito para hacer
compras superiores a US$10 no sea superior a 5% con un 95% de confianza.

P̂ (1 - P̂) 0,18 (1 − 0,18)


Z1 – α / 2 2 < 0,05 ⇒ Z0,975 2 < 0,05
n n

Error de Estimación

2
Z0,975 × 0,18 × (1 − 0,18)
n> ≈ 227
( 0, 05 )2
Interpretación: El tamaño de muestra necesario, para que con un 95% de confianza,
el error de estimación de la proporción personas que no utiliza una tarjeta de crédito
para hacer compras superiores a US$10 no sea mayor a 5%, es de al menos 227
personas.

Determine con un 96% de confianza, el tamaño de muestra necesario para que


la amplitud del intervalo para la proporción personas que no utiliza una tarjeta de
crédito en compras superiores a US$10 no sea mayor al 8%.

P̂ (1 - P̂)
LS – LI = 2 × Z1 – α / 2 2 < 0,08
n

0,18 (1 − 0,18)
⇒ 2 × Z0,98 2 < 0,08
n

2
4 × Z0,975 × 0,18 × (1 − 0,18)
n> ≈ 390
( 0, 08)2
Interpretación: El tamaño de muestra necesario, para que la amplitud del intervalo de
la proporción de personas que no utiliza una tarjeta de crédito en compras superiores
a US$10 no sea mayor a 8%, es de un mínimo de 390 personas, con un 96% de
confianza.

84
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

APLICACIÓN 6.7: ‘La decisión: AT&T ó Sprint’. Un contador de una corporación en


los Estados Unidos, debe decidir si seleccionar a AT&T ó Sprint para manejar su
servicio telefónico de llamadas a larga distancia de la empresa, El contador
seleccionó una muestra al azar de las llamadas realizadas en cada una de las
compañías reportando la siguiente información:

AT&T Sprint
Número de llamadas 145 102
Costo promedio US$ 4.07 US$ 3.89
Desviación estándar US$ 0.97 US$ 0.85

X = Costo de llamadas a larga distancia en la compañía AT&T.


Y =: Costo de llamadas a larga distancia en la compañía Sprint.

Supuestos: X ∼ N ( µ x , σ x2 ) Y ∼ N ( µ y , σ 2y )

Datos: x = 4,07 [US$] s x = 0,97 [US$] nx = 145


GRANDES
y = 3,89 [US$] s y = 0,85 [US$] n y = 102

Determine intervalos del 96% de confianza, para medias de las variables


definidas.

⎡ s ⎤
I96%C ( µ x ) = ⎢ x ∓ Z1 − α/ 2 x ⎥ ⇔ I96%C( µ x ) = [3,90 ; 4,42]
⎢⎣ nx ⎥⎦

Interpretación: Con un 96% de confianza, el verdadero costo medio de llamadas a


larga distancia en la compañía AT&T se encuentra entre los limites
3,90 [US$] y 4,42 [US$].

⎡ sy ⎤
I96%C ( µ y ) : ⎢ y ∓ Z1 − α/ 2 ⎥ ⇔ I96%C( µ y ) = [3,72 ; 4,31]
⎢⎣ ny ⎥

Interpretación: Con un 96% de confianza, el verdadero costo medio de llamadas a


larga distancia con la compañía Sprint se encuentra entre los limites 3,72 [US$] y 4,31
[US$].

85
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

7. QUINTO MÓDULO
7.1 Introducción a Confiabilidad de Sistemas

En el ámbito industrial, se considera que los productos son de alta


calidad si cumplen con sus especificaciones de diseño y con la preferencia del
consumidor. Sin embargo, pueden fallar en poco tiempo, por degradación del
producto o por alguna saturación o colapso instantáneo. Se dice que un sistema,
proceso o componente es confiable si continúa funcionando según las
especificaciones durante un amplio período de tiempo.
En nuestro ámbito, la confiabilidad de un equipo, producto o sistema es la
probabilidad de que cumpla según las especificaciones de uso determinadas, por lo
menos un período de tiempo determinado, en otras palabras, permanencia de la
calidad de los productos o sistemas a lo largo del tiempo.
El término buena calidad de un producto significa que éste cumple con las
especificaciones de diseño establecidas; la diferencia entre calidad y confiabilidad es
que la calidad garantiza que el producto sale de fábrica en buenas condiciones. La
confiabilidad garantiza que el producto permanezca en buenas condiciones durante un
período razonable de tiempo. Pero evidentemente, la calidad de un producto
contribuye a la confiabilidad del mismo.
Por tanto, la calidad carece de la dependencia temporal y esta dependencia
introduce una incertidumbre, para lo cual la definición de confiabilidad incorpora esta
aleatoriedad, es decir, saber si un producto funciona a lo largo de un período de
tiempo es una cuestión de probabilidad.
El análisis de confiabilidad es el estudio de fallos de un sistema, equipo o
componente a través de herramientas estadísticas; el rol que cumple la teoría
estadística de confiabilidad es desarrollar métodos para estimar las características de
las distribuciones de vida a partir de tiempos de falla. Al realizar un estudio de
confiabilidad a un equipo o sistema, obtenemos información valiosa acerca de la
condición del mismo, por ejemplo, probabilidad de falla, tiempo promedio hasta su
falla y etapa de vida en que se encuentra el equipo.

Se hace una distinción entre la confiabilidad de los sistemas que no se


pueden reparar y aquella de los que si es posible reparar. Un componente que se
puede reparar después de fallar, pasa por un periodo de reparación y a continuación
vuelve a fallar normalmente.

La disponibilidad de un componente se entenderá por la probabilidad de que


esté activo y funcionando en ese instante de tiempo requerido. Por esta razón, para
aumentar la disponibilidad de los sistemas cuyos componentes son susceptibles de
reparar se preparan procedimientos de mantenimiento, que deben evitar las fallas
de un sistema, ya sea; reemplazando periódicamente sus partes criticas, afinándolas,
limpiándolas, etc. según sea necesario.

86
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

La aplicación del concepto confiabilidad en la actividad humana, es una


realidad inmemorial, sin embargo desde un punto de vista de ingeniería se constituye
como un nuevo factor de interés desde la revolución industrial en la fabricación de un
producto, aunque su mayor auge lo logra a partir de la Segunda Guerra Mundial, por
la necesidad urgente de la fabricación de instrumentos bélicos de alta durabilidad en
optimo desempeño.

Valores numéricos en confiabilidad comenzaron a aparecer, por ejemplo en


contratos donde se exigía cierto grado de confiabilidad al producto o servicio
transado, castigando con multas el no cumplimiento.

La industria energética (suministro de energía eléctrica) utiliza estimaciones


de confiabilidad para determinar costos de suministro y disponibilidad de ellos para
los consumidores. La disponibilidad para un consumidor en particular, por ejemplo en
los años ochenta, se puede expresar en un promedio de treinta minutos perdidos por
año de consumo, claro está que hoy en día las compañías eléctricas de distribución
deben compensar por la ocurrencia de fallas no programadas debiendo pagar a los
consumidores las consecuencias de ésta, ya sea en descuentos en tarifas por el tiempo
de falla, o reparación de artefactos que se hayan inutilizados producto de ésta falla.

La necesidad de conocer la confiabilidad de un sistema exige que ésta sea


medible, para así poder desarrollar métodos o técnicas que puedan caracterizar las
variables que influyen de mayor o menor forma en la confiabilidad del sistema. La
aleatoriedad de las variables medibles involucradas en describir características de un
sistema relacionado con su confiabilidad exige una base estadística y probabilística
fundamental para la teoría de análisis de confiabilidad.

Índices básicos en categorías de tiempo, desempeñan un papel


importante en la teoría de confiabilidad, disponibilidad y facilidad de mantenimiento
de los sistemas, por ejemplo, categorías de tiempo relacionadas con el uso son:
Tiempo de Operación, que es el intervalo durante el cual el sistema está realmente
funcionando; Tiempo de Operación Programado, que es el intervalo durante el cual
se requiere que el sistema trabaje bien; Tiempo Libre, que es el intervalo durante el
cual se programa el sistema para que esté inactivo; Tiempo de Almacenamiento, que
es el intervalo durante el cual el sistema se almacena como refacción. Además existen
las categorías de tiempo relacionadas con la condición del equipo, como: Tiempo
dentro, que es el intervalo durante el cual el sistema está trabajando o listo para
trabajar; Tiempo Fuera, que es el intervalo durante el tiempo programado de
operación, en el cual el sistema está en estado de falla. El tiempo fuera es la suma de:
tiempo administrativo, tiempo de reparación activa, y tiempo logístico (suspensión de
la reparación por falta de refacciones). Estas clasificaciones de tiempos, generan los
índices:

87
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

1. Tiempo Programado de Operación = Tiempo de Operación + Tiempo de Falla

Tiempo de Operación
2. Disponibilidad Intrínseca =
Tiempo de Operación + Tiempo de Repar. Activa

Tiempo de Operación
3. Disponibilidad =
Tiempo de Operación + Tiempo Fuera

Tiempo Dentro
4. Disponibilidad Operativa =
Tiempo Total

Las fallas en un sistema se presentan habitualmente debido a la combinación


entre la causa de falla, intensidad y periocidad de ésta y mediante distintas formas de
presentarse, tal vez las más comunes son las que se muestran a continuación.

• Causas de Falla.
a. Desgaste: El fallo se produce por cansancio después de soportar
adecuadamente las fuerzas aplicadas.
b. Debilidad: El fallo se produce por debilidad del producto con
relación a las fuerzas aplicadas.

• Modo de Presentarse.
a. Gradual: El fallo puede ser previsto con anterioridad.
b. Repentino: El fallo no puede ser previsto con anterioridad.

• Intensidad.
a. Parcial: El producto puede continuar el servicio, aunque en
forma imperfecta.
b. Completo: El producto cesa en sus funciones totalmente.

• Modo de Presentarse la Intensidad.


a. Degradación: Fallo, a la vez gradual y parcial.
b. Catastrófico: Fallo, a la vez repentino y completo.

• Período.
a. Infantil: Debilidad prematura, “en rodaje”.
b. Accidental: Repentino y aleatorio, “en cualquier período de
tiempo”.
c. Senil: Agotamiento general, “vejez”

88
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

7.2 Cálculo de la Confiabilidad

Definición 1: La confiabilidad de un sistema, sea simple o compuesto, en el tiempo


t, Simbolizada por e(t), está definida como e(t) = [T > t], donde T
es la duración del sistema y e(t) se denomina función de
confiabilidad.

Definición 2: La tasa de falla de un sistema, sea simple o compuesto, en el tiempo


t, Simbolizada por r(t), está definida como la proporción de unidades
que fallan en el intervalo de tiempo (t, t + ∆t) cuyo cálculo c esta
dado por:
f (t )
r(t) = T
e (t )
donde, fT(t), es la función de densidad de probabilidad asociada a la variable
aleatoria T antes definida. Claramente la tasa de falla es una probabilidad asociada a
un sistema como se muestra a continuación:

[t < T < t + ∆ t]


Recordemos [T < t + ∆ t / T > t] =
[T > t]

[t < T < t + ∆ t] 1


r(t) = ∆tlim
→0 ×
[T > t] ∆t
FT(t + ∆ t) – FT(t) 1
r(t) = ∆tlim
→0 ×
1 – FT(t) ∆t

r(t) =
1 lim FT(t + ∆ t) – FT(t)
1 – FT(t) ∆t →0 ∆t

1 d FT(t) f T (t )
r(t) = × =
1 – FT(t) dt e (t )

89
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

También es posible determinar la función de densidad de una variable a través de

e(t) = [T > t] ⇔ e(t) = 1 – [T ≤ t]


e(t) = 1 – FT(t)
d e(t)
= – fT(t) ⇒ e(t) = – fT(t)
dt
f (t ) e(t )
r(t) = T ⇒ r(t) = −
e(t ) e(t )
t t
e ( x)

Inf
r (x) dx =

Inf

e(x)
dx

∫ r (x) dx = – ln(e(t)) + ln(e(Inf))


Inf

⎧ t ⎫
⎪ ⎪


exp ⎨− r (x) dx ⎬ = 1 – FT(t)

⎩ Inf ⎭

⎧ t ⎫ ⎧ t ⎫
⎪ ⎪ d FT(t) ⎪ ⎪

FT(t) = 1 – exp ⎨− r (x) dx ⎬
⎪ Inf ⎪

dt
= fT(t) = r(t) exp ∫
⎨− r (x) dx ⎬
⎪ Inf ⎪
⎩ ⎭ ⎩ ⎭

Definición 3: El tiempo Medio hasta la falla ( MTTF, Mean time to failure) o vida
esperada de un producto se define por la cantidad:
∞ ∞
µ=
∫ tf (t ) dt = ∫ e(t ) dt
Inf Inf

APLICACIÓN 7.1: Suponga que el tiempo de vida X (en días) de un componente


eléctrico esta modelado en forma independiente por la siguiente función de densidad:

⎧3exp{−3 x} x>0
f(x) = ⎨
⎩0 e.o.c.

Determine la función de confiabilidad del componente y grafique su tasa de


falla.

e(x) = [X > x] = 1 – [X ≤ x] = 1 – FX(x) = exp{ – 3x}

90
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

f ( x) 3 exp{−3 x}
r ( x) = X = =3
e(x) exp{−3 x}

Observar que el caso que la


r(x) 5,0 distribución de probabilidad
3,0 de la variable sea exponencial,
su tasa de falla es constante y
1,0 corresponde al parámetro de
-1,0
la distribución.
x

Funciones de densidad, distribución acumulada, confiabilidad y riesgo bajo ley exponencial.

91
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

APLICACIÓN 7.2: Suponga que la tasa de falla de un componente en un aparato


médico esta modelado en forma:

⎧⎪αλ α tα −1 t > 0, λ > 0, α > 0


r(t) = ⎨
⎪⎩0 e.o.c.

Determine la función de densidad de la variable tiempo de vida del


componente y grafique su tasa de falla considerando λ = 3, α >1 y α <1.

⎧ t ⎫ ⎧ t ⎫
⎪ ⎪ ⎪ ⎪
∫ ∫
α α −1 α α −1
fT(t) = r(t) exp ⎨− r (x) dx ⎬ = αλ t exp ⎨− αλ x dx ⎬
⎪ Inf ⎪ ⎪⎩ 0 ⎭⎪
⎩ ⎭

{
= αλ α tα −1 exp −(λ x)α } ⇒ T ∼ W(α; λ)

e(t) = [T > t] = 1 – [T ≤ t] = 1 – FT(t) = exp −(λ x)α { }

3,0 r(t) 25
r(t)
2,5 20 α = 2,5
2,0 α = 0,5 15
1,5
10
1,0
5
0,5
0
0,0
t t

En general se tiene que :

92
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

β −1
( β
)
Para f T (t ) = αβ t exp − α t Ι (t )
[0 , ∞ [

Funciones de densidad, distribución acumulada, confiabilidad y riesgo bajo ley Weibull

93
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Tipos de Sistemas
I. Sistemas con Componentes en Paralelo

Suponga que un sistema está compuesto por n componentes, que


funcionan de manera independiente, entonces una configuración en paralelo es
aquella que se representa por la siguiente figura 1:

C1

C2
.
.
.

Cn
Figura 1: Sistema en Paralelo

En este tipo de sistemas, se pueden considerar dos situaciones: la primera,


cuando el sistema funciona cuando al menos uno funciona; la segunda, cuando el
sistema funciona cuando al menos k componentes funcionan.

En la primera situación, el sistema funciona si al menos un componente


funciona, si se puede establecer condiciones de independencia en el funcionamiento
de los componentes, y además suponer que todos ellos se encuentran gobernados por
la misma confiabilidad, entonces la confiabilidad del sistema está dada por:

es(t) = [T > t] = [C1 > t ∪ C2 > t ∪ ... ∪ Cn > t]

= 1 – [(C1 > t ∪ C2 > t ∪ ... ∪ Cn > t)c]

= 1 – [C1 < t ∩ C2 < t ∩ ... ∩ Cn < t]

= 1 – ([C1 < t] × [C2 < t] × ... × [Cn < t])


n
=1– ∏
i =1
[Ci < t]

n
=1– ∏ (1 − e (t))
i =1
i

= 1 – (1 – e(t))n

En la segunda situación, el sistema funciona si al menos k componentes


funcionan, si se puede establecer condiciones de independencia en el funcionamiento

94
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

de los componentes, y además suponer que todos ellos se encuentran gobernados por
la misma confiabilidad, entonces la confiabilidad del sistema está dada por:
n

∑ ⎜⎜⎝ x ⎟⎟⎠ (e(t ))


⎛ n⎞ x n−x
es(t) = [T > t] = (1 − e(t ))
x=k

Es fácil observar que si todos los componentes se encuentran gobernados por


la misma confiabilidad y siendo éstos independientes, la confiabilidad
de cada uno de estos esta dada por e(t). Por lo tanto, es natural observar que la
confiabilidad del sistema se convierta en una distribución binomial.

En ambas situaciones se ha supuesto que los componentes funcionan de forma


independiente. Un caso completamente distinto seria que los componentes trabajasen
de forma excluyente, es decir, mientras el primer componente esta funcionando, los
otros componentes están inactivos y sólo se activarán en reemplazo del primero,
cuando este falle. En esta situación es necesario, determinar la distribución de la suma
de los tiempos de vida de cada uno de los componentes que integran el sistema.

II. Sistemas con Componentes en Serie

Suponga que un sistema está compuesto por n componentes, que funcionan de


manera independiente, entonces una configuración en serie es aquella que se
representa por la siguiente figura 2:

C1 C2 C3 . . . . . . . . Cn

Figura 2: Sistema en Serie

Si se puede establecer condiciones de independencia en el funcionamiento de


los componentes, y además suponer que todos ellos se encuentran gobernados por la
misma confiabilidad, entonces la confiabilidad del sistema está dada por:

es(t) = [T > t] = [C1 > t ∩ C2 > t ∩ ... ∩ Cn > t]

= [C1 > t]× [C2 > t]× ... × [Cn > t]

= e1(t) × e2(t) × ... × en(t)

n
= ∏ e (t) = (e(t))n
i =1
i

95
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

III. Sistemas Mixtos

Suponga que un sistema está compuesto por n componentes, que funcionan de


manera independiente, entonces una configuración mixta es aquella donde un
conjunto de componentes están configurados en paralelos, mientras que otro conjunto
se encuentra en serie.

Este tipo de sistemas, deben ser reducidos a subsistemas que entre ellos
trabajen con alguna de las dos configuraciones clásicas, es decir, en paralelo o en
serie.

APLICACIÓN 7.3: Suponga que el tiempo de vida T (en días) de un componente


electrónico esta modelado en forma independiente por la siguiente función de
densidad:

f T (t ) = α 20 α t −(α + 1) , t > 20 y α > 0.

Suponga que un sistema esta compuesto por cuatro componentes del


mismo tipo que funcionan independientemente, con la siguiente configuración:

C3 C4
C1
C2

Determine e interprete la tasa de falla del segundo componente y realice un bosquejo


aproximado de ella.

f (t )
r(t) = T e(t) = [T > t] = 1 – FT(t)
e(t )

t
FT(t) =
∫f
20
T (t ) dt

t ⎛ −(α +1) +1 t ⎞
α⎜ ⎟
∫ α 20
α − (α +1) t
= t dt = α 20 ⎜ ⎟
⎜ − (α + 1) + 1 20 ⎟
20 ⎝ ⎠
α
= 1 – ⎛⎜ ⎞⎟
20
⎝ t ⎠

α − (α +1)
r(t)
f (t ) α 20 t α
⇒ r(t) = T = = ⇒
e (t ) α −α t
20 t

96
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

Determine la función de confiabilidad del sistema y determine la probabilidad


de que el sistema dure más de 80 días si α = 0.8.

es(t) = [C1 > t ∩ ((C3 > t ∩ C4 > t) ∪ C2 > t)]

= [C1 > t] × [(C3 > t ∩ C4 > t) ∪ C2 > t]

= [C1 > t] × (1 – [(C3 < t ∪ C4 < t) ∩ C2 < t])

= [C1 > t] × (1 – ([C3 < t ∪ C4 < t] × [C2 < t]))

= [C1 > t] × (1 – (1 – [C3 > t ∩ C4 > t]) × (1 – [C2 > t])))

= [C1 > t] × (1 – (1 – [C3 > t] × [C4 > t]) × (1 – [C2 > t])))
= e(t) × (1 – (1 – e2(t)) × (1 – e(t)))

⇒ α = 0,8


0.8 ⎛ ⎛ 1.6 ⎞ ⎛ 0.8 ⎞ ⎞
e(80) = ⎛⎜ ⎞⎟ ⎜1 − ⎜1 − ⎛ 20 ⎞ ⎟ × ⎜1 − ⎛ 20 ⎞ ⎟ ⎟ = 0,1329
20
⎝ 80 ⎠ ⎜ ⎜ ⎜⎝ 80 ⎟⎠ ⎟ ⎜ ⎜⎝ 80 ⎟⎠ ⎟ ⎟
⎝ ⎝ ⎠ ⎝ ⎠⎠

APLICACIÓN 7.4: Suponga que el tiempo de vida T (en años) de un componente


electrónico esta modelado en forma independiente por la función de densidad y
sistema que esta compuesto por cinco componentes del mismo tipo que funcionan en
forma independientes, como se muestra a continuación:

C3

1 ⎧ 1 ⎫
f T (t ) = exp ⎨− t ⎬ , t > 0.
6× t ⎩ 3 ⎭ C1 C2 C4

C5

Determine la confiabilidad de sistema y evalúela a los dos años.

T : Tiempo de vida de un componente.


⎧ 1 ⎫
⇒ T ~ W(1/2, 1/9) ⇒ e(t) = exp ⎨− t⎬
⎩ 3 ⎭

97
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

es(t) = [C1 > t ∩ C2 > t ∩ (C3 > t ∪ C4 > t ∪ C5 > t)]

= [C1 > t] × [C2 > t] × [(C3 > t ∪ C4 > t ∪ C5 > t)]

= [C1 > t] × [ C2 > t] × (1 – [(C3 < t ∩ C4 < t ∩ C5 < t)])

=[C1 > t] × [C2 > t]) × (1 – (1 – [C3 > t]) × (1 – [C4 > t]) × (1 – [C5 > t]))

= e1(t) × e2(t) × (1 – (1 – e3(t)) × (1 – e4(t)) × (1 – e5(t)))

= e2(t) × (1 – (1 – e(t))3)

2
⎛ ⎧ 1 ⎫⎞ ⎧ 1 ⎫ 3
= ⎜⎜ exp ⎨− t ⎬ ⎟⎟ × (1 – (1 – exp ⎨− t⎬) )
⎝ ⎩ 3 ⎭⎠ ⎩ 3 ⎭

⇒ es(2) = 0,36885

¿Cuál es la probabilidad que el tiempo de vida del sistema se encuentre entre


los dieciocho meses y diez años?

Ts : Tiempo de vida del sistema.

[18/12 < Ts < 10] = [Ts < 10] – [Ts < 18/10] = 1 – es(10) – (1 – es(18/12))

= es(18/12) – es(10)

= 0,4253 – 0,0879 = 0,33746

APLICACIÓN 7.5: Suponga que el tiempo de vida T (en decenas de años) de un


componente electrónico esta modelado en forma independiente por la siguiente
función de densidad:

{ }
f T (t ) = 8 t exp −4t 2 , t > 0.

Suponga que un sistema esta compuesto por cuatro componentes del


mismo tipo que funcionan en forma independientes, con la siguiente configuración:

C3

C1 C2

C4

Determine la confiabilidad de sistema y evalúela a los tres años.

98
Universidad Técnica Federico Santa María Renato Allende Olivares
Magister en Gestión de Activos y Mantenimiento Humberto Villalobos Torres
Probabilidad y Estadística

T : Tiempo de vida de un componente. T ~ W(2, 2) ⇒ e(t) = exp{–4 t2}

es(t) = [C1 > t ∩ C2 > t ∩ (C3 > t ∪ C4 > t)]

= [C1 > t] × [C2 > t] × [(C3 > t ∪ C4 > t)]

= [C1 > t] × [ C2 > t] × (1 – [(C3 < t ∩ C4 < t)])

= [C1 > t] × [C2 > t]) × (1 – (1 – [C3 > t]) × (1 – [C4 > t]))

= e1(t) × e2(t) × (1 – (1 – e3(t)) × (1 – e4(t)))

= e2(t) × (1 – (1 – e(t))2)

= exp{–8 t2} × (1 – (1 – exp{–4 t2})2) = 2 × exp{–12 t2} – exp{–16 t2}


es(3/10) = 0,4423

¿Cuál es la probabilidad que el tiempo de vida del sistema se encuentre entre


los dos y cuatro años?

Ts : Tiempo de vida del sistema.

[2/10 < Ts < 4/10] = [Ts < 4/10] – [Ts < 2/10]

= 1 – es(4/10) – (1 – es(2/10))

= es(2/10) – es(4/10) = 0,7103 – 0,2159 = 0,4944

Realice un bosquejo aproximado de la tasa de falla del sistema.

fTs(t) –e 's (t) 32 × t × exp{–16 t2} – 48 × t × exp{–12 t2}


rs(t) = = =
es(t) es(t) 2 × exp{–12 t2} – exp{–16 t2}

Tasa de Falla
t rS 25,0
r s (t ) 20,0
0,050 0,808
15,0
0,200 3,612 10,0
0,800 18,943 5,0
1,000 23,926 0,0
0,050 0,200 0,800 1,000
t

99

También podría gustarte