U3 Prob y Estadistica
U3 Prob y Estadistica
U3 Prob y Estadistica
PROBABILIDAD
COMPETENCIA DESARROLLAR
ACTIVIDADES DE APRENDIZAJE
3.1 INTRODUCCIÓN
1. PROBABILIDAD
Tomas decisiones sobre una infinidad de detalles. Y es que todos deseamos minimizar la probabilidad de que
algo salga ¡Mal!.
4. CHARLA
5. CLASIFICAR
Seguramente acostumbras clasificar. Por ejemplo, ¿cuántos días a la semana le dedicas a tu pasatiempo
favorito?
O bien, ¿con cuántas personas te frecuentas?, ¿cuántas de ellas consideras que son tus amigas o amigos?
6. TEMA
7. MÁS
Sobre el caso de las personas que se frecuentan, si se han agrupado en: (C)onocidos, (F)amiliares, y (A)migos,
¿qué proporción de ellos son tus verdaderamente amigas o amigos?
Si se tienen 12 (C)onocidos, 8 (F)amiliares, y 4 (A)migos, para un total de 24; entonces, los verdaderamente
amigos son 4 de 24, esto es 1/6; es decir 0.1667 o 16.67%
8. OBSERVACIÓN
9. DEFINICIÓN
Como definición, la probabilidad es la proporción que resulta del cociente entre el número de casos favorables
y el número de casos posibles; es decir, es una fracción.
10. UNIDADES
La división para el cálculo de probabilidad, se puede realizar entre la cuenta de cosas, llamada Frecuencia
Absoluta, o entre porcentajes, o entre probabilidades o Frecuencias Relativas. La probabilidad es
adimensional, porque es una proporción.
11. FUNDAMENTOS
Formalmente, las probabilidades son manifestaciones numéricas de experimentos en los que se contabilizan
los resultados favorables y no favorables.
Los posibles eventos o resultados, realizados a partir de los puntos muestrales, son el conjunto de resultados
experimentales que constituyen el espacio muestral o "todo".
12. ACLARACIÓN
En el caso de las personas que se frecuentan, los conjuntos, o "partes", son excluyentes; esto es, no pueden
ser parte de más de una clasificación: o son compañeros conocidos, o familiares, o amigos, pero no pueden
ser dos o más cosas a la vez.
13. EXCLUYENTES
Cuando no tiene nada que ver... una cosa, con otra, y con otra más,... definitivamente se trata de un caso de
conjuntos "excluyentes".
14. RECORDAR
Cuando se suman todas las partes que conforman un todo, se obtiene el 100% del todo.
En términos de probabilidad, equivale a sumar fracciones (partes). Cuando se suman todas las fracciones, se
obtiene la unidad.
Pr(S) = 1; 0 ≤ Pr(evento) ≤ 1.
Sobre todo, hay que recordar que la probabilidad es la ponderación de una "parte" en relación al "todo". Esto
es algo que se debe de tener presente al aplicar la teoría de probabilidad en la solución de este tipo de
problemas.
EXPLICACIÓN TEXTUAL.
En esta unidad les ofrecemos la información textual y en formato de video. Cada uno de los números de la
siguiente lista, así como, sus títulos hacen referencia a las diapositivas presentadas en el video.
1. ORIGEN.
El tema del origen se refiere al origen de las "comparaciones" que conforman un tema de estudio estadístico.
Muchas de las cosas que ocurren en nuestro entorno son "aleatorias", y es importante descubrir el patrón
que caracteriza al comportamiento de esas cosas. Descubrir es propio de la curiosidad humana...
2. CAMBIAR.
Entre más rígido sea aquello, más difícil de cambiar, pero también más sólido como sustento referencial de
un estudio experimental.
3. TAXONOMÍA.
Objetiva
4. EQUIPROBABILIDAD.
Este concepto es como el ideal político de los sistemas democráticos.
En una contienda electoral, cada partido recibe su "parte" de acuerdo a la cantidad de votos a su favor.
Si 6 personas emiten su voto por un partido de entre los colores Rubí, Marrón, y Ambar, y si la cuenta termina
con 1 para el Rubí, 2 para el Marrón, y 3 para el Ambar, ¿cómo es la distribución porcentual de la votación?
La votación final le da 16 o 16.67% al Rubí, 26 o 33.33% al Marrón, y 36 o 50% al Ambar.
La suma de estas parcialidades da el total de votos, tanto en la cuenta de votos individuales, como porcentual.
Precisamente porque cada voto cuenta por igual, y hay equiprobabilidad de asignación, es que la mayoría
relativa inclina la balanza a favor de alguno.
5. DISTRIBUCIÓN.
6. DISTRIBUCIÓN.
Figura 3.2.1.1
Para el caso de las personas, compañeros de reunión mostrados arriba, la distribución es de 12/24=50% para
los Conocidos, 8/24=33.33% para los Familiares, y 4/24=16.67% para los Amigos.
7. REPRESENTACIÓN.
Hay muchas formas de representar a una función de distribución: expresión matemática, tablas, matrices,
gráfica de Venn, diagramas de frecuencias, gráfico de pastel, y muchas más: cuestión de conveniencias de
uso.
8. ELEMENTOS.
Dentro del grupo de 24 compañeros que frecuentan las reuniones sociales, algunos de ellos tienen
cualidades musicales, y su participación en espectáculos les ha beneficiado con una retribución simbólica,
que es tema del siguiente ejemplo...
9. EJERCICIO
100/5=100∗1/5
Veamos. 100 es la cantidad a distribuir, y 1/5 es el factor o función de distribución. Para distribuir, se
multiplica la cantidad a distribuir por el factor de distribución, y ¡listo!
Ahora hagamos el ejercicio de distribuir los $100 entre: Lulú, 20%; Mimí, 25%; Sandra, 18%; Hugo, 22%; y
Paco, 15%.
La función de distribución son estos mismos valores, sin el valor porcentual, esto es:
f(x=Lulú)=0.20
f(x=Mimí)=0.25
f(x=Sandra)=0.18
f(x=Hugo)=0.22
f(x=Paco)=0.15
Para hacer la distribución, basta con multiplicar la cantidad a distribuir por el factor de distribución:
Lulú,100∗0.20=$20
Mimí,100∗0.25=$25
Sandra,100∗0.18=$18
Hugo,100∗0.22=$22
Paco,100∗0.15=$15
10. PATRÓN.
50/7=50∗1/7
Ahora hagamos el ejercicio de distribuir los $50 entre: Lulú, 20%; Mimí, 5%; Sandra, 8%; Hugo, 12%; Luis,
30%; Memo, 10% y Paco, 15%.
La función de distribución son estos mismos valores, sin el valor porcentual, esto es:
f(x=Lulú)=0.20
f(x=Mimí)=0.05
f(x=Sandra)=0.08
f(x=Hugo)=0.12
f(x=Luis)=0.30
f(x=Memo)=0.10
f(x=Paco)=0.15
Para hacer la distribución, basta con multiplicar la cantidad a distribuir por el factor de distribución:
Lulú, 50∗0.20=$10.00
Mimí, 50∗0.05=$2.50
Sandra, 50∗0.08=$4.00
Hugo, 50∗0.12=$6.00
Luis, 50∗0.30=$15.00
Memo, 50∗0.10=$5.00
Paco, 50∗0.15=$7.50
11. VARIABLE.
Y de suerte!.
12. RULETA.
TK, un afamado músico de un grupo de Chicago, decidió probar suerte jugando a la Ruleta Rusa
Se carga un revolver con una sola bala, se gira el tambor donde se alojan las balas, el osado se coloca el
cañón en la sien, y "clic", jala del gatillo.
Al girar el tambor, la bala queda alojada en cualquiera de las 6 posiciones,... es como lanzar un dado,
apostando a un número en particular.
13. AZAR.
14. ENFOQUE.
La variable aleatoria (va), puede asociarse a las 6 posiciones del tambor, con valores de 1 a 6, y probabilidades
de 1/6; o bien, a la incidencia, con valores de probabilidad de 5/6 para "vacío", y de 1/6 para "bala".
15. RESUMEN.
Espacio muestral: las seis posiciones o espacios de la recamara del tambor. Hay que tomar en cuenta
que el valor numérico es fisicamente inexistente.
Evento: Es el resultado luego de presionar el gatillo, que pudiera ser "vacío" o "bala".
16. EL ZAHIR.
Paulo Coehlo, en su obra "El Zahir", propone "catálogar" a la gente que frecuenta eventos sociales, y ofrece
la siguiente ponderación de asistencia: Socios, 10%; Talentos, 2%,; Tupamaros, 3%; y Bandejas, 85%.
¿Qué tipo de probabilidad crees que haya originado esta clasificación? a) Clásica, b) Empírica, c) Subjetiva.
17. EL ZAHIR.
Continuando con el caso de "El Zahir", en la condición que Cohelo indica, ¿qué probabilidad hay de que al
elegir a una persona al azar, esta sea del tipo Talento o Tupamaro?
18. EL ZAHIR.
Ampliando el caso del Zahir, de Paulo Coehlo: En una reunión asisten 500 personas, ¿qué tantos Socios y
Bandejas se espera tener presentes?
19. EL ZAHIR.
Continuando con el caso de "El Zahir", si en una reunión se presentaron la cantidad de personas que se indica
en la tabla: 70 Socios, 15 Talentos, 20 Tupamaros, y 600 Bandejas, ¿qué probabilidad hay de que al entablar
una conversación con alguna persona al azar, esta sea Socio o Talento?
20. TRASCABOS.
Carlos se dedica a la renta de trascabos para para nivelar terrenos o sacar escombro. Los registros de los
últimos 30 días, indican que: hubo 3 días en que no se tuvo cliente alguno; 5 días en que únicamente hubo un
cliente; 12 días en que se presentaron 2 clientes; 8 días en que se tuvieron 3 clientes; y 2 días en que se
tuvieron 4 clientes ¿Qué función de distribución de probabilidad corresponde con esta descripción de
actividad?
21. TRASCABOS.
Como extensión al caso de los trascabos de Carlos, ¿qué tipo de probabilidad dan lugar a los registros de la
tabla, y a la función de distribución de probabilidad correspondiente?: a) Clásica, b) Empírica, c) Subjetiva
22. RECORDAR.
CONCEPTOS:
Ejercicios
Tabla (x, FO(x)): {(0, 4); (1, 6); (2, 18); (3, 10); (4, 2)}
2. A lo largo de su carrera, la profesora Sandra ha otorgado 186 calificaciones A, entre sus 1200 alumnos.
Pr(A) = ?
1200 / 186
(1200 - 186) / 1200
186 / 1200
4. Se lanza un dado cargado a los pares, con el doble sobre los nones.
Tabla (x, FO(x)): {(1, 1); (2, 2); (3, 1); (4, 2); (5, 1); (6, 2)}
2/9
4/9
5/9
6. Un surtidor de dulces tiene lunetas de colores: Seis verdes, cuatro rojas, y tres blancas. Determina:
Pr(verde) = ?
3 / 13
4 / 13
6 / 13
(3 + 4) / 13
Pr(roja o blanca) = ?
(3 + 6) / 13
(3 + 4) / 13
(3/13) * (4/13)
(3/13) * (6/13)
Pr([M]atemáticas) = 2/3
Pr([I]nglés) = 4/9
Pr([A]mbas) = 1/4
En una encuesta de 500 estudiantes… 320 tienen [C]ompu, 175 [TV], 100 [A]mbas
Pr(C) = ?
175 / 500
100 / 500
320 / 500
(100 + 320) / 500
Pr(TV) = ?
175 / 500
100 / 500
320 / 500
(100 + 320) / 500
Pr(A) = ?
175 / 500
100 / 500
320 / 500
(100 + 320) / 500
1. CONJUNTAS.
Para que una función de variables aleatorias se considere conjunta, es necesario que se presenten elementos
compartidos; esto es, intersecciones de conjuntos: que los elementos cumplan con características que los
involucran en más de un conjunto.
Figura 3.2.2.1a
Para el ejemplo de las personas que se frecuentan en reuniones, clasificados como Conocidos, Familiares
y Amigos; si entre estos dos últimos hay algunos Músicos, como lo indica el diagrama de Venn, con 6 Músicos
entre los Familiares, y 3 entre los Amigos; entonces, se tienen variables conjuntas que involucran
a... Compañero: Familiar o Amigo; y Músico: Si o No.
El diagrama muestra 8 Familiares, 4 Amigos, y 9 Músicos, en conjuntos que no son excluyentes del todo.
Por ello, cuando se requiere contabilizar la unión de dos conjuntos como los de Familiares y Músicos, es
necesario evitar duplicar la cuenta de elementos en común.
Si bien la cuenta directa de sus elementos es de 8+9=17, la cuenta bajo la consideración de elementos
comunes resulta en la cantidad correcta de 8+9-6=11.
2. CONSIDERACIONES.
3. REPRESENTACIÓN.
Figura 3.2.2.2a
La diapositiva muestra la conformación de Músicos, variable x, de valores Si, con 9, y No, con 3; y por tipo
de Compañero, variable "y", de valores Familiares, con 8, y Amigos, con 4. La distribución conjunta, es f(x,y).
Tanto la variable x como la y, clasifican por separado al espacio muestral del grupo de 12 personas.
Las cantidades que se observan en las columnas finales, indican conteos de individuos en Frecuencias
Absolutas, así como los correspondientes valores porcentuales en Frecuencias Relativas; que, como ya se ha
visto, también constituyen la fdp al omitir el porcentaje.
Las Frecuencias Absolutas, en la tabla, son: #(M,F)=6, #(M,A)=3, #(M´,F)=2, #(M´,A)=1.
4. CUANTIFICACIÓN
Aun cuando las representaciones tienen una explicación extensa, el ejercicio de cuantificación es sumamente
simple ya que son 9 Músicos, en un espacio muestral o "todo" de 12 personas, entre Familiares y Amigos; por
lo que:
Pr(M)=9/12=0.75=75%
5. REPRESENTACIÓN
Figura 3.2.2.3a
Tanto la variable x como la y, clasifican por separado al espacio muestral del grupo de 20 alumnos.
Desde la consideración de conjuntos, un criterio de formulación es: el conjunto de alumnos Aprobados, 15; y
los conjuntos de alumnos por género: Femenino, 8; y Masculino, 12. Bajo este criterio, ¿dónde se consideran
los alumnos Reprobados? Pues en el complemento del conjunto A, esto es A′ = "los que NO están Aprobados
", es decir, los reprobados. La indicación de A con tilde A′, es el complemento de A.
Las cantidades que se observan en las columnas finales, indican conteos de individuos en Frecuencias
Absolutas, así como los correspondientes valores porcentuales en Frecuencias Relativas; que, como ya se ha
visto, también constituyen la fdp al omitir el porcentaje.
Las Frecuencias Absolutas, en la tabla, son: #(A,F)=5, #(A,M)=10, #(R,F)=3, #(R,M)=2.
6. CUANTIFICACIÓN
Nuevamente, aun cuando las representaciones tienen una explicación extensa, el ejercicio de cuantificación
es sumamente simple, ya que son 5 alumnos Aprobados, en un espacio muestral o "todo" de 20 alumnos,
entre Femeninos y Masculinos; por lo que:
Pr(A∩F)=5/20=0.25=25%.
7. RESUMEN
Hablar de un evento, es hablar de un resultado específico. En el caso de variables conjuntas, el que cada
variable asuma un valor.
Figura 3.2.2.4a
La primera tabla resalta dos circunstancias: 1) Los eventos excluyentes, que tienen lugar cuando una situación
"compartida", no tiene elementos. Y 2) Los eventos independientes, que resalta el hecho de que la ocurrencia
de uno no influye en el desenlace del otro.
Figura 3.2.2.5a
En la segunda tabla se muestran algunas reglas de probabilidad, las cuales son formas de cálculo que se aplican
en la cuantificación de una probabilidad particular, dígase de la unión de dos conjuntos bajo condiciones
particulares de ser o no excluyentes; como se indica en la tabla.
Ejemplo
Referencia: http://www.elfinanciero.com.mx/universidades/20-de-los-nacimientos-al-ano-en-mexico-
provienen-de-madres-menores.html
El 11 por ciento de los nacimientos en el mundo se producen en mujeres de entre 15 y 19 años, de acuerdo a
la Organización Mundial de la Salud (OMS). En México, la tasa es del 20 por ciento.
En el tema del riesgo que representa este tipo de escenarios, las mujeres que se embarazan antes de los 16
años tienen cuatro veces más probabilidad de morir que las que lo hacen después de los 20. Las causas
principales de enfermedad y muerte, son la preeclampsia y la hemorragia posparto.
Adicionalmente, se calcula que el 55 por ciento de los embarazos adolescentes son no deseados, y la mayoría
se suele dar en la primera relación sexual.
Si se eligen dos bebés de una sala de cuneros de un hospital de salud pública de México, ¿cuál es la
probabilidad de que al menos uno de ellos sea de una madre en edad de entre 15 y 19 años?
Respuestas al problema:
Los diagramas de árbol expanden sus ramas con la sucesión de valores de las variables
aleatorias va involucradas en el problema. Cada valor de va se expande con los valores de una siguiente va.
Para el caso de madres entre los 15 y 19 años, Quinceañeras, el diagrama de árbol se inicia con la consideración
del 1er bebé que Si tenga o No una madre de esas edades: Q o M; y prosigue, en cada una de estas ramas,
con la consideración de que el segundo bebé Si tenga o No una madre de esas edades: Q o M. Las hojas
terminales del árbol constituyen los valores de las variables conjuntas: cumplen en cascada con todas las
características de las ramas que le dieron lugar.
Figura 3.2.2.9a
Para el cálculo de la probabilidad de que al menos uno de los bebés tenga una madre entre los 15 y 19 años,
se puede observar que una forma de estimación es sumando las ramas que incluyen al menos una Q; o bien,
mediante el complemento de probabilidad en relación a la rama que describe a dos bebés de madre mayor:
=0.04+0.16+0.16=0.36
El espacio muestral S, o todo debe incluir la posibilidad de dos bebés de Q; el primer bebé de Q y el segundo
de M, y visceversa; y finalmente, dos bebés de M.
S=QQ,QM,MQ,MM
De acuerdo a los criterios de tipos de eventos, vistos anteriormente, donde si A y B son eventos
independientes, Pr(A y B)=Pr(A)⋅Pr(B), se tiene
Pr(Q∩Q)=Pr(Q1)∗Pr(Q2)=0.2∗0.2=0.04
Pr(Q∩M)=Pr(Q1)∗Pr(M2)=0.2∗0.8=0.16
Pr(M∩Q)=Pr(M1)∗Pr(Q2)=0.8∗0.2=0.16
Pr(M∩M)=Pr(M1)∗Pr(M2)=0.8∗0.8=0.64
Si C es el evento asociado a que al menos uno de esos bebes sea de una madre con edad entre 15 y 19 años,
entonces, por ser eventos excluyentes, de acuerdo a las reglas expuestas:
Pr(C)=Pr(Q∩Q)+Pr(Q∩M)+Pr(M∩Q)
Pr(C)=0.04+0.16+0.16=0.36
Respuesta: existe un 36% de posibilidad de que al menos un bebé se encuentre en tal condición ¿Es un
porcentaje bajo, o preocupante? Comparte tu respuesta en el foro.
¿Cuál es la probabilidad de que al menos uno de estos bebés sea de una madre en edad de entre 15 y 19 años,
y además producto de un embarazo no deseado?
En el siguiente diagrama de árbol, se utiliza el Resultado del problema anterior: que al menos uno de los bebés
provenga de una madre con edad entre 15 y 19 años, con ramas de Si o No; y prosigue, en cada una de estas
ramas, con la consideración de que Si o No se trate de un bebé Deseado. Las hojas terminales del árbol
constituyen los valores de las variables conjuntas, que cumplen en cascada con todas las características de las
ramas que le dieron lugar.
Figura 3.2.2.10a
Para el cálculo de la probabilidad de que al menos uno de los bebés tenga una madre entre los 15 y 19 años,
y que este sea no deseado, se puede observar que la segunda rama del árbol es la única que cumple con tal
condición; por lo cual, la respuesta es
Pr(R,D′)=Pr(R∩D′)=0.36∗0.55=0.187
6. RECORDAR
CONCEPTOS:
Pr(A∪B)=
Pr(A)+Pr(B)–Pr(A∩B)
#(A∩B)=0;Pr(A∩B)=0
#(A∩B)=#A∗#B#S
Pr(A∩B)=Pr(A)∗Pr(B)
Si A y B son excluyentes:
Pr(A∪B)=Pr(A)+Pr(B)
Pr(A∪B∪C)=
Pr(A)+Pr(B)+Pr(C)−Pr(A∩B)−Pr(A∩C)−Pr(B∪C)
+Pr(A∩B∩C)
Lo que no está en A:
Pr(A′)=1−Pr(A)
RECORDAR.
Figura 3.2.2.1
Figura 3.2.2.2
Figura 3.2.2.3
Figura 3.2.2.4
Ejercicios
E = {1,2,3,4,5,6}
P = {2,4,6}
T = {3,6}
(P U T) = ?
{2,3,4,5,6}
{6}
{2,3,4,6}
{2,3,4,6,6}
(P , T) = ?
{2,3,4,5,6}
{6}
{2,3,4,6}
{2,3,4,6,6}
Pr(P U T) = ?
{2,3,4,6}
9 / 11
2/9
7/9
Pr(P, T) = ?
4/6
9 / 11
2/9
7/9
z=x+y
Pr(z = 7) = ?
6 / 36
2 / 36
10 / 36
8 / 36
Pr(z = 11) = ?
6 / 36
2 / 36
10 / 36
8 / 36
{(1, M, 30); (2, M, 32); (3, M, 40); (4, F, 45); (5, F, 20)}
Cierto
Falso
A través de un estudio en una Universidad (ver registros), se desea determinar el tipo de relación entre
Pr(Escaso Interés) = ?
60 / 150
17 / 50
25 / 150
50 / 150
Pr(Habilidad Regular) = ?
60 / 150
17 / 50
25 / 150
50 / 150
EXPLICACIÓN TEXTUAL
1. REENFOCAR.
El cálculo de una probabilidad condicional, responde a la necesidad del analista por hacer una comparación
de "algunos" aspectos, (x,y), respecto a un todo (y), relativo a esos aspectos.
La fórmula se lee como la probabilidad de x dado y, es igual al valor de frecuencia absoluta de la conjunta (x,y);
entre el valor de frecuencia absoluta de (y); donde (x,y) son variables aleatorias va conjuntas.
Pr(x|y)=#(x∩y)#(y)
2. CONJUNTAS.
Figura 3.2.3.1
Para el caso de las personas Compañeros de reuniones, en los que hay Músicos entre los Familiares y Amigos,
los valores conjuntos se muestran en el diagrama como intersecciones de conjuntos; en tanto que los valores
marginales, como secciones aisladas.
La condición del caso indica considerar a los "Músicos", como espacio muestral, y ponderar la sección de
intersección que éste tiene con el conjunto de "Familiares", esto es:
Pr(F|M)=#(F∩M)#(M)=69=0.6667
3. MUSICOS (F).
Una versión reducida del diagrama de Venn, en el denominador de la fórmula de probabilidad condicional,
permite igualmente llegar a la solución:
Figura 3.2.3.2
Pr(F|M)=#(F∩M)#(M)=69=0.6667
4. MUSICOS (A).
Utilizando esta misma versión reducida del diagrama de Venn, en el denominador de la fórmula de
probabilidad condicional, se puede estimar la Pr(A∣M):
Pr(A|M)=#(A∩M)#(M)=39=0.3333
Pr(F|M)+Pr(A|M)=0.6667+0.3333=1
De donde se puede concluir que las probabilidades condicionales Pr(F∣M) y Pr(A∣M), son las "partes" de la
fdp de (M).
5. TABLA.
Figura 3.2.3.4
La diapositiva Figura 3.2.3.4 muestra las variables aleatorias de Músicos y Compañeros en las primeras dos
columnas de la tabla, y en la que se considera un total de 12 personas.
x es la variable aleatoria asociada a los músicos, con indicador de (Si) o (No) serlo; y y, permite referenciar a
las personas o compañeros que son "Familiares" o "Amigos".
La estimación de la probabilidad de entablar conversación con una persona en este contexto, seleccionada al
azar, que sea familiar, dado que es músico, procede haciendo la consulta a los datos estadísticos "conjuntos",
en la columna de frecuencias absolutas:
#(M,F)=6,#(M,A)=3,#(M′,F)=2,#(M′,A)=1;
Por tanto,
Pr(F|M)=#(F,M)#(M)=69=0.6667=66.67%
Respuesta:
6. ARBOL.
Los diagramas de árbol expanden sus ramas con la sucesión de valores de las variables
aleatorias (va) involucradas en el problema. Cada valor de (va) se expande con los valores de una
siguiente (va).
Para el caso de (M)úsicos y (C)ompañeros, el diagrama de árbol se inicia con los valores correspondientes a
las personas que son y no son (M)úsicos: (M) y (M′); y prosigue, en cada una de estas ramas, con los tipos
de (C)ompañeros: (F)amiliares y (A)migos.
Figura 3.2.3.5
Las hojas terminales del árbol constituyen los valores de las variables conjuntas, en sus intersecciones de
conjuntos, que cumplen en cascada con todas las características de las ramas que le dieron lugar.
Pr(M,F)=Pr(M∩F)=0.50
Pr(M)=Pr(M∩F)+Pr(M∩A)=0.50+0.25=0.75
Pr(F|M)=Pr(M∩F)Pr(M)=0.500.75=0.6667
7. MATRIZ.
La representación de datos asociados a las distribuciones de frecuencias absolutas y relativas se puede hacer
también en matrices tabulares, utilizando los renglones y las columnas para colocar las variables aleatorias y
sus valores.
En las celdas de la matriz, se asientan los valores conjuntos de las frecuencias absolutas, #f(x,y), o
relativas f(x,y).
Figura 3.2.3.6
8. CONJUNTAS.
Para el caso de los índices de aprobación, los valores conjuntos se muestran en el diagrama como
intersecciones de conjuntos; en tanto que los valores marginales, como secciones aisladas.
Figura 3.2.3.7
La condición del caso indica considerar al género "Femenino", como espacio muestral, y ponderar la sección
de intersección que éste tiene con el conjunto de "Aprobados", esto es:
Pr(A|F)=#(A∩F)#(F)=58=0.625
9. INDICES.
Con la versión reducida del diagrama de Venn, en el denominador de la fórmula de probabilidad condicional
se observan las partes a considerar en la solución:
Figura 3.2.3.8
Pr(A|F)=#(A∩F)#(F)=58=0.625
10. TABLA.
Figura 3.2.3.9
En esta lámina, la tabla hace referencia al reporte de fin de período escolar de un grupo de 20 alumnos, para
el cual se reportan los índices de aprobación, por género.
El grupo es el espacio muestral, x la variable aleatoria asociada a los alumnos "Aaprobado"s y "Reprobado"s;
y y, la cantidad de estudiantes del género "Femenino" y "Masculino" en el grupo.
Se desea estimar la probabilidad de que un estudiante de ese grupo, seleccionado al azar, haya aprobado el
curso, dado que la consulta se realiza a una alumna.
#(A,F)=5,#(A,M)=10,#(R,F)=3,#(R,M)=2
La ponderación de probabilidad se realiza "exclusivamente" sobre el género "femenino", que se asume como
el "todo" o espacio muestral de esta cuantificación; y la cantidad a ponderar es la de aquellas alumnas que
hayan aprobado, es decir: #(A,F)=5.
Por tanto,
Pr(A|F)=#(A,F)#(F)=58=0.625=62.5%
11. ARBOL.
Los diagramas de árbol expanden sus ramas con la sucesión de valores de las variables
aleatorias (va) involucradas en el problema. Cada valor de (va) se expande con los valores de una
siguiente (va).
Para el caso del reporte de calificaciones de fin de curso, el diagrama de árbol se inicia con los valores
correspondientes a los alumnos Aprobados y Reprobados = (A′); y prosigue, en cada una de estas ramas, con
las ramas de géneros Femenino y Masculino. Las hojas terminales del árbol constituyen los valores de las
variables conjuntas, en sus intersecciones de conjuntos: cumplen en cascada con todas las características de
las ramas que le dieron lugar.
Figura 3.2.3.10
Pr(F)=Pr(A∩F)+Pr(R∩F)=0.25+0.15=0.40
Pr(A|F)=Pr(A∩F)Pr(F)=0.250.40=0.625
La representación de datos asociados a las distribuciones de frecuencias absolutas y relativas se puede hacer
también en matrices tabulares, utilizando los renglones y las columnas para colocar las variables aleatorias y
sus valores.
En las celdas de la matriz, se asientan los valores conjuntos de las frecuencias absolutas, #f(x,y), o
relativas f(x,y).
Figura 3.2.3.11
Por ejemplo, en el renglón 1, de género "Femenino", se encuentran los valores #(x=A,y=F)=5, #(x=R,y=F)=3, y
la suma de estos, que es el marginal del género "Femenino", #(F)=8.
En el renglón 2, de género "Masculino", se encuentran los valores de #(x=A,y=M)=10,#(x=R,y=M)=2, y la suma
de estos, que es el marginal del género "Masculino", #(M)=12.
El cálculo de Pr(A∣F), se determina con la fórmula:
Pr(A|F)=#(A,F)#(F)=58=0.625
La probabilidad de que una mujer Mx entre 15 y 19 años (Q) tenga un embarazo, es del 0.20, de acuerdo a la
Organización Mundial de la Salud. Y la probabilidad de que se trate de un embarazo no deseado (D’), es
de 0.55. Por otra parte, la probabilidad de que una mujer mayor (Q’) tenga un embarazo no deseado, es
de 0.10.
1. Si se elige una mujer Mx embarazada, mayor de 14 años, ¿cuál es la probabilidad de que se trate de un
embarazo no deseado?
2. Si la mujer elegida ha declarado que su embarazo es no deseado, ¿cuál es la probabilidad de que se trate de
una mujer entre 15 y 19 años?
La solución se realiza utilizando un diagrama de árbol, con las ramas de (Q), embarazo de edad entre 15 y 19
años; y (Q′), negación de lo anterior; y prosigue, en cada una de estas ramas, con las ramas de Deseado
y (D′) no deseado. Las hojas terminales del árbol constituyen los valores de las variables conjuntas, o
intersecciones de conjuntos: cumplen en cascada con todas las características de las ramas que le dieron
origen.
Figura 3.2.3.13
Pr(D′)=Pr(Q∩D′)+Pr(Q′∩D′)=0.11+0.08=0.19
Pr(Q|D′)=Pr(Q∩D′)Pr(D′)=0.110.19=0.5789
RECORDAR.
CONCEPTOS:
f(x∣y)=f(x,y)f(y)
Pr(x∣y)=#(x∩y)#y
Pr(x∣y)=Pr(x∩y)Pr(y)
Elementos conjuntos (numerador), entre el contexto de interés al que pertenecen esos elementos conjuntos
(denominador).
RECORDAR.
Figura 3.2.2.6
Figura 3.2.2.7
Figura 3.2.2.8
Ejercicios
Pr(x1 = chocolate) = ?
5 / 15
15 / 20
5 / 20
10 / 20
Pr(x1 = x2 = chocolate) = ?
(4/19) / (5/20)
(4/19) * (5/20)
2/6
2 / 12
2 / 11
2 / 35
Pr(Masculino) = ?
0.05
0.45
0.60
0.55
Pr(Mercadotecnia) = ?
0.35
0.23
0.30
0.40
Pr(Mercadotecnia, Femenino) = ?
0.05
0.10
0.15
0.07
Pr(Femenino | Finanzas) = ?
0.35
0.4545
0.40
0.50
EXPLICACIÓN TEXTUAL.
1. FUNDAMENTO.
En los siguientes incisos, se describe el origen de la fórmula de probabilidad condicional que se utiliza en los
casos a los que está orientado el teorema de Bayes.
Finalmente, luego de igualar las dos expresiones de intersección de estos ejercicios, se despeja el término de
probabilidad condicional para A dado B, con lo cual se obtiene la expresión fundamental del teorema - ver el
inciso f.
b. De donde,
Pr(A∩B)=Pr(A|B)∗Pr(B)
Pr(B|A)=Pr(A∩B)Pr(A)
d. Se tiene que,
Pr(A∩B)=Pr(B|A)∗Pr(A)
Pr(B|A)∗Pr(A)=Pr(A|B)∗Pr(B)
f. Despejando,
Pr(A|B)=Pr(B|A)∗Pr(A)Pr(B)
2. TEOREMA.
Consiste en reformular probabilidades previas (a priori), a partir de información adicional al caso, para dar
lugar, con ello, a probabilidades subsecuentes, o a posteriori.
3. CICLO.
La diapositiva muestra la secuencia algorítmica que subyace detrás del Teorema de Bayes: En ciclo horario,
empezando a las 12:00, en la parte superior, el dato de la probabilidad alrededor de la hipótesis; a la derecha,
el dato de la probabilidad de la evidencia que sustenta a la hipótesis; luego, la operación a realizar con estos
datos, y origen de la probabilidad conjunta, al centro; de donde la suma de las probabilidades alrededor de
las evidencias permite obtener la probabilidad marginal de la(s) evidencias, en la parte inferior; para
finalmente ponderar estas evidencias y obtener la probabilidad de la hipótesis, dada las evidencias:
Pr(H|E)=Pr(E|H)∗Pr(H)/Pr(E)
Pr(H|E)=P(H∩E)Pr(E)
Figura 3.3.1.1
4. PILI Y MILY.
Pili y Mili trabajan juntas las tareas de una asignatura escolar. Pili realiza el 75% del trabajo y Mili el resto. Las
secciones que realiza Pili reciben 15% de observaciones de corrección C, en tanto que Mili recibe el 20%. Si en
una revisión se encuentra una observación, ¿cuál es la probabilidad de que Pili haya realizado esa parte del
trabajo?
Datos y su interpretación:
Pr(C|P)=0.15,Pr(P)=0.75
Pr(C|M)=0.20,Pr(M)=0.25
Solución:
(La relevancia del hecho de que sea Pili la autora de un trabajo con Observaciones), se determina mediante
(la ponderación de las Observaciones al trabajo de Pili), en relación a (estas mismas Observaciones a sus
trabajos), y (las Observaciones al trabajo de Mili):
Pr(P|C)=Pr(C|P)∗Pr(P)Pr(C)
=0.6923
Pr(P|C)=0.11250.1625=0.6923
Los diagramas de árbol expanden sus ramas con la sucesión de valores de las variables
aleatorias (va) involucradas en el problema. Cada valor de (va) se expande con los valores de una
siguiente (va).
Figura 3.3.1.2
Para el caso de Pili y Mili, y las observaciones en trabajos, el diagrama de árbol se inicia con los valores
correspondientes a la participación de las chicas en el desarrollo de los Trabajos Pily, 0.75, y Mili, 0.25; y
prosigue, en cada una de estas ramas, con las ramas de observaciones de Correcciones a los Trabajos,
correcciones para Pili (C∣P)=0.15, y (C′∣P)=0.85; e igual para Mili: (C∣M)=0.20, y (C′∣M)=0.80
Las hojas terminales del árbol constituyen los valores de las variables conjuntas, en sus intersecciones, que
cumplen en cascada con todas las características de las ramas que le dieron lugar.
Pr(P∩C)=0.1125;Pr(P∩C′)=0.6375;
Pr(M∩C)=0.05;Pr(M∩C′)=0.2
Pr(C)=Pr(P∩C)+Pr(M∩C)=0.1125+0.05=0.1625
Pr(P|C)=Pr(P∩C)Pr(C)=0.11250.1625=0.6923≈70%
En la representación de este caso, a través del diagrama de Venn, se utilizan 3 conjuntos: Pily, Mili, y
observación de Correcciones.
Figura 3.3.1.3
El problema indica que el espacio muestral o todo, está referido a las observaciones de Correcciones realizadas
a los trabajos de las chicas: C∩P y C∩M; y que, de estas dos partes, la parte a ponderar corresponde a la
sección de C∩P, esto es:
Pr(P|C)=Pr(C∩P)Pr(C)=Pr(C|P)∗Pr(P)Pr(C)
Pr(P|C)=0.15∗0.75(0.15∗0.75+0.20∗0.25)=0.6923
casi el 70%.
La solución del problema de Pili y Mili, y las observaciones de correcciones, con tablas matriciales, tiene mucha
semejanza con la solución a través de diagramas de árbol.
Se inicia con una tabla de fdp del Trabajo, con valores de la variable aleatoria (va) de Pr(x=P)ily=0.75,
y Pr(x=M)ili=0.25.
Figura 3.3.1.4
En seguida, se asientan los datos correpondientes a las observaciones de Corrección de los trabajos, en las
celtas de una matriz de probabilidad condicional: observaciones de correcciones, para Pily, Pr(C∣P)=0.15; y
observaciones de correcciones para Mili, Pr(C∣M)=0.20
Figura 3.3.1.5
Esta última matriz puede completarse con los valores de complemento a las probabilidades
anteriores: Pr(C′∣P)=1-0.15=0.85, y Pr(C′∣M)=1-0.20=0.80
Con el producto de las probabilidad del Trabajo, con la matriz de probabilidad condicional, se obtiene la
matriz de probabilidad conjunta, con columnas Pr(Tx∩C) y Pr(Tx∩C′):
Figura 3.3.1.6
Pr(P∩C)=0.1125,Pr(P∩C′)=0.6375
Pr(M∩C)=0.0500,Pr(M∩C′)=0.2000
8. CASO PILI Y MILY, CON TAB LAS MATRICIALES, CONTINUACIÓN.
La suma de las columnas de la matriz conjunta, ofrece los espacios muestrales de Correcciones y
sin Correcciones, respectivamente
Figura 3.3.1.7
Pr(C=si)=0.1125+0.0500=0.1625;
Pr(C=no)=0.6375+0.2000=0.8375
La división de las celdas de la matriz conjunta, entre los elementos de la fdp marginal f(C)=Pr(Cx),
recientemente calculada, da como resultado la matriz condicional inversa, Pr(Tx∣Cx) (por columna):
Figura 3.3.1.8
Pr(P|C)=0.11250.1625=0.6923
Pr(M|C)=0.3077
Pr(P|C′)=0.7612
Pr(M|C′)=0.2388
Figura 3.3.1.9
Pr(C|P)=0.1125/0.75=0.15
Pr(C|M)=0.0500/0.25=0.20
Y así sucesivamente...
En esta última diapositiva, se observan los cuatro arreglos matriciales involucrados en los cálculos:
Figura 3.3.1.10
La Teoría de Bayes es de relevancia singular, ya que permite trazar un rumbo a seguir ante una sucesión de
eventos.
A fin de empezar a practicar los principios de Bayes en la vida diaria, es recomendable tener en cuenta los
siguientes aspectos:
El examen de certificación de carrera, les toma a los alumnos terminarlo de 5 a 9 horas, de acuerdo a la
siguiente función de distribución porcentual (horas, %):
(5, 15%), (6, 20%), (7, 25%), (8, 35%), (9, 5%)
3. Una encuesta de salida del examen de certificación, indica que 35% lo consideraron fácil, 25% regular, y
40% difícil. Luego, se realizaron algunas entrevistas en la estación de radio local sobre el particular, por lo cual
se desea saber, ¿cuál es la probabilidad de que el entrevistado considere el examen fácil o difícil?
0.35 + 0.25
0.25 + 0.40
1 - 0.25
4.http://www.paho.org/col/index.php?option=com_content&view=article&id=1297:dia-mundial-del-lavado-
de-manos-las-manos-limpias-salvan-vidas&Itemid=460 15 de Octubre: Día mundial del lavado de manos.
En el mundo, la diarrea es una de las causas principales de morbi-mortalidad,el 88% de las muertes por diarrea
se deben a la falta de acceso a facilidades de saneamiento, además de la disponibilidad de agua para higiene
y para consumo. Hoy en día 2.5 billones de personas, entre los que casi un billón son niños, viven sin
saneamiento básico. Cada 20 segundos, un niño muere como resultado de un saneamiento precario, eso
significa 1.5 millones de muertes al año que podrían prevenirse. Según la Organización Mundila de Salud
(OMS) el lavado de manos con agua y jabón reduciría el riesgo de las enfermedades diarreicas agudas en un
47 por ciento.
Aludiendo a este caso, se realizó una encuesta para determinar si los alumnos, de los diferentes grados
escolares de una institución educativa, se lavaban las manos después de ir al baño. Los resultados indican:
¿Qué tipo de origen se le atribuye a los datos base de este problema?
Objetiva - clásica
Objetiva - empírica
Subjetiva - Bayessiana
5. Desde el punto de vista de "toda" la institución educativa, ¿qué porcentaje acumulan de "práctica de lavado
de manos" los dos grados escolares de mejores prácticas?
45%
27%
10%
La función de distribución conjunta de alumnos de grados de avance medio hacia atrás y hacia adelante, y
aseo de manos, indica que:
6. ¿Cuál es la probabilidad de que al elegir un alumno al azar, este sea de avance en grados (1 a 3), dado que
no se lavó las manos?
7. ¿Cuál es la probabilidad de que al elegir un alumno al azar, este sea de avance en grados (1 a 3), dado que
sí se lavó las manos?
8. Si te encuentras un alumno de esta institución, y sabes que estudia en alguno de los 3 primeros grados,
¿cuál es la probabilidad de que tenga las manos limpias?
No más del 9%
9. Si en la institución, la matrícula es de 200 alumnos, ¿cuántos del primer grado se esperaría que no se lavaran
las manos?
Entre 20 y 25
Entre 25 y 30
Entre 30 y 35
10. Si en la institución educativa en general hay una proporción de 3 chicas por cada 5 registros de matrícula,
y la proporción de ellas que se lavan las manos luego de ir al baño es de 1 en 20, en tanto que para los varones
es de 1 en 25, ¿cuál es la probabilidad de que una encuesta que indica sí tener la precaución de asearse luego
de ir al baño, pertenezca a un varón?
Entre 30 y 50%
Entre 50 y 70%
Entre 70 y 90