Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Tema 3 - Probabilidades

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 45

Posgrado FRT-UTN

MÉTODOS CUANTITATIVOS
Mauricio R. Talassino
mtalassino@face.unt.edu.ar

Licenciado en Economía (UNT)


Magister en Estadística Aplicada (UNT)
Doctor en Economía (UdeSA)

TEMA 3: PROBABILIDADES
TEMAS DE HOY

- Introducción a probabilidad
- Teoría de Conjuntos
- Enfoques de probabilidad
- Probabilidad condicional, independencia y regla del producto
- Regla de Bayes
- Variable Aleatoria
- Valor esperado
- Varianza
- Distribuciones de probabilidad
PROBABILIDAD
Medida numérica de la posibilidad de que un evento ocurra. Azar
Incertidumbre
0 ≤ 𝑃(𝐴) ≤ 1 Riesgo

El evento con Que el evento ocurra es tan El evento con


seguridad no probable como improbable seguridad
ocurrirá ocurrirá
EXPERIMENTO

Proceso que genera resultados bien definidos.

En una sola repetición de un experimento ocurrirá uno y sólo uno de los resultados
experimentales posibles.

Tipos:
- Determinísticos: al repetirse bajo las mismas condiciones arroja el mismo resultado
- ALEATORIOS: al repetirse, los resultados pueden ser distintos
EXPERIMENTO
Proceso que genera resultados bien definidos.
- Ej: arrojar un dado

Resultado: Suceso en particular proveniente de un experimento


- Ej: 1, 2, 3, 4, 5 , 6
Espacio muestral: conjunto de todos los resultados posibles de un experimento
S = {1, 2, 3, 4, 5 , 6}

Elemento o punto muestral: cada uno de los resultados del espacio muestral

Evento: subconjunto de un espacio muestral.


- Ej: 1, 2, Par, Mayor que 3, …
EXPERIMENTO
Proceso que genera resultados bien definidos.
- Ej: arrojar un dado

Resultado: Suceso en particular proveniente de un experimento


- Ej: 1, 2, 3, 4, 5 , 6
Espacio muestral: conjunto de todos los resultados posibles de un experimento
S = {1, 2, 3, 4, 5 , 6}
Elemento o punto muestral: cada uno de los resultados del espacio muestral
Evento: subconjunto de un espacio muestral.
- Ej: 1, 2, Par, Mayor que 3, …
Conjunto con regla: Conjunto de todos los resultados tales que son impares: I={x | x es impar}
EXPERIMENTO
Algunos experimentos pueden repetirse o tener varias etapas.

- Ej repetición: arrojo el dado dos veces:


- S={ (1, 1), (1, 2),…, (1, 6), (2,1), (2, 2),…, (2, 6),…, (6, 5), (6,6)}

- Ej etapas: puede llover y no llover, puedo llegar en horario al trabajo o llegar tarde
- S={(L,H), (L,T), (N,H), (N,T)}

- Ej repetición: Lanzo una pelota hasta que acierto al aro:


- S={A, FA, FFA, FFFA, FFFFA, …} …. Espacio muestral infinito
PROBABILIDAD

- Objetivo: asignar probabilidades a diferentes eventos. P(A)=?


- Para ello existen tres enfoques:
- Método subjetivo: asignar probabilidades en base a creencias
- Método clásico: aplicable para eventos con resultados igualmente probables
(equiprobables). P(A)= casos favorables / casos posibles.
- Ej. En dado. P(5) = 1/6; P(Par) = 3/6; P(x<10) = 1; P(x>6) = 0
- Método de frecuencias relativas:
- Ej: arrojo el dado 1000 veces, y anoto las frecuencias relativas de cada resultado.
Asigno probabilidades en base a eso
- Hago una encuesta a 300 consumidores y registro las frecuencias relativas de si
están conformes o no con un producto
EVENTOS Y CONJUNTOS: Representación gráfica
- Experimento:
- Etapa 1: Lanzo una moneda (Head or Tail).
- Etapa 2: Si salió H, lanzo otra vez (H, T). Si salió T, arrojo un dado
Diagrama de Árbol
S = {HH, HT, T1, T2, T3, T4, T5, T6)
EVENTOS Y CONJUNTOS: Representación gráfica

Diagrama de Venn
A: Aprobé un examen
B: Aprobé un examen con 10
C: No estudié para el examen
… sin puntos corresponde a “Estudié”: C’ ó Cc

No todos esos eventos son excluyentes:


- Puedo aprobar sin estudiar (A ∩ C)

Á𝑟𝑒𝑎 𝐶
𝑃 𝐶 =
Á𝑟𝑒𝑎 𝑇𝑜𝑡𝑎𝑙 (𝑆൯

P(S) = 1 P(∅) = 0
A ∩ B: Intersección entre los eventos A y B
Ocurren A y B simultáneamente

Á𝑟𝑒𝑎 𝑁𝑎𝑟𝑎𝑛𝑗𝑎
𝑃 𝐴∩𝐵 =
Á𝑟𝑒𝑎 𝑇𝑜𝑡𝑎𝑙 (𝑆൯
𝐴∩𝐵
A∩∅=∅
Si A ∩ B = ∅, se denominan mutuamente excluyentes y
P(A ∩ B) = 0
A   , A  A

A ∪ B: Unión los eventos A y B Ocurren A ó B ó ambos

𝑃 𝐴 ∪ 𝐵 = 𝑃 𝐴 + 𝑃 𝐵 − 𝑷(𝑨 ∩ 𝑩)

Si A y B mutuamente excluyentes: 𝑃 𝐴 ∪ 𝐵 = 𝑃 𝐴 + 𝑃 𝐵
A∪∅ =A
Si A, B, y C mutuamente excluyentes y colectivamente exhaustivos:
𝑃 𝐴∪𝐵∪𝐶 = 𝑃 𝐴 +𝑃 𝐵 +𝑃 𝐶 =P S = 1
Eventos complementarios

Sc = ∅
P(Sc) = 0

A∩ Ac = ∅ A ∪ Ac = S P(A ∪ Ac ) = P(A) + P(Ac) + P(A ∩ Ac )


P(∅) = 0 P(S) = 1 P(A) + P(Ac) = 1 =0

P(A ∩ Ac ) = 0 P(A ∪ Ac ) = 1 P(S) + P(Sc) = 1


Probabilidad Condicional
P (A | B): Probabilidad de que ocurra A dado que ocurrió el B
Á𝑟𝑒𝑎 𝐴
Probabilidad Marginal: 𝑃 𝐴 =
Á𝑟𝑒𝑎 𝑇𝑜𝑡𝑎𝑙 (𝑆൯
Á𝑟𝑒𝑎 (𝐴 ∩ 𝐵)
Probabilidad Conjunta: 𝑃 𝐴∩𝐵 =
Á𝑟𝑒𝑎 𝑇𝑜𝑡𝑎𝑙 (𝑆൯

Á𝑟𝑒𝑎 (𝐴 ∩ 𝐵)
Probabilidad Condicional: 𝑃 𝐴|𝐵 =
Á𝒓𝒆𝒂 𝑩

𝑃(𝐴 ∩ 𝐵) 𝑃(𝐴 ∩ 𝐵)
𝑃 𝐴|𝐵 = 𝑃 𝐵|𝐴 =
𝑃(𝑩) 𝑃(𝑨)

𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴|𝐵 𝑃 𝐵 = 𝑃 𝐵 𝐴 𝑃(𝐴) → Después volveremos a eso


Ejemplo
A continuación se presenta la distribución de frecuencias absolutas de las operaciones Fantabuloso S.R.L.
Operaciones de Fantabuloso S.R.L. según monto (en UTN$) y zona
Monto Zona Baja Mar Médanos Le Chetee Total
¿Cuántas operaciones de
20000 a menos de 25000 6 2 0 8 realizaron en Baja Mar por
25000 a menos de 30000 5 7 0 12 cada operación en Le
30000 a menos de 35000 1 4 1 6 Chetee?
35000 a menos de 40000 0 1 2 3
40000 a menos de 45000 0 0 1 1
Total 12 14 4 30
¿Cuál es la probabilidad de que …
… una operación tenga un monto de entre 30000 a menos de 35000 UTN$?
… una operación se haya realizado en Médanos?
… una operación se haya realizado en Médanos y tenga un monto de entre 30000 a menos de 35000 UTN$?
… una operación se haya realizado en Médanos y en Le Chetee?
… dentro de las operaciones que se realizaron en Médanos, el monto sea de entre 30000 a menos de 35000 UTN$?
… dentro de las operaciones de entre 30000 a menos de 35000 UTN$, hayan sido realizadas en Médanos?
… una operación cumpla al menos una de las siguientes condiciones: haber sido realizada en Médanos o tener un monto de
entre 30000 a menos de 35000 UTN$?
… una operación cumpla al menos una de las siguientes condiciones: haber sido realizada en Médanos o haber sido realizada en
Le Chetee?
Ejemplo
A continuación se presenta la distribución de frecuencias absolutas de las operaciones Fantabuloso S.R.L.
Operaciones de Fantabuloso S.R.L. según monto (en UTN$) y zona
Monto Zona Baja Mar Médanos Le Chetee Total
¿Cuántas operaciones de
20000 a menos de 25000 20,00 6,67 0,00 26,67 realizaron en Baja Mar por
25000 a menos de 30000 16,67 23,33 0,00 40,00 cada operación en Le
30000 a menos de 35000 3,33 13,33 3,33 20,00 Chetee?
35000 a menos de 40000 0,00 3,33 6,67 10,00
40000 a menos de 45000 0,00 0,00 3,33 3,33 Ratio de Probabilidades
Total 40,00 46,67 13,33 100,00
¿Cuál es la probabilidad de que …
… una operación tenga un monto de entre 30000 a menos de 35000 UTN$?
… una operación se haya realizado en Médanos?
… una operación se haya realizado en Médanos y tenga un monto de entre 30000 a menos de 35000 UTN$?
… una operación se haya realizado en Médanos y en Le Chetee?
… dentro de las operaciones que se realizaron en Médanos, el monto sea de entre 30000 a menos de 35000 UTN$?
… dentro de las operaciones de entre 30000 a menos de 35000 UTN, hayan sido realizadas en Médanos?
… una operación cumpla al menos una de las siguientes condiciones: haber sido realizada en Médanos o tener un monto de
entre 30000 a menos de 35000 UTN$?
… una operación cumpla al menos una de las siguientes condiciones: haber sido realizada en Médanos o haber sido realizada en
Le Chetee?
Independencia: Ejemplo
A continuación se presenta la distribución de frecuencias absolutas de las operaciones Fantabuloso S.R.L.
Operaciones de Fantabuloso S.R.L. según monto (en UTN$) y zona
Monto Zona Baja Mar Médanos Le Chetee Total
20000 a menos de 25000 6 2 0 8
25000 a menos de 30000 5 7 0 12
30000 a menos de 35000 1 4 1 6
35000 a menos de 40000 0 1 2 3
40000 a menos de 45000 0 0 1 1
Total 12 14 4 30

¿Se puede decir que la zona y el monto son independientes?

Monto Zona Baja Mar Médanos Le Chetee Total


20000 a menos de 25000 50,00 14,29 0,00 26,67
25000 a menos de 30000 41,67 50,00 0,00 40,00
30000 a menos de 35000 8,33 28,57 25,00 20,00
35000 a menos de 40000 0,00 7,14 50,00 10,00
40000 a menos de 45000 0,00 0,00 25,00 3,33
Total 100,00 100,00 100,00 100,00
Eventos Independientes

A y B son independientes si:


𝑃 𝐴|𝐵 = 𝑃 𝐴 ó 𝑃 𝐵 𝐴 = 𝑃(𝐵)

La probabilidad de que ocurra A no se ve modificada por el hecho de que ocurra o no B

𝑃(𝐴 ∩ 𝐵) 𝑃(𝐴 ∩ 𝐵)
𝑃 𝐴|𝐵 = 𝑃 𝐵|𝐴 =
𝑃(𝑩) 𝑃(𝑨)

𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴|𝐵 𝑃 𝐵 = 𝑃 𝐵 𝐴 𝑃(𝐴)
Bajo independencia: 𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 𝑃 𝐵
Ejemplo 2
Un comercio con dos puntos de ventas (Centro y Norte) y vende dos líneas de producto
(Estándar y Lujo). En la tabla de abajo se muestra un resumen de las cantidades vendidas.
¿Existe independencia entre el punto de venta y la línea?
Punto de Venta
Centro Norte Total
Estándar 500 25 525
Línea Lujo 140 7 147
Total 640 32 672
Ejemplo 2
Un comercio con dos puntos de ventas (Centro y Norte) y vende dos líneas de producto
(Estándar y Lujo). En la tabla de abajo se muestra un resumen de las cantidades vendidas.
¿Existe independencia entre el punto de venta y la línea?
Punto de Venta
Centro Norte Total
Estándar 500 25 525
Línea Lujo 140 7 147
Total 640 32 672

Punto de Venta
Centro Norte Total Las distribuciones
Estándar 78% 78% 78% 𝑃 𝐸|𝐶 = 𝑃 𝐸|𝑁 = 𝑃(𝐸) condicionales
coinciden… no cambian
Línea Lujo 22% 22% 22% 𝑃 𝐿|𝐶 = 𝑃 𝐿|𝑁 = 𝑃(𝐿) con el punto de venta…
Total 100% 100% 100% independencia
Ley del producto o regla multiplicativa

𝑃(𝐴 ∩ 𝐵) 𝑃(𝐴 ∩ 𝐵)
𝑃 𝐴|𝑩 = 𝑃 𝐵|𝑨 =
𝑃(𝑩) 𝑃(𝑨)

𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴|𝐵 𝑃 𝐵 = 𝑃 𝐵 𝐴 𝑃(𝐴)

Bajo independencia: 𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 𝑃 𝐵

𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐵 𝑃 𝐴|𝐵 = 𝑃(𝐴)𝑃 𝐵 𝐴

La probabilidad de que ocurra A y B es:


Paso 1: la probabilidad de que ocurra B
Paso 2: dado que ocurrió B, reduzco el espacio anterior a los que contienen A
Ejemplo
A continuación se presenta la distribución de frecuencias relativas del monto de las operaciones de Fantabuloso
S.R.L. para cada zona
¿Cuál es la probabilidad de que una operación se haya
Zona %
realizado en Médanos y tenga un monto de entre 30000
Baja Mar 40,00
a menos de 35000 UTN?
Médanos 46,67
Le Chetee 13,33 Paso 1: Qué % se realizó en Médanos? (46,67%)
Total 100,00
Paso 2: Dentro de Médanos, qué % es de ese monto
Monto Zona Baja Mar Médanos Le Chetee Total (66,67%)
20000 a menos de 25000 50,00 14,29 0,00 26,67
25000 a menos de 30000 41,67 50,00 0,00 40,00 Entonces: P(M y 30-35) = P(M) x P(30-35 | M)
30000 a menos de 35000 8,33 28,57 25,00 20,00 = 0,4667 x 0,2857 = 0,1333
35000 a menos de 40000 0,00 7,14 50,00 10,00
40000 a menos de 45000 0,00 0,00 25,00 3,33
Total 100,00 100,00 100,00 100,00
Monto Zona Baja Mar Médanos Le Chetee Total
20000 a menos de 25000 20,00 6,67 0,00 26,67
25000 a menos de 30000 16,67 23,33 0,00 40,00
30000 a menos de 35000 3,33 13,33 3,33 20,00
35000 a menos de 40000 0,00 3,33 6,67 10,00
40000 a menos de 45000 0,00 0,00 3,33 3,33
Total 40,00 46,67 13,33 100,00
Ejemplo – Diagrama de Árbol

20-25 P(20-25∩B)=0.20 = P(20-25|B) P(B)

25-30 P(20-30∩B)=0.17
P(30-35|B)=0.08 P(30-35∩B)=0.03
B 30-35
P(B)=0.40 P(35-40∩B)=0.00
35-40
40-45 P(40-45∩B)=0.00
20-25 P(20-25∩M)=0.07
25-30 P(20-30∩M)=0.23
P(M)=0.47 P(30-35|M)=0.29
Zona M 30-35 P(30-35∩M)=0.13

35-40 P(35-40∩M)=0.03
40-45 P(40-45∩M)=0.00
20-25 P(20-25∩C)=0.00
25-30 P(20-30∩C)=0.00
P(C)=0.13 P(30-35|C)=0.25
C 30-35 P(30-35∩C)=0.03

35-40 P(35-40∩C)=0.07
40-45 P(40-45∩C)=0.03

P(S)=1.00 (no coincide por redondeo)


Teorema o Regla de Bayes
Partición del espacio muestral S:
B1, B2, …, Bn es una partición del espacio muestral S si
- P(Bi ∩ Bj)=0 para todo i ≠ j
- P(B1 ∪ B2 ∪ … ∪ Bn) = P(B1) + P(B2) + … + P(Bn) = P(S) = 1

P(A) = P(B1 ∩ A) + P(B2 ∩ A) + … P(Bn ∩ A)

𝑛 𝑛

𝑃 𝐴 = ෍ 𝑃 𝐵𝑖 ∩ 𝐴 = ෍ 𝑃(𝐵𝑖 )𝑃 𝐴|𝐵𝑖
𝑖=1 𝑖=1

Y si no tengo esos datos? 𝑃 𝐵𝑟 ∩ 𝐴 𝑃(𝐵𝑟 )𝑃 𝐴|𝐵𝑟 𝑃(𝐵𝑟 )𝑃 𝐴|𝐵𝑟


𝑃 𝐵𝑟 |𝐴 = = 𝑛 = 𝑛
𝑃 𝐴 σ𝑖=1 𝑃 𝐵𝑖 ∩ 𝐴 σ𝑖=1 𝑃(𝐵𝑖 )𝑃 𝐴|𝐵𝑖

𝑃(𝐵𝑟 )𝑃 𝐴|𝐵𝑟
Teorema de Bayes: 𝑃 𝐵𝑟 |𝐴 = 𝑛
σ𝑖=1 𝑃(𝐵𝑖 )𝑃 𝐴|𝐵𝑖
Teorema o Regla de Bayes - Ejemplo
Una reconocida pastelería compra levadura de tres proveedores distintos de acuerdo a la
proporción de la tabla que se menciona abajo.
Además, se sabe que la calidad de la levadura depende de cada proveedor .
A partir de su amplia experiencia, el panadero conoce las probabilidades de que la masa no
leve para cada tipo de levadura.
a) El encargado de almacenar la levadura lo hizo de una forma
desordenada y sin etiquetar. ¿Cuál es la probabilidad de utilizar Alto
Proporción Probabilidad Levado?
Proveedor de compra de Fallo b) ¿El pan elaborado con la levadura de qué proveedor tiene mayor
Alto Levado 0.50 0.05 probabilidad de salir mal?
Mega Lev 0.40 0.15 c) ¿Cuál es la probabilidad de fallo en la panadería? (¿con qué
Bac Saccharo 0.10 0.20 concepto del tema anterior se relaciona el cálculo?)
d) ¿Cuál es la probabilidad de que el pan salga bien?
Total 1.00 ???
e) ¿Qué tan probable que un pan no leve y que la levadura utilizada
sea de Alto Levado?
f) ¿Qué tan probable que un pan no leve dado que la levadura
utilizada sea de Alto Levado?
g) ¿Dado que un pan no levó, qué tan probable es que se haya
utilizado Alto Levado?
h) ¿Dado que un pan no levó, de qué proveedor cree que provenga
(con mayor probabilidad) la levadura utilizada?
VARIABLE ALEATORIA

- Función que asocia un número real con cada elemento del espacio muestral.
- Descripción numérica de los resultados de un experimento.

Ejemplos:
- S={Llueve ; No llueve} → X = 1 si llueve ó X = 0 si no llueve
- Lanzo la pelota hasta que acierto al aro:
S={A, FA, FFA, FFFA, FFFFA, …} → X: cantidad de lanzamientos
- X: Número que salió al lanzar un dado
- X: Altura de una persona
- X: resultado de una inversión
VARIABLE ALEATORIA
Espacio muestral discreto: contiene un número finito de posibilidades, o una serie
interminable con tantos elementos como números enteros existen.
- Variable aleatoria discreta: se puede contar su conjunto de resultados posibles
Espacio muestral continuo: contiene un número infinito de posibilidades, igual al número
de puntos en un segmento de recta, se le denomina espacio muestral continuo.
- Variable aleatoria continua: puede tomar valores en una escala continua

DISTRIBUCIÓN DE PROBABILIDAD: describe cómo se distribuyen las probabilidades entre


los valores de una variable aleatoria
Ejemplo
En la siguiente tabla se muestran los resultados posibles de un proyecto de inversión. También se muestran las
probabilidades de cada uno en caso de realizarse en la zona A o en la zona B (distribuciones de
probabilidades).

Resultados Posibles Probabilidad en Zona A Probabilidad en Zona B


-1000 0.10 0.05
0 0.20 0.17
10000 0.40 0.57
20000 0.30 0.22

Para el caso de espacios muestrales discretos, la Esperanza Matemática y la Varianza se calculan de la


siguiente forma (𝑥 es cada resultado posible):

𝜇 = 𝐸 𝑋 = ෍ 𝑥 × 𝑃(𝑋 = 𝑥) 𝜎 2 = 𝑉 𝑋 = ෍(𝑥 − 𝜇)2 × 𝑃(𝑋 = 𝑥)


𝑥 𝑥

Calcule el valor esperado del proyecto en cada zona e indique en cuál los resultados presentan mayor
variabilidad
APLICACIONES DEL TEMA:

Análisis de decisiones

Anderson, Sweeney , Williams, Camm , Cochran , Fry & Ohlmann (2019).


Fundamentos de métodos cuantitativos para negocios.
Ejemplo – Distribución acumulada
Probabilidad en Zona A Probabilidad Acumulativa
Resultados Posibles P(X=x) Zona A P(X≤x) Hay un 30% de probabilidad de
que el proyecto genere un
-1000 0.10 0.10
resultado menor o igual a 0 …
0 0.20 0.30
Y un 70% (100-30) de que sea
10000 0.40 0.70
mayor a 0
20000 0.30 1.00

Distribución de probabilidades Distribución de probabilidades acumulativa


1,0 1,0

0,9 0,9

0,8 0,8

0,7 0,7

0,6 0,6

0,5 0,5

0,4 0,4

0,3 0,3

0,2 0,2

0,1 0,1

0,0 0,0
-5000 0 5000 10000 15000 20000 25000 -5000 0 5000 10000 15000 20000 25000
Teorema de Chebyshev
Sin conocer la distribución de probabilidades, me permite saber al menos qué porcentaje de las observaciones se encuentra entre dos
valores

1 Al menos 88.89% de las


𝑃 𝜇 − 𝑘𝜎 < 𝑋 < 𝜇 + 𝑘𝜎 ≥ 1 − 2 observaciones
𝑘
Al menos 75% de las
La probabilidad de que cualquier variable observaciones
aleatoria X tome un valor dentro de k
desviaciones estándar de la media es de al
menos 1 – 1/k2

Por lo menos (1 – 1/k2) de los valores de


datos debe estar dentro de k desviaciones
estándar de la media, donde k es cualquier
valor mayor que 1
Ej:
En el ejemplo de los montos, μ=28444.8 y σ=5396.4.
Si k = 2 → 1 – 1/22 = 0.75.
Al meno el 75% de las observaciones están contenidas
entre 28444.8 ± 2 x 5396.4… entre 17652 y 39238
REPASO MATEMÁTICAS: FUNCIONES
Función: regla que asigna a cada elemento de un primer conjunto (ej: X) un único elemento de un segundo
conjunto (ej: Y).
Esta regla puede denotarse como Y = f(X)

En general, las funciones tienen una forma y dependen de parámetros.


Ej: Una función de forma lineal Y = a x X + b depende de los parámetros a y b

Conociendo la forma y los valores de los parámetros permite saber qué


valor de Y le corresponde a cada valor de X. Ej si a= 0.5 y b=2, a X= 10 le
corresponde Y = 7.

Hay funciones más complicadas que la


lineal, como la siguiente, que depende
de los parámetros μ y σ:

1 1 𝑥−𝜇 2
−2 𝜎
𝑓 𝑥 = 𝑒
𝜎 2𝜋
REPASO MATEMÁTICAS: FUNCIONES
Función: regla que asigna a cada elemento de un primer conjunto (ej: X) un único elemento de un segundo
conjunto (ej: X).
Esta regla puede denotarse como Y = f(X)

En general, las funciones tienen una forma y dependen de parámetros.


Ej: Una función de forma lineal Y = a x X + b depende de los parámetros a y b

Función inversa de f(X): f-1(Y)


Si f(X) dice qué valor de Y corresponde a cada X, f-1(Y) dice qué valor de X corresponde a cada Y
Ej: f(Y) = X = (Y – b) / a
Ojo que no todas las funciones tienen inversa
DISTRIBUCIONES DE PROBABILIDAD “TEÓRICAS”
La distribución de probabilidad de una variable aleatoria es una función que asigna a cada suceso definido
sobre la variable, la probabilidad de que dicho suceso ocurra.
- ej: para variables aleatorias discretas P(X=x) = f(x)
En la práctica, conociendo la distribución de probabilidad de una variable, se puede conocer la probabilidad
de ocurrencia de cualquier valor de la variable (o de intervalo de valores).

En algunos casos, a partir de la teoría es fácil construir distribuciones de probabilidad.


Ej: todos los valores de un dado tienen la misma probabilidad de ocurrir: P(X=x) = 1/6 Distribución
uniforme
Entonces, P(X=5) = 1/6, P(4 ≤ X ≤ 5) = 2/6, P(X ≤ 5) = 5/6
discreta

En el estudio de teoría de probabilidades se desarrollaron múltiples funciones de distribución que pueden


expresarse de forma explícita y aplicables en diversos ámbitos.
Ej: Distribución Normal con media μ y desvío σ
En Argentina, la altura en
1 1 𝑥−𝜇 2
−2 𝜎 centímetros de los hombres tiene
𝑓 𝑥 = 𝑒
𝜎 2𝜋 distribución N(μ=174; σ=7)

El 68.2% mide entre 167 y 181 cm


El 2.2% mide más de 188 cm
DISTRIBUCIONES DE PROBABILIDAD “TEÓRICAS”

Aplicaciones

- Si se conoce la distribución de probabilidad: identificar probabilidades de diferentes valores


- Si se conoce la forma funcional pero no sus parámetros, se puede estimarlos a partir de datos (ej, en
el caso de la distribución normal, estimar μ y σ
- … con ello luego se pueden realizar predicciones
- Estimaciones por intervalos
- Test de hipótesis
DISTRIBUCIONES DE PROBABILIDAD
La función 𝑓(𝑥) es una función de densidad de probabilidad (fdp) una función de masa de probabilidad o
una distribución de probabilidad de la variable aleatoria X si para todo resultado 𝑥 posible:

Para X Discretas Para X continuas

1. 𝑓 𝑥 ≥ 0 1. 𝑓 𝑥 ≥ 0
Área total bajo
∞ función de
2. σ𝑥 𝑓 𝑥 = 1 2. ‫׬‬−∞ 𝑓 𝑥 𝑑𝑥 = 1
densidad = 1
𝑏
3. 𝑃 𝑋 = 𝑥 = 𝑓(𝑥) 3. 𝑃 𝑎 < 𝑋 < 𝑏 = ‫𝑥𝑑 𝑥 𝑓 𝑎׬‬

En las funciones de distribución conocidas (como la Normal), cualquier software estadístico (incluso Excel) puede
calcular el valor de f(x) para cualquier valor de x que le pidamos, dados los valores de los parámetros.

Ej Excel para alturas: Si las alturas de los hombres se distribuyen como Normal con media 174 cm y desvío de 7 cm, cuál
es el valor de la densidad f(x) para 167 cm? 2
1 −
1 𝑥−𝜇
=DISTR.NORM.N(167;174;7;FALSO) = 0.0346 𝑓 𝑥 = 𝑒 2 𝜎
𝜎 2𝜋
→ f(167) = 0.0346 si 𝑋~𝑁(174; 7) PROBLEMA CON CONTINUAS: f(167) no es la
probabilidad de que la altura sea 167!!
DISTRIBUCIONES DE PROBABILIDAD
La función 𝑓(𝑥) es una función de densidad de probabilidad (fdp) una función de masa de probabilidad o
una distribución de probabilidad de la variable aleatoria X si para todo resultado 𝑥 posible:

Para X Discretas Para X continuas


𝑃 𝑎≤𝑋≤𝑏
1. 𝑓 𝑥 ≥ 0 1. 𝑓 𝑥 ≥ 0

2. σ𝑥 𝑓 𝑥 = 1 2. ‫׬‬−∞ 𝑓 𝑥 𝑑𝑥 = 1
𝑏 𝑎 𝑏
3. 𝑃 𝑋 = 𝑥 = 𝑓(𝑥) 3. 𝑃 𝑎 < 𝑋 < 𝑏 = ‫𝑥𝑑 𝑥 𝑓 𝑎׬‬
No es válido para continuas!! Si X continua, P(X = x) = 0 𝑃 𝑎<𝑋<𝑏 =𝑃 𝑎≤𝑋≤𝑏
Esto está formalmente mal, pero ayuda…Pensar
como que P(X = x) = f(x)dx, donde dx es la
Entonces en continuas no es de amplitud de un intervalo (en discreta, sería = 1)
interés la probabilidad en un punto,
sino en un intervalo
Un intervalo muy frecuente es 𝑃 𝑋 ≤ 𝑥 , es decir, la probabilidad de que X sea menor que un cierto valor. La relación entre 𝑥 y
𝑃 𝑋 ≤ 𝑥 se conoce como función de distribución acumulativa, y se simboliza como 𝐹 𝑥 .
DISTRIBUCIONES DE PROBABILIDAD ACUMULATIVAS
𝑓(𝑥): función de densidad de probabilidad (fdp), función de masa de probabilidad o una distribución de
probabilidad.
Para variables discretas, representa 𝑃 𝑋 = 𝑥 ; pero para continuas 𝑃 𝑋 = 𝑥
… entonces en continuas se calculan intervalos, como 𝑃 𝑋 ≤ 𝑥 ó 𝑃 𝑎 < 𝑋 < 𝑏 .
𝐹 𝑥 = 𝑃 𝑋 ≤ 𝑥 se denomina función de distribución acumulativa

Al igual que con 𝑓 𝑥 , los softwares proveen los valores de 𝐹 𝑥 para distribuciones de probabilidad conocidas

Ej Excel para alturas: Si las alturas de los hombres se distribuyen como normal con media 174 cm y desvío de 7 cm,
cuál es porcentaje de hombres tienen una altura menor o igual a 167 cm? Y menor a 167 cm?
=DISTR.NORM.N(167;174;7;VERDADERO) = 0.1587 → 15.87%
Y qué porcentaje tiene una altura menor a 177 cm?
=DISTR.NORM.N(177;174;7;VERDADERO) = 0.6659
Y qué porcentaje entre 167 y 177?
𝑷 𝒂 < 𝑿 ≤ 𝒃 = 𝑭 𝒃 − 𝑭(𝒂) 0.6659 - 0.1587 = 0.5072
El 5% más bajo mide como máximo ….? 𝐹 −1 (0.05) →Inversa de función de distribución acumulativa
=INV.NORM(0.05;174;7) = 162.49 → P(X ≤ 162.49) = 0.05 Con gráficos…
1 1 𝑥−𝜇 2
−2 𝜎
𝑓 𝑥 = 𝑒
𝜎 2𝜋
f(x) 0,06

𝜇 = 174 ; 𝜎 = 7
0,05

0,04
DISTR( ,FALSO) en Excel f(167)=0,0346 ←Función de distribución
0,03
(de densidad)
0,02

0,01
P(X<167) = F(167) = 0,1587
0
145 155 165 175 185 195 205

1,2
X=167 x
F(x)
1

0,8

DISTR( ,VERDADERO) 0,6 ←Función de distribución


en Excel 0,4
acumulativa
0,2
F(167) = 0,1587
0
145 155 165 175 185 195 205
-0,2 x
F-1(0,1587) = 167
INV en Excel
VALOR ESPERADO Y VARIANZA

Esperanza matemática: pensarlo como el promedio de todos los valores de X posibles ponderados por su
probabilidad de ocurrencia

𝐸 𝑋 = 𝜇 = ෍𝑥𝑓(𝑥) si X es discreta 𝐸 𝑋 = 𝜇 = න 𝑥𝑓 𝑥 𝑑𝑥 si X es continua
𝑥 −∞

Varianza: pensarlo como el promedio de los desvíos cuadráticos con respecto a la media de todos los valores de
X posibles ponderados por su probabilidad de ocurrencia

𝑉 𝑋 = 𝜎 2 = ෍ 𝑥 − 𝜇 2 𝑓(𝑥 ) si X es discreta 𝑉 𝑋 = 𝜎 2 = න 𝑥 − 𝜇 2 𝑓 𝑥 𝑑𝑥 si X es continua


𝑥 −∞

𝑉 𝑋 = 𝜎 2 = 𝐸(𝑋 − 𝜇) 2 = 𝐸 𝑋 2 − 𝜇2
VALOR ESPERADO Y VARIANZA
Distribución Normal: La esperanza y desvío estándar son los parámetros de la función:
1 1 𝑥−𝝁 2

𝑓 𝑥 = 𝑒 2 𝝈
𝝈 2𝜋

… Pero no en todas las distribuciones teóricas esto se cumple. Por ejemplo:


Distribución Uniforme continua Distribución de Fisher-Snedecor

1
𝑓 𝑥 = 𝑠𝑖 𝑥 ∈ [𝑎; 𝑏] si 𝑥 > 0
𝑏−𝑎

… Pero en la gran mayoría de las distribuciones


teóricas se conoce la forma de la media y varianza

𝑎+𝑏 (𝑏 − 𝑎)2 𝑛 2𝑛2 (𝑚 + 𝑛 + 2)


𝐸 𝑋 = 𝑉 𝑋 = 𝐸 𝑋 = 𝑉 𝑋 =
2 12 𝑛−2 𝑚 𝑛 − 2 2 (𝑛 − 4)
DISTRIBUCIONES DE PROBABILIDAD TEÓRICAS CONOCIDAS

Distribución uniforme: Todos los valores de X contenidos entre dos números a y b tienen la misma
probabilidad de ocurrencia. Ej: al lanzar un dado, todos los números entre 1 y 6 tienen la misma probabilidad
de ocurrencia (1/6), el resto tiene probabilidad 0.
- Existe una distribución uniforme discreta y otra continua
1 1
𝑓 𝑥 = 𝑠𝑖 𝑥 ∈ [𝑎; 𝑏] 𝑓 𝑥 = 𝑠𝑖 𝑥 ∈ [𝑎; 𝑏]
𝑛 𝑏−𝑎

𝑎+𝑏
𝐸 𝑋 =
2

(𝑏 − 𝑎)2 (𝑏 − 𝑎 + 1)2 −1
𝑉 𝑋 = 𝑉 𝑋 =
12 12
DISTRIBUCIONES DE PROBABILIDAD TEÓRICAS CONOCIDAS

Distribución Normal o Gaussiana: es la distribución de probabilidad continua más importante en todo el


campo de la estadística es la distribución normal. Describe de manera aproximada muchos fenómenos
que ocurren en la naturaleza, la industria y la investigación.

1 1 𝑥−𝜇 2

𝑋~𝑁(𝜇; 𝜎) si 𝑓 𝑥 = 𝑒 2 𝜎 para −∞ < 𝑥 < ∞
𝜎 2𝜋
Simétrica y acampanada (Hay otras distribuciones que son simétricas y acampanadas además de la normal, como
la t de Student)
𝐸 𝑋 =𝜇

𝑉 𝑋 = 𝜎2
DISTRIBUCIONES DE PROBABILIDAD TEÓRICAS CONOCIDAS

Distribución Normal o Gaussiana: es la distribución de probabilidad continua más importante en todo el


campo de la estadística es la distribución normal. Describe de manera aproximada muchos fenómenos
que ocurren en la naturaleza, la industria y la investigación.
1 1 𝑥−𝜇 2

𝑋~𝑁(𝜇; 𝜎) si 𝑓 𝑥 = 𝑒 2 𝜎 Para −∞ < 𝑥 < ∞
𝜎 2𝜋
𝑋−𝜇 1 1
−2 𝑧 2
Si 𝑋~𝑁(𝜇; 𝜎) y aplico una estandarización: 𝑍 = ⇒ 𝑍~𝑁(𝜇 = 0; 𝜎 = 1) 𝑓 𝑧 = 𝑒
𝜎 2𝜋
Esa distribución de Z se conoce como Distribución Normal Estándar

z: -1.645 1.645 -1.960 1.960 -2.576 2.576

Si sé que altura de los hombres argentinos es normal con media 174 y desvío 7cm: -1,645= (x-174)/7 → el 5% de los hombres
argentinos mide 162.49 o menos
DISTRIBUCIONES DE PROBABILIDAD TEÓRICAS CONOCIDAS

Distribución triangular:

𝑎+𝑏+𝑐
𝐸 𝑋 =
3

𝑐−𝑎
𝑃𝑎𝑟𝑎 0 ≤ 𝑝 < 𝑥 = 𝑎 + 𝑝(𝑏 − 𝑎)(𝑐 − 𝑎)
𝑏−𝑎
𝐹 −1 (𝑝)
𝑐−𝑎
𝑃𝑎𝑟𝑎 ≤𝑝<1 𝑥=𝑏− 1 − 𝑝)(𝑏 − 𝑎)(𝑏 − 𝑐
𝑏−𝑎
DISTRIBUCIONES DE PROBABILIDAD TEÓRICAS CONOCIDAS
En ciertos contextos, muchas de estas distribuciones se aproximan a la normal
Distribución binomial: Si repito sucesivamente 𝑛 veces un experimento que tiene dos resultados posibles (ej,
1: éxito y 0: fracaso), 𝑓 𝑎 es la probabilidad de 𝑎 éxitos.

Distribución hipergeométrica: Probabilidad de 𝑘 éxitos en una muestra de tamaño 𝑛 tomada de una


población de tamaño 𝑁

Distribución de Poisson: Probabilidad de que un numero de resultados ocurran en un intervalo específico de


tiempo (ej: probabilidad de encestar la pelota 5 veces en el aro si lanzo continuamente durante 7 minutos).

Distribución exponencial: Probabilidad de la duración de un intervalo entre eventos.

Distribución Chi cuadrado (χ²): Distribución de suma de variables normales independientes e idénticamente
distribuidas. Se usa para construir la distribución de la varianza muestral.

Distribución F de Fisher-Snedecor: Distribución del cociente de dos variables χ²

Distribución t de Student: Distribución del cociente entre una variable Normal y una χ²

Distribución log normal: Distribución de una variable cuyo logaritmo natural es normal

También podría gustarte