Guia Elementos 2do C2023
Guia Elementos 2do C2023
Guia Elementos 2do C2023
ESTADÍSTICA
GUÍA DE
TRABAJOS PRÁCTICOS
Bioestadística
-2023-
Cronograma 2023 – 2do. Cuatrimestre
Semana Fecha Contenido Temático Modalidad
Experimentos aleatorios. Teorías de probabilidad. Regla
1 14/08/2023 de la suma. Probabilidad Condicional. Probabilidades Presencial
conjuntas. Especificidad y Sensibilidad. Ejercitación.
2 21/08/2023 Variable aleatoria discreta y continua. Presencial
Distribución Binomial, Normal, Normal estándar, Chi
3 28/08/2023 Presencial
cuadrado y t de Student.
Estadística descriptiva: Gráficos. Medidas de posición y
4 04/09/2023 Mixta
dispersión. Box Plot. Ejercitación.
Distribución de la media, la varianza y la proporción.
5 11/09/2023 Presencial
Teorema Central del Límite.
6 18/09/2023 Integración. Presencial
1er. Parcial: Jueves 28/09 Comisión 1 y 2 9hs Comisión
7 25/09/2023 Presencial
3 y 4 18hs
Estimadores. Estimación puntual y por intervalos de
8 02/10/2023 Presencial
confianza para la media de una población. Ejercitación.
Estimación puntual y por intervalos de confianza para:
9 09/10/2023 Presencial
varianza y proporción, de una población. Ejercitación.
Pruebas de hipótesis: Marco teórico. Caso de la media
10 16/10/2023 de una variable aleatoria y Test de normalidad. Presencial
Ejercitación.
Prueba de hipótesis para la proporción y varianza. Test
11 23/10/2023 Presencial
de Wilcoxon. Ejercitación.
12 30/10/2023 Integración. Presencial
2do. Parcial: Jueves 9/11 Comisión 1 y 2 9hs Comisión
13 06/11/2023 Presencial
3 y 4 18hs
14 13/11/2023 ... Presencial
15 20/11/2023 Recuperatorio: Jueves 23/11 18hs Presencial
Guía de Trabajos Prácticos
2023 · Bioestadística
PROBABILIDAD
OBJETIVO ESPECIFICO
Comprender, analizar y aplicar a la resolución de problemas los conceptos de probabilidad, experi-
mento.
CONTENIDOS TEMATICOS
Probabilidad: Nociones de probabilidad basadas en la teoría clásica, del límite de frecuencia relativa, y la
definición axiomática. Características de cada una de las teorías. Experimento y suceso aleatorio. Reglas de
la suma y del producto, y sus aplicaciones. Probabilidad condicional. Aplicaciones.
GLOSARIO
Experimento aleatorio. Espacio muestral. Punto muestral. Sucesos. Casos especiales: sucesos imposibles,
ciertos o seguros, mutuamente excluyentes o incompatibles, complementarios. Definición clásica de
probabilidad, la probabilidad como límite de la frecuencia relativa, teoría axiomática de probabilidad.
Propiedades derivadas de la definición axiomática. Teoremas de la suma y del producto de probabilidades.
Probabilidad condicional. Probabilidad conjunta. Independencia de sucesos.
PROBLEMAS RESUELTOS
EJERCICIO 1) Se tiene una urna que contiene tres bolillas verdes y dos rojas numeradas del 1 al 5.
1.1) Hallar el espacio muestral correspondiente a los siguientes experimentos aleatorios, asignando la
probabilidad correspondiente a cada uno de sus elementos, si el experimento consiste en elegir una bolilla al
azar y
a) se observa y registra el color;
b) se observa y registra el número.
1.2) Hallar el espacio muestral correspondiente a los siguientes experimentos aleatorios, asignando la
probabilidad correspondiente a cada uno de sus elementos si
1.2.1) El experimento consiste en elegir dos bolillas al azar, una y luego la otra con reposición y
a) se observa y registra el color de cada una;
b) se observa y registra el número de cada una
1.2.2) El experimento consiste en elegir dos bolillas al azar, una y luego la otra, sin reposición
a) se observa y registra el color de cada una;
b) se observa y registra el número de cada una
1.3) Indicar las probabilidades (si ya están calculadas) o calcularlas, de los siguientes sucesos de los
diferentes espacios muestrales definidos:
a) la bolilla extraída es verde, considerando que el espacio muestral corresponde a 1.1.a)
b) la bolilla es la número 1, considerando que el espacio muestral corresponde a 1.1.b)
c) la bolilla tiene un número par, considerando que el espacio muestral corresponde a 1.1.b)
d) las dos bolillas son verdes, considerando que los espacios muestrales corresponden a
1.2.1.a) y a 1.2.2.a)
e) la primera bolilla es verde y la segunda es roja, considerando que los espacios muestrales
corresponden a 1.2.1.a) y a 1.2.2.a)
f) al menos una bolilla es verde, considerando que los espacios muestrales corresponden a
1.2.1.A) y a 1.2.2.A)
g) una bolilla es la número 1 y la otra es la número 5, considerando que los espacios muestrales
corresponden a 1.2.1.b) y a 1.2.2.b)
h) las dos bolillas tienen números mayores o iguales que 2, considerando que los espacios
muestrales corresponden a 1.2.1.b) y a 1.2.2.b)
1
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística
SOLUCIÓN
1.1) Hallar el espacio muestral correspondiente a los siguientes experimentos aleatorios, asignando la
probabilidad correspondiente a cada uno de sus elementos si el experimento consiste en elegir una bolilla al
azar y
a) se observa y registra el color
Si interesa el color, sólo se distinguen dos situaciones que llamaremos puntos muestrales y que
simbolizamos así:
V: “el color de la bolilla elegida es verde”
R: “el color de la bolilla elegida es rojo”
Por lo tanto el Espacio Muestral (S) será: S = { V , R }
3 2
Las probabilidades correspondientes a cada elemento de S son: p(V)= ;p(R)= . Por lo tanto, se observa
5 5
que S no es un espacio equiprobable o equiposible porque las probabilidades de cada punto muestral son
distintas.
b) se observa y registra el número.
Si interesa el número, se distinguen cinco situaciones o puntos muestrales que simbolizamos de la siguiente
manera:
1.2) Hallar el espacio muestral correspondiente a los siguientes experimentos aleatorios, asignando la
probabilidad correspondiente a cada uno de sus elementos si
1.2.1) el experimento consiste en elegir dos bolillas al azar, una y luego la otra con reposición y
a) se observa y registra el color de cada una;
Al extraerse 2 bolillas cada punto muestral estará formado por 2 ocurrencias (que podrán ser igual color o
diferente color) quedando determinado un espacio muestral con 4 puntos muestrales.
S = { VV , VR , RV , RR }
Al realizar extracciones con reposición siempre que se realiza una extracción tendremos 5 elementos
para realizar la selección.
3 3 9 3 2 6 2 3 6 2 2 4
p(VV)= . = ;p(VR)= . = ;p(RV)= . = ;p(RR)= . =
5 5 25 5 5 25 5 5 25 5 5 25
De lo cual se observa que la suma de las probabilidades de todos los puntos muestrales es 1, es
decir p(S) = 1
1.2.2) el experimento consiste en elegir dos bolillas al azar, una y luego la otra, sin reposición
a) Se observa y registra el color de cada una;
Al realizar extracciones sin reposición siempre que se realiza la primera extracción tendremos 5
elementos para elegir y, cuando realizamos la segunda extracción, sólo hay 4 elementos, pues el que fue
2
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística
seleccionado no se vuelve a colocar en la urna (no le damos la oportunidad de volver a salir). La cantidad
de casos favorables puede o no modificarse dependiendo de cuál es la bolilla que quedó afuera.
1.2.1) el experimento consiste en elegir dos bolillas al azar, una y luego la otra con reposición y
b) se observa y registra el número de cada una
El espacio muestral consta de 25 elementos (resultado de 5X5).
S = {(1,1); (1,2); (1,3); (1,4); (1,5); (2,1); (2,2); (2,3); (2,4); (2,5); (3,1); (3,2); (3,3); (3,4); (3,5);
(4,1); (4,2); (4,3); (4,4); (4,5); (5,1); ( 5,2); (5,3); (5,4); (5,5)}
1 1 1
p(1,1)=......=p(5,5)= . =
5 5 25
Todos los puntos muestrales tienen la misma probabilidad de ocurrir.
1.2.2) el experimento consiste en elegir dos bolillas al azar, una y luego la otra, sin reposición
a) se observa y registra el número de cada una
Al realizar extracciones sin reposición, cuando realizamos la segunda extracción sólo hay 4 elementos
y la cantidad de casos favorables puede o no modificarse dependiendo de cuál es la bolilla que quedó
afuera.
El espacio muestral sólo tiene 20 elementos (resultado de 5X4).
S = {(1,2); (1,3); (1,4); (1,5); (2,1); (2,3); (2,4); (2,5); (3,1); (3,2); (3,4); (3,5); (4,1); (4,2); (4,3);
(4,5); (5,1); (5,2); (5,3); (5,4)}
1 1 1
p(1,2)=......=p(5,4)= ∙ =
5 4 20
1.3) Indicar las probabilidades (si ya están calculadas) o calcularlas, de los siguientes sucesos de los
diferentes espacios muestrales definidos.
a) la bolilla extraída es verde, considerando que el espacio muestral corresponde a 1.1.a)
3
p(V)= se obtiene por lectura de lo calculado
5
b) la bolilla es la número 1, considerando que el espacio muestral corresponde a 1.1.b)
1
p(1)= se obtiene por lectura de lo calculado
5
c) la bolilla tiene un número par, considerando que el espacio muestral corresponde a 1.1.b)
Si definimos el suceso D: ”la bolilla extraída tiene un número par”, entonces D={2; 4} y su probabilidad,
debido a que son sucesos mutuamente excluyentes, se calcula como la suma de la probabilidad de obtener
un 2 y la probabilidad de obtener un 4.
1 1 2
p(D)=p(2)+p(4)= + =
5 5 5
o directamente por conteo de casos favorables sobre total de casos a partir del espacio muestral:
2
p(D)=
5
d) las dos bolillas son verdes, considerando que los espacios muestrales corresponden a 1.2.1.a) y a
1.2.2.a)
e) la primera bolilla es verde y la segunda es roja, considerando que los espacios muestrales
corresponden a 1.2.1.a) y a 1.2.2.a)
Utilizando el espacio muestral de 1.2.1.a) por lectura de lo calculado se obtiene
6
p(VR)=
25
y, utilizando el espacio muestral de 1.2.2.a), por lectura de lo calculado se obtiene
6
p(VR)=
20
f) al menos una bolilla es verde, considerando que los espacios muestrales corresponden a 1.2.1.a) y a
1.2.2.a)
Si definimos al suceso H: ”al menos una bolilla extraída es verde”, entonces H = { VR, RV, VV} y su
probabilidad, debido a que son sucesos mutuamente excluyentes, se calcula como la suma de las
probabilidades individuales, por lo que será en el espacio muestral de 1.2.1.a)
6 6 9 21
p(H)=p(VR)+p(RV)+p(VV)= + + =
25 25 25 25
o por sucesos complementarios:
4 21
̅ )=1-p(RR)=1-
p(H)= 1-p(H =
25 25
g) una bolilla es la número 1 y la otra es la número 5, considerando que los espacios muestrales
corresponden a 1.2.1.b) y a 1.2.2.b)
Si definimos al suceso como F, será F={(1,5); (5,1)} y se puede calcular como la suma de las
correspondientes probabilidades:
1 1 2
p(F)=p(1,5)+p(5,1)= + = calculado en el espacio muestral de 1.2.1.b) o, como ambas
25 25 25
probabilidades son iguales, se puede pensar en uno de los casos y multiplicar por los posibles cambios de
lugar de los elementos, en este caso 2
1 2
p(F)=2.p(1,5)=2∙ =
25 25
h) las dos bolillas tienen números mayores o iguales que 2, considerando que los espacios muestrales
corresponden a 1.2.1.b) y a 1.2.2.b)
4
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística
O, como todos los puntos muestrales son igualmente posibles, se puede pensar en uno de ellos y
multiplicar por la cantidad de casos como ese que forman G, es decir
1 16
p(G)=16∙p(2,2)=16∙ =
25 25
O, utilizando el concepto de sucesos complementarios
̄ ={(1,1);(1,2);(1,3);(1,4);(1,5);(2,1);(3,1);(4,1);(5,1)}
G
̄ )=p(1,1)+p(1,2)+...+p(5,1)= 1 1 9
por lo que p(G +...+ = ; y por lo tanto
25 25 25
9 16
̄ )=1-
p(G)=1-p(G =
25 25
G ={(2,3); (2;4); (2,5); (3,2); (3,4); (3,5); (4,2); (4,3); (4,5); (5,2); (5,3); (5,4)}
EJERCICIO 2) En una jaula conviven, en igual proporción, dos especies de jilguero, A y B. De la especie
A, el 22% de los ejemplares está parasitado por un protozoo intestinal, mientras que de la especie B, el 35%
de los ejemplares está parasitado por el mismo organismo. Un investigador necesita un jilguero para una
investigación, con lo cual entra a la jaula y captura uno al azar:
a) ¿Cuál es la probabilidad de que el jilguero capturado esté parasitado?
b) Si el jilguero capturado está parasitado, ¿cuál es la probabilidad de que pertenezca a la especie B?
SOLUCIÓN
Simbolizaremos a los sucesos
A = {el jilguero es de la especie A}
B= {el jilguero es de la especie B}
E= {el jilguero está parasitado}
Los datos son:
“.... conviven, en igual proporción, dos especies de jilguero”, lo tanto: p(A) = p(B) = ½
“De la especie A, el 22% de los ejemplares está parasitado por un protozoo intestinal”. Al saber que son de
la especie A se simboliza: p(E/A) = 0,22
“... mientras que de la especie B, el 35% de los ejemplares está parasitado por el mismo organismo”.
En forma similar, dado que se sabe que son de la especie B, se simboliza: p(E/B) = 0,35
Nota: si bien es conveniente que el símbolo seleccionado para cada suceso ayude a su interpretación (como el caso de A
y B) no se debe usar la letra P con más de una finalidad, por lo cual la reservamos para probabilidad, entonces para
“parasitado” utilizaremos el símbolo E (de enfermo).
a) Para la definición del suceso “sea parasitado”, debemos considerar a todos los parasitados, es decir, los
que están parasitados y son de la especie A y a los que están parasitados y son de la especie B, como aparece
en la fórmula: p(E)=p[(E∩A)∪(E∩B)]
5
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística
Como son dos sucesos mutuamente excluyentes (si un jilguero es parasitado de la especie A ese jilguero
no es parasitado de la especie B) la probabilidad de parasitado (p(E)) se calcula como la suma de las
probabilidades de los dos sucesos que intervienen en la unión.
p(E)=p[(E∩A)∪(E∩B)]=p(E∩A)+p(E∩B)
Cada uno de los términos es la probabilidad de una intersección de sucesos no independientes por lo tanto
se calcula
p(E)=p[(E∩A)∪(E∩B)]=p(E∩A)+p(E∩B)=p(A).p (E⁄A) +p(B).p (E⁄B)
1 1
p(E)= ∙ 0,22 + ∙ 0,35= 0,11 + 0,175 = 0,285
2 2
b) “Si el jilguero capturado está parasitado ... indica que “parasitado” es algo que ocurrió, por lo tanto, lo
solicitado se simboliza: p (B⁄E) y se resuelve:
p(E∩B) 0,175
p (B⁄E) = = = 0,614
p(E) 0,285
EJERCICIO 3) Dos campos con equinos en pastoreo clasificados según su pelaje presentan la siguiente
distribución:
Campo 1 Campo 2
Zaino 9 6
Bayo 11 6
Rosillo 5 13
15 3
3.1) a) p(Z)= = =0,30
50 10
Nota: Observar que dado que interviene una única vez el azar no se multiplica por dos.
c) Como puede darse que el animal sea Zaino y también del campo 1 los dos sucesos Z y C1 no son
mutuamente excluyentes lo que lleva a la siguiente expresión y correspondiente cálculo
15 25 9 31
p(Z∪C1)=p(Z)+p(C1)-p(Z∩C1)= + - = =0,62
50 50 50 50
d) Lo que se sabe (equivalente a decir que está dado) es que “...es del campo 1” y lo aleatorio es que “...sea
5 1
rosillo”, por lo tanto p (R⁄C1) = = =0,20 (por lectura directa de tabla), tomando en cuenta que la condición
25 5
restringe la cantidad de casos posibles. Por fórmula:
5
p(R∩C1) 50 5
p (R⁄C1) = = = =0,20
p(C1) 25 25
50
3.2) Dos equinos al azar
3.2.1) Con reposición
a) Como la característica Bayo es la misma para los dos animales seleccionados, no se ven diferencias
si se los permuta o cambia de lugar por lo tanto NO multiplicamos por dos.
17 17 289
p(BB)= ∙ = =0,1156
50 50 2500
b) Como indica el orden en que deben ocurrir los sucesos sólo hay una forma de calcularlo
17 15 255
p(BZ)= ∙ = =0,1020
50 50 2500
c) Al no indicar el orden en que deben ocurrir los sucesos, el planteo tiene dos formas de presentarse
17 15
p(BZ)+p(ZB)=2p(BZ)=2∙ ∙ =0,2040
50 50
d) Como no aclara orden puedo plantear un caso y multiplicar por las permutaciones, es decir, por la
cantidad de cambios de lugar diferentes que se pueden dar. En este caso debo multiplicar por 2 debido a que
sólo se pueden dar en dos órdenes: primero BC1 y luego ZC2, o primero ZC2 y luego BC1.
11 6
p(BC1∩ZC2)=2∙ ∙ =0,0528
50 50
7
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística
17 15 255
b) p(BZ)= ∙ = =0,10414
50 49 2450
17 15
c) p(BZ)+p(ZB)=2∙ ∙ =0,2082
50 49
11 6
d) p(BC1∩ZC2)=2∙ ∙ =0,0539
50 49
EJERCICIO 4) Queremos evaluar la calidad del análisis clínico en la detección de cáncer de mama.
Para ello se consideran los 2641 casos de consulta en un servicio de ginecología y patología mamaria de
Capital Federal. Los resultados registrados se han tabulado a continuación:
SOLUCIÓN
Para cada medida de calidad del análisis clínico se aplican las siguientes fórmulas:
Sensibilidad =
VP 635
p (+⁄E) = = =0,5664
VP+FN 1121
Especificidad =
VN 1252
p (-⁄̅ ) = = =0,8237
E FP+VN 1520
Valor Predictivo Positivo =
VP 635
p (E⁄+) = = =0,7032
VP+FP 903
Valor Predictivo Negativo =
̅ VN 1252
p (E⁄−) = = =0,7204
VN+FN 1738
Notación:
VN: cantidad de casos “verdadero negativo”
VP: cantidad de casos “verdadero positivo”
FN: cantidad de casos “falso negativo”
FR: cantidad de casos “falso positivo”
8
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística
EJERCICIO 5) Un test de diagnóstico tiene una probabilidad 0,9 de detectar la presencia de E. coli, en
caso de haberla (sensibilidad del test). Si no está presente, detecta su ausencia con una probabilidad de
0,8 (especificidad del test). La probabilidad de que una muestra de agua contenga E. coli es 0,20 (preva-
lencia).
SOLUCIÓN
Consideremos una tabla similar a la del ejemplo anterior:
Sabemos que la sensibilidad de la prueba es 0,9, lo que indica que: P(+/presente)= 0,9. Es decir que:
VP/0,2 = 0,9 luego VP= 0,2*0,9 = 0,18
Además, sabemos que la especificidad es 0,8, lo que nos indica que: P(-/ausente)=0,8, es decir que:
VN/0,8 = 0,8 luego VN= 0,8*0,8 = 0,64
b) Suponiendo que el test dio un resultado positivo, ¿cuál es la probabilidad de que realmente la muestra
de agua contenga E. coli? (Valor predictivo positivo del test)
VPP = P(presente/+) = 0,18/0,34 =0,5294
c) Por otro lado, si el test da un resultado negativo, ¿cuál es la probabilidad de que realmente el agua
esté libre de bacterias? (Valor predictivo negativo del test)
VPN = P(ausente/-) = 0,64/ 0,66= 0,97
d) Calcular el coeficiente Falso positivo = P(test positivo cuando la bacteria está ausente)
P(+/ausente) = 0,16/0,8 =0,2
e) Calcular el coeficiente Falso negativo = P(test negativo cuando la bacteria sí está presente)
P(-/presente) = 0,02/0,20= 0,10
9
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística
PROBLEMAS PROPUESTOS
EJERCICIO 1) Un grupo de 60 perros fue clasificado como indica el cuadro:
Cachorro Adulto
Negro 6 9
Marrón 12 23
Blanco 2 8
Calcular:
a) la probabilidad de seleccionar:
a.1) un perro negro del grupo de cachorros;
a.2) un cachorro negro.
Dar un ejemplo de dos eventos mutuamente excluyentes y de uno que no lo sea.
b) si se seleccionan dos perros, ¿cuál es la probabilidad de que:
b.1) uno sea un cachorro marrón y el otro un adulto negro?
b.2) el primero sea adulto blanco y el segundo un perro marrón?
EJERCICIO 3) Un test detecta un cierto tipo de bacteria T con una probabilidad 0,90 en caso de haberla.
Si no la hay, detecta la ausencia, con probabilidad 0,80. Sabiendo que la probabilidad de que una muestra de
agua contenga la bacteria de tipo T es 0,20, calcular la probabilidad de que:
a) realmente haya presencia de bacteria cuando el test haya dado positivo.
b) realmente haya presencia de bacteria cuando el test haya dado negativo.
c) haya bacteria y además el test dé positivo.
d) o haya bacteria o el test dé positivo.
EJERCICIO 4) La esferocitosis es un tipo particular de anemia que se encuentra en 1 cada 2000 pacientes
con anemia. Se conocen dos métodos de detección: CHCM (concentración de hemoglobina corpuscular
media) mayor o igual a 34,5 y ADE (amplitud de distribución eritrocitaria) mayor o igual a 14,5. El test basado
en la CHCM tiene una sensibilidad de 86% y una especificidad de 90%, mientras que en el test basado en la
ADE la sensibilidad es de 94% y la especificidad de 88%.
a) ¿Cuál es la probabilidad de que una persona con anemia cuyo CHCM es mayor o igual a 34,5 tenga
esferocitosis?
b) ¿Cuál es la probabilidad de que una persona con anemia cuyo ADE es mayor o igual a 14,5 no tenga
esferocitosis?
10
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística
EJERCICIO 5) Se sabe que uno de cada mil individuos contrae cierta enfermedad en una población de
estudio. Para detectar esta enfermedad se usa un test que da resultado positivo en el 99% de los casos de
personas enfermas, en tanto que da positivo sólo en el 2% de los casos de las personas sanas.
a) Si tomamos un individuo al azar, le realizamos el test y da positivo, ¿cuál es la probabilidad de que
haya contraído la enfermedad?
b) Si ha dado negativo el test, ¿cuál es la probabilidad de que la persona esté sana?
Completar la siguiente tabla:
Presencia de enfermedad
Enfermos Sanos
Resultado del test Positivo
diagnóstico Negativo
Sensibilidad:
Especificidad:
Valor predictivo positivo:
Valor predictivo negativo:
11
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística
VARIABLE ALEATORIA
DISTRIBUCIONES EN PROBABILIDAD
* OBJETIVOS ESPECÍFICOS
Comprender los conceptos de variable aleatoria, funciones de probabilidad y de distribución.
Aplicar estos conceptos a la interpretación del comportamiento de fenómenos biológicos y conocer algunas
distribuciones de probabilidad que los describen.
Analizar distintos casos y calcular valores medios y de dispersión.
Calcular las probabilidades de ocurrencia de resultados experimentales.
* CONTENIDOS TEMÁTICOS
Variable aleatoria: discreta y continua.
Distribución de probabilidad, función de cuantía, densidad y distribución acumulada. Distribuciones de
probabilidad, esperanza y varianza. Propiedades de la esperanza y la varianza. Percentil. Distribuciones
especiales: Bernoulli, Binomial, Normal, Normal estandarizada, t de Student y Ji-Cuadrado.
* GLOSARIO
Variable aleatoria. Funciones de probabilidad: función de cuantía, función de densidad, función de distribución
acumulada. Percentiles. Esperanza matemática. Varianza.
Distribuciones de probabilidad discreta y continua. Distribuciones particulares: Binomial, Normal, t de Student
y Ji-Cuadrado.
PROBLEMAS RESUELTOS
EJERCICIO 1) Si X es una variable aleatoria discreta tal que:
xi 0 1 2 3 4
P(xi) 0,1 0,1 0,35 0,25 .……
a) Para resolver este punto debemos recordar una de las condiciones para que una función sea una función
de probabilidad puntual o función de cuantía: la suma de las probabilidades puntuales es igual a uno,
simbólicamente:
n
∑ p(xi )=1
i=0
4
En nuestro caso p( x ) 1, es decir: p(0)+p(1)+p(2)+p(3)+p(4)=1;
xi 0
i
reemplazando por los valores de tabla nos queda: 0,1+ 0,1+ 0,35 + 0,25 + p(4) = 1, despejando obtenemos:
p(4)=1 - 0,1 - 0,1 - 0,35 - 0,25.
12
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
Repitiendo este procedimiento para cada valor de la variable se obtiene la función de distribución acumulada.
xi 0 1 2 3 4
p(xi) 0,1 0,1 0,35 0,25 0,2
F(xi) 0,1 0,2 0,55 0,80 1,0
c) Nos están preguntando la probabilidad de que la variable tome valores mayores o iguales a dos. Este ítem
se puede resolver de dos formas
1) Utilizando la función de cuantía y sumando cada probabilidad puntual
P(X≥2)=p(X=2)+p(X=3)+p(X=4)=0,35+0,25+0,2=0,8
2) Utilizando la función de distribución y aplicando las propiedades de que la suma de todas las
probabilidades es uno y de sucesos mutuamente excluyentes:
P(X≥2)=1-P(X<2)=1-P(X≤1)=1-0,2=0,8
Obsérvese que la probabilidad P(X<2) = P(X≤1) porque la variable es discreta y no toma valores entre 1
y 2. Por lo tanto P(X≥2)=0,8
Nota: observar que en el caso en que la variable pueda tomar muchos valores, la primera forma de resolución es poco
práctica, ya que podría ser una suma con muchos términos; en cambio la segunda forma siempre va a ser una operación
de, a lo sumo, dos términos.
d) El gráfico de la función de cuantía es un gráfico de bastones que muestra las probabilidades puntuales de
cada valor de la variable. En el eje de las abscisas se ubican los valores de la variable y en el eje de las
ordenadas se ubican los valores de probabilidad puntual.
El gráfico de la función de distribución acumulada es un gráfico de escalones que muestra cuánto acumula
cada valor de la variable, antes del primer valor de la variable la función vale cero ya que no acumula
probabilidad y luego del último valor de la variable la función se mantiene constante en uno ya que no hay más
valores de variable que aporten probabilidad. En el eje de las abscisas se ubican los valores de la variable y
en el eje de las ordenadas los valores de probabilidad acumulada.
Gráfico de Bastones
p(x) 0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
0 1 2 3 4
X
13
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
e) Para calcular la esperanza de una variable aleatoria discreta se utiliza la siguiente fórmula
n
E(X)= ∑ xi p(xi )
i=o
En nuestro caso:
4
f) Para calcular la esperanza que nos están pidiendo hay que utilizar la propiedad que establece que de la
suma de una VA y una constante, se obtienen una nueva variable (que llamaremos Y), entonces:
E(Y) = E(X+a) = E(X) + a.
g) Para calcular la esperanza pedida hay que utilizar la propiedad que establece si a una V.A. de la
multiplica por una constante, se obtiene una nueva variable (que llamaremos W), entonces:
E (W) = E( aX) = a E(X).
En nuestro caso la constante es 2, por lo que E(W) = E(2X) = 2*2,35 = 4,7
1 2 1
EJERCICIO 2) Dada la función: f (x)
x
8 3
a) Verificar que f(x) es función de probabilidad en el intervalo [0;2] y graficar.
b) Hallar la función de distribución acumulada.
c) Calcular E(X)
d) Calcular P(0,5 < X 1,5)
Nota: La resolución del ejercicio que desarrollaremos a continuación, persigue un fin netamente conceptual expositivo. Los
contenidos matemáticos necesarios para su resolución no formarán parte de la evaluación del presente curso.
a) Para verificar que f(x) es una función de probabilidad hay que verificar las dos condiciones:
1)f(x)≥0 ∀ x∈(-∞;∞)
∞
2) ∫ f(x) dx =1
-∞
14
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
f(x)
0.8 Desde menos infinito hasta 0 la función vale cero, desde
0 hasta 2 la función es mayor o igual que cero y desde 2
0.7 hasta más infinito la función vale cero. Por lo tanto la
0.6 primera condición se verifica.
0.5
0.4
0.3
0.2
0.1
La segunda condición se verifica calculando la integral, es decir verificando que el área bajo la curva es uno.
1 1
0 2 0 2
f x dx f x dx f x dx f x dx 0dx 8 x dx 0dx
2
3
0 2 0 2
2 2
1 x3 1 x3 x 23 2 03 0
0 * x 0
8 3 3 0 24 3 0 24 3 21 3
8 2 1 2
0 1
24 3 3 3
Como la integral es igual a 1 se verifica la segunda condición.
Por lo tanto se verifican las dos condiciones es decir que f(x) es una función de probabilidad.
0 para x < 0
Por lo tanto la función de distribución es:
1 3 1
FX ( x) x x para 0 x 2
24 3
1 para x > 2
c) Para calcular la esperanza de una variable aleatoria continua se utiliza la siguiente fórmula:
∞
E(X)= ∫ x f(x)dx
-∞
En nuestro caso:
2
2 2
1 1 2
1 1 1 x4 1 x2
E x x * f x dx x x 2 dx x3 x dx
0 0 8 3 08 3 8 4 3 2 0
2
1 1 24 22 16 4 7
x4 x2 1,17
32 6 0 32 6 32 6 6
15
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
d) Nos están preguntando la probabilidad de que la variable tome valores entre 0,5 y 1,5.
Para calcular esta probabilidad utilizaremos la función de distribución acumulada. Primero calculamos la
probabilidad de que la variable tome valores menores que 1,5 (reemplazando este valor en la función de
distribución acumulada) y a este valor le restamos la probabilidad de que la variable tome valores menores que
0,5 (reemplazando este valor en la función de distribución acumulada). Recordemos que, como la variable es
continua, la probabilidad en un punto es igual a cero, por lo tanto:
P(X<1,5)=P(X≤1,5)=F(1,5), y lo mismo para 0,5.
Nota: Por lo que se puede deducir que no importa si los extremos están o no incluidos, cálculo de probabilidad
se hace de la misma manera.
Nos queda:
1 1 1 1
P(0,5<X≤1,5)=P(X≤1,5)-P(X≤0,5)=F(1,5)-F(0,5)= [ ∙(1,5)3 + ∙1,5] - [ ∙(0,5)3 + ∙0,5] =
24 3 24 3
27 1 1 90
= +0,5 - - = = 0,46987
192 192 6 192
Nota: Los ejercicios de variable aleatoria continua a desarrollar en esta unidad tendrán a la función de distribución
acumulada (F(X)) como dato, por lo que no será necesario el cálculo de ninguna integral.
a) Para verificar que es función de densidad, o función de probabilidad debemos probar que la función
cumple con dos propiedades (como en el ejercicio anterior).
Estas son:
1) f(x) 0 en todo su recorrido
+∞
2) ∫ f(x) dx=1
-∞
f(x) 2.0
1.5
La primera propiedad la verificamos directamente en
el gráfico de la función donde observamos que el
mismo se encuentra sólo por encima del eje x (de 1.0
abscisas), que corresponde con el eje positivo de
ordenadas, en este caso f(x).
0.5
X 0 1 2
16
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
La segunda propiedad la verificamos realizando un cálculo sencillo a partir del gráfico para evitar calcular
integrales. Debemos observar que la segunda propiedad corresponde a considerar el área bajo la curva
que queda delimitada por el intervalo de definición o dominio.
En este caso bajo la curva reconocemos una figura geométrica, el triángulo, por lo que debemos calcular
el área del mismo, su base es de 1 unidad y su altura es de 2 unidades, por lo tanto:
b∙h 1∙2
área del triángulo = = = 1
2 2
Por lo tanto se verifican las dos condiciones, entonces f(x) es una función de probabilidad o función
de densidad.
b) Nos están preguntando la probabilidad de que la variable tome valores menores a ½, para esto
utilizaremos la expresión de la función de distribución acumulada, que es una función partida, es decir que
hay que prestar especial atención al valor de la variable ya que este nos va a indicar qué parte de la función
utilizar.
En este caso el valor es ½, este valor está entre 0 y 1, por lo tanto utilizamos la parte central de la
función, es decir F(x) = x2
Por lo tanto, P(X < 1/2) = P(X ≤ 1/2) = F(1/2) = (1/2)2 = 0,25
c) Nos están preguntando la probabilidad de que la variable tome valores menores o iguales a 2. En este
caso el valor de la variable es 2, mayor que 1, por lo tanto utilizaremos la última parte de la función, es decir
F(x)=1
Nota: observar que el caso continuo es indistinto (a fines prácticos) utilizar los símbolos > o y < o , ya que la probabilidad
puntual de una variable aleatoria continua es siempre cero. Es decir que:
P(X a) = P(X < a) + P(X = a) = P(X < a) + 0 = P(X < a), por lo tanto P(X a) = P(X < a)
d) Nos están preguntando la probabilidad de que la variable tome valores mayores o iguales a ½, a
diferencia de los dos puntos anteriores, no podemos utilizar directamente la función de distribución ya que
esta sirve solamente para probabilidades acumuladas hasta el valor de la variable y, en este caso, es una
probabilidad acumulada a partir de dicho valor de la variable. Por lo tanto tendremos que hacer un paso
más que consiste en escribir la expresión P(X 1/2) como una probabilidad que acumula por menor.
Sabemos que la probabilidad total es uno por lo tanto: P(X 1/2)= 1 - P(X < 1/2).
Ahora estamos en condiciones de utilizar la función de distribución con el valor ½ (esta probabilidad fue
calculada en el punto “b”).
Por lo tanto, P(X 1/2)= 1 - P(X < 1/2) = 1 - P(X ≤ 1/2) = 1 - (1/2)2 = 1 - 0,25 = 0,75
EJERCICIO 4) De acuerdo a las leyes genéticas la inseminación artificial con semen proveniente de machos
Landrace con hembras Duroc Jersey da hijos con las características paternas en un 60% de los casos y el
resto con las características maternas. Si se tomaron 14 crías de este tipo de apareamiento (se tomó una cría
al azar de cada una de las camadas, de las distintas madres que fueron sometidas a este cruzamiento):
17
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
SOLUCIÓN: La variable en estudio es una variable aleatoria discreta, pero a diferencia de las variables
discretas de los ejercicios anteriores, parecería tener una distribución conocida, la distribución Binomial, cuyas
probabilidades están tabuladas. Con lo cual, antes de calcular probabilidades debemos verificar los supuestos
de dicha distribución.
En principio, es necesario precisar en qué consiste el experimento aleatorio. En este caso sería inseminar
artificialmente una hembra Duroc Jersey con semen de un macho Landrace, y observar si un hijo tiene
características paternas.
Este experimento se repite 14 veces y, de esta manera, queda definida la variable binomial.
X: “N de hijos de machos Landrace con hembras Duroc Jersey con características paternas, en 14 crías”.
Dado que se verifica que:
1) El experimento aleatorio tiene dos resultados posibles: éxito y fracaso. Cada cría puede tener características
paternas o maternas (por como fue definida la variable el éxito es que tenga características paternas; pero se
podría haber definido de otra forma).
2) Cada repetición del experimento aleatorio es independiente de las demás. Cada cría es independiente de
las demás por haber sido seleccionados de distintas madres
3) Los resultados del experimento aleatorio son mutuamente excluyentes. Si una cría tiene características
paternas no puede tener características maternas.
4) La probabilidad de éxito se mantiene constante a lo largo de todas las repeticiones de este experimento
aleatorio. La probabilidad de características paternas (p=0,6) es la misma a lo largo de los 14 repeticiones.
5) El número de repeticiones es prefijado. Hay 14 crías observadas (n=14).
Una vez verificadas las condiciones de binomialidad se puede decir que XBi (14; 0,6).
Como la probabilidad de éxito es 0,6 es conveniente definir una variable aleatoria binomial auxiliar ya que
la tabla no puede usarse con probabilidades de 0,6 porque solo cuenta con probabilidades de 0 a 0,5. Por esta
razón definimos
Y: “N de hijos de machos Landrace con hembras Duroc Jersey con características maternas, en 14 crías”.
Es una variable aleatoria con distribución binomial con parámetros p=0,4 y n=14: YBi (14;0,4).
a.1) Nos están preguntando sobre las características maternas por lo tanto debemos utilizar la variable aleatoria
Y. “...Hasta 5 crías con características maternas...” quiere decir que la variable aleatoria Y puede tomar valores
menores o iguales que 5. Hay dos formas de resolver este ítem:
1) Por tabla, que da la función de distribución acumulada, entrando con n=14 y p=0,4 y buscando el 5
P(Y 5) = 0,4859
2) Por fórmula:
5
14
P(Y≤5)= ∑ ( ) 0,4y ∙0,614-y
y
i=0
Por lo tanto la probabilidad de obtener hasta 5 crías con características maternas es de 0,4859.
Nota: Por lo general es conveniente utilizar la tabla ya que los cálculos con fórmula son muy trabajosos.
a.2) Nos están preguntando sobre las características paternas por lo tanto debemos utilizar la variable aleatoria
X, pero vamos a tener que hacer un cambio de variable. “Menos de 6 crías con características paternas” quiere
decir que la variable aleatoria X puede tomar valores menores a 6, es decir menores o iguales a 5. Para hacer
el cambio de variable analicemos que sucede con la otra variable, si la variable X puede tomar valores menores
o iguales a 5 quiere decir que la variable Y puede tomar valores mayores o iguales a 9, ya que si hay 5 crías
con características paternas o menos, hay 9 con características maternas o más (recordemos que el total es
14). Este cambio de variable se puede ver más claramente con un esquema en donde se ubican los valores
de ambas variables:
X 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Y 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0
18
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
P(X<6)=P(X≤5)=P(Y≥9)=1-P(Y<9)=1-P(Y≤8)=1-0,9417=0,0583
a.3) Nos están preguntando sobre las características maternas, por lo tanto debemos utilizar la variable Y. “El
50% de las crías con características maternas”, es lo mismo que decir “7 crías con características maternas”,
ya que el 50% de 14 es 7, por lo tanto es la probabilidad puntual de que la variable Y tome el valor 7. Hay dos
formas de resolver este ítem
1) Por tabla, restándole a la probabilidad acumulada hasta 7 la probabilidad acumulada hasta 6.
P(Y=7)=P(Y≤7)-P(Y≤6)=0,8499-0,6925=01574
14
2) Por fórmula: P(X=7)= ( ) 0,47 ∙0,67 =0,1574
x
Por lo tanto, la probabilidad de obtener el 50% de las crías con características maternas es 0,1574.
Nota: la fórmula para el cálculo de las probabilidades puntuales no es la misma que la del cálculo de las probabilidades
acumuladas, ya que no tiene la sumatoria.
b) La varianza de toda variable con distribución binomial es: V(X)=np(1-p), por lo tanto en nuestro caso
V(X)=14*0,6*(1-0,6)=14*0,6*0,4=3,36. Aplicando la siguiente propiedad V(aX)=a2 V(X), y reemplazando a por
3, la varianza que nos están pidiendo queda: V(3 X)=3 2*V(X)
Por lo tanto, V(3X)=9*3,36=30,24 crias2
c) Aplicando la siguiente propiedad V(Xa)=V(X) y reemplazando a por 4, la varianza que nos están pidiendo
queda V(X+4) = V(X)
Por lo tanto, V(X+4)= 3,36 crias2
EJERCICIO 5) Un tambero está al borde de la quiebra por lo que sus expectativas están puestas en la
producción futura. Las vacas Holando Argentino de su tambo tienen un rendimiento normal con media 450
litros y desvío estándar de 80 litros de leche, por mes. El tambero superaría la situación actual si en el próximo
mes cada vaca produce más de 510 litros en promedio.
SOLUCIÓN: La variable en estudio es una variable aleatoria continua, a diferencia de los ejercicios anteriores,
es una variable aleatoria con distribución conocida y tabulada. Por la información que nos dan en el enunciado
sabemos que es una variable aleatoria con distribución normal, con media poblacional 450 litros/mes y varianza
poblacional de 6400 litros2 /mes2 (ya que su desvío estándar es de 80 litros/mes), por lo tanto podemos decir
que:
Recordemos que sólo contamos con la tabla para la distribución normal estándar por lo tanto tendremos
que estandarizar la variable con la siguiente fórmula:
19
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
X-μ X - 450
Z= = y sabemos que Z tiene una distribución normal estándar, es decir una distribución normal con
σ 80
media poblacional 0 y varianza poblacional 1, simbólicamente: ZN(0,1)
a) El tambero llega a la quiebra si produce a lo sumo 510 litros/mes por animal, por lo tanto no llega a la quiebra
si produce más de 510 litros/mes, es decir que nos están preguntando: ¿cuál es la probabilidad de que la
variable tome valores mayores que 510?, simbólicamente se escribe: P(X > 510) (tendremos que utilizar la
propiedad de que la probabilidad total es uno, ya que todas las tablas dan probabilidades para valores menores
que un cierto valor, ya que son tablas de funciones de distribución acumulada).
X - μ 510 - 450
P(X>510)=P ( > ) =P(Z>0,75)=1-P(Z≤0,75)=1-0,77337=0,22663
σ 80
b) El tambero llega a la quiebra si produce a lo sumo 510 litros/mes y pierde su patrimonio personal si produce
menos de 320 litros/mes, por lo tanto, no pierde su patrimonio personal si produce más de 320 litros/mes. Es
decir que nos están preguntando: ¿cuál es la probabilidad de que la variable tome valores entre 320 y 510?
Simbólicamente se escribe: P(320≤X≤510)
Por lo tanto, la probabilidad de que el tambero llegue a la quiebra sin perder su patrimonio personal
es de 0,72182.
c) Si el tambero, en otro país, tiene una probabilidad de 0,3 de no irse a la quiebra, debemos buscar el
valor de la variable que nos determina esta probabilidad, es decir buscamos el valor de “a” que resuelve:
P(X>a)=0,3, pero debemos estandarizar, es decir que buscamos “b” que resuelva: P(Z>b)=0,30.
Entrando por el interior de la tabla con el valor de probabilidad 0,7 (o con el valor más cercano a este),
buscamos el valor de la variable en los márgenes, obtenemos que b = 0,53. Pero nos interesa este valor sin
estandarizar por lo tanto debemos “des-estandarizar”. Para esto debemos despejar el valor de X de la fórmula
de estandarización:
a-μ
b=Z0,7 = ⇒Z0,7 ∙ σ= a - μ⇒Z0,7 ∙ σ+μ= a
σ
Por lo tanto si el tambero produjera en otro país debería producir más de 491,6 litros/mes para no irse a la
quiebra.
EJERCICIO 6) Sea X una variable aleatoria con distribución t-Student, con 16 grados de libertad
a) ¿Cuál es la probabilidad de que X 2,12?
b) ¿Cuál es la probabilidad de que X > 2,921?
c) ¿Cuál es la probabilidad de que X < -2,583?
d) ¿Cual es el valor de “a” que cumple con la siguiente restricción: P(Xa)=0,90?
20
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
SOLUCIÓN: La variable en estudio es una variable aleatoria continua con distribución t-Student con 16
grados de libertad por lo tanto podemos escribir: Xt16. Vamos a utilizar la tabla de la distribución t, para
entrar en tabla necesitamos los grados de libertad, que en nuestro caso son 16, por lo tanto, solo
utilizaremos la fila correspondiente a 16 para resolver los diferentes ítem del ejercicio.
Nota: si no está exactamente el valor de variable que buscamos se utiliza el valor más próximo.
b) Como nos están pidiendo la probabilidad de que la variable tome un valor mayor que 2,921 tendremos
que utilizar la propiedad de la suma de las probabilidades totales, ya que la tabla sólo contiene
probabilidades de valores menores que un valor de la variable.
Entonces P(X > 2,921) =1-P(X 2,921). Para encontrar P(X 2,921) hacemos lo mismo que en el
punto “a” y obtenemos que P(X 2,921) = 0,995. Con lo cual P(X>2,921)=1-0,995=0,005
c) La tabla de la distribución t sólo cuenta con los valores positivos de la variable, pero como es una
distribución simétrica utilizamos estos valores para encontrar probabilidades de los valores negativos. Por
ser simétrica podemos escribir P(X < -2,583) = P(X > 2,583) y seguir resolviendo como en el punto “b”, con
lo cual P(X < -2,583) = P(X > 2,583) = 1-P(X ≤ 2,583)=1- 0,99 = 0,01
Nota: la simetría nos asegura que el área que queda a la izquierda del valor negativo de la variable es la misma la
que queda a la derecha del valor positivo de la variable.
d) Nos están pidiendo un valor de variable y nos están dando la probabilidad de que los valores de t sean
menores de ese valor de variable (0,90), por lo tanto entramos por el encabezado de columna con este
valor, lo cruzamos con la fila de los 16 grados de libertad y así queda determinado el valor que estamos
buscando: 1,337.
Simbolicamente: P(X<a) = 0,90 a = t16,0.90 = 1,337
Por lo tanto, a =1,337.
e) A diferencia del punto anterior, no podemos entrar directamente a tabla, por que la tabla cuenta solamente
con valores de probabilidad desde 0,6 hasta 0,9995. Por lo tanto, tendremos que utilizar nuevamente la
propiedad de simetría de la distribución.
Por simetría: P(X<a)=0,05 ⇒ P(X>-a)=0,05
Por suma de las probabilidades totales: P(X>-a)=0,05 ⇒1-P(X≤-a)=0,05
Despejando: P(X≤-a)=1-0,05 ⇒ P(X≤-a)=0,95
Ahora podemos buscar el valor en la tabla, cruzando la fila de los 16 grados de libertad con el valor de
probabilidad 0,95, nos da que el valor de la variable es 1,746, es decir que – a =1,746, con lo cual a =-1,746.
Simbólicamente: P(X< a ) = 0,05 a = t16,0,05= - t16,0,95 = -1,746
Por lo tanto, a = -1,746.
EJERCICIO 7) Sea Y una variable aleatoria con distribución Ji-cuadrado, con 22 grados de libertad
a) ¿Cuál es la probabilidad de que Y 26,04?
b) ¿Cuál es la probabilidad de que Y > 33,92?
21
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
c) ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y<b) = 0,25?
d) ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y>b) = 0,1?
SOLUCIÓN: La variable en estudio es una variable aleatoria continua con distribución Ji-Cuadrado con 22
grados de libertad por lo tanto podemos escribir: Y 22 . Vamos a utilizar la tabla (de distribución
2
acumulada) de la distribución Ji. Para entrar en tabla necesitamos los grados de libertad, que en nuestro
caso son 22, por lo tanto solo utilizaremos la fila correspondiente a 22 para resolver los diferentes ítem del
ejercicio. La tabla de Ji es parecida a la de la t ya que cuenta con los valores de la variable en la parte
central, los grados de libertad en la primera columna y los valores de probabilidad en la primera fila.
a) Para obtener el valor que nos están pidiendo solo tenemos que buscar en la fila de los 22 grados de
libertad el valor de la variable 26,04, y leer en la fila de encabezados el valor de probabilidad
correspondiente.
Por lo tanto, P(Y 26,04) = 0,75.
Nota: si no está exactamente el valor de variable que buscamos se utiliza el valor más próximo.
b) Una vez más tendremos que utilizar la propiedad de la suma de las probabilidades totales ya que la tabla
sólo da probabilidad para valores menores que un determinado valor de variable y nos están pidiendo una
probabilidad para valores mayores que un determinado valor de variable.
Con lo cual P(Y> 33,92) = 1-P(Y 33,92), solo falta buscar el valor de probabilidad en tabla como en el punto
“ a ”. P(Y>33,92) =1-P(Y 33,92)=1-0,95 = 0,05
Por lo tanto, P(Y > 33,92) = 0,05.
c) Entramos directamente en tabla con los grados de libertad 22 y el valor de probabilidad 0,25, donde se
cruzan la fila de los grados de libertad y la columna del valor de probabilidad queda determinado el valor pedido:
b = 17,24
Simbólicamente: p(Y b) 0,25 b 22,0, 25 17,24
2
d) Una vez más tendremos que utilizar la propiedad de la suma de las probabilidades totales
P(Y>b)=0,1⇒P(Y≤b)=1-0.1⇒P(Y≤b)=0,9. Ahora hacemos lo mismo que en el punto “c”, pero con un valor de
probabilidad de 0,9 y obtenemos que b = 30,81.
Simbólicamente: p(Y b) 0,1 b 22,0,9 30,81
2
EJERCICIO 8) Un laboratorio afirma que una droga causa efectos secundarios en una proporción de 5 de
cada 100 pacientes. Para contrastar esta afirmación, otro laboratorio elige al azar a 2 pacientes a los que
aplica la droga. ¿Cuál es la probabilidad de los siguientes sucesos?
1) Resolver los siguientes ítems de dos maneras diferentes, utilizando la distribución correspondiente a la
variable de interés, y también aplicando los conceptos aprendidos en la unidad I.
a) Ningún paciente tenga efectos secundarios.
b) Uno tenga efectos secundarios y el otro no
c) Ambos tengan efecto secundario
SOLUCIÓN
Si aplicamos los conceptos de la unidad 1, debemos considerar los sucesos:
E: que el paciente tenga efectos colaterales provocados por la droga.
NE: que el paciente no tenga efectos colaterales provocados por la droga.
El espacio muestral correspondiente al experimento en el que se extraen 2 individuos, con reposición,
formando el siguiente espacio muestral:
22
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
Si aplicamos los conceptos de la unidad 2, necesitamos considerar la siguiente variable aleatoria: X:”can-
tidad de pacientes con efectos secundarios provocados por la droga, de un conjunto de 2”. Es una variable
aleatoria discreta, con distribución binomial, que tiene como parámetros: n=2 y p=0,05.
En este punto, sería conveniente que usted aplique las condiciones de la binomial a esta situación práctica,
para verificar que se trata de una distribución binomial.
a) Ningún paciente tenga efectos secundarios.
Aplicando la unidad 1, se resuelve como:
P(NE NE) = 0,95 * 0,95 = 0.9025
Aplicando la unidad 2, se resuelve como:
P(x=0) = 0,9025
b) Uno tenga efectos secundarios y el otro no
Aplicando la unidad 1, se resuelve como:
P[ (NE E) (E NE) ] = (0,95 * 0,05) * 2 = 0,095
Aplicando la unidad 2, se resuelve como:
p(x=1)= p(x≤1) - p(x=0) =0,9975-0,9025=0,095
c) Ambos tengan efecto secundario
Aplicando la unidad 1, se resuelve como:
P(E E) = 0,05 * 0,05 = 0,0025
Aplicando la unidad 2, se resuelve como:
p(x=2)= p(x≤2) - p(x≤1) =1-0,9975=0,0025
EJERCICIO 9) En una jaula hay 3 cobayos negros y 5 blancos. Se extraen simultáneamente dos cobayos,
se pide:
1. Hallar el espacio muestral si se observa y registra el color.
2. Calcular la probabilidad de que:
2.a- ambos sean negros.
2.b- ambos sean blancos.
2.c- uno sea negro y el otro blanco.
3. Si interesa estudiar la variable X: “número de cobayos negros seleccionados”, se pide:
3.a- A partir de los valores que toma la variable X, ordenarlos en una tabla, y calcular la función de
cuantía y la función de distribución.
3.b- Graficar ambas funciones.
3.c- Calcular esperanza y varianza.
3.d- Calcular la probabilidad de que a lo sumo dos cobayos sean negros.
SOLUCIÓN
1. Hallar el espacio muestral correspondiente a observar y registrar el color, y a la extracción de dos co-
bayos.
S = {NN , NB , BN , BB}
2. Calcular la probabilidad de que:
2.a- ambos sean negros.
3 2 3
P(NN)= ∙ = =0,107
8 7 28
2.b- ambos sean blancos.
5 4 5
P(BB)= ∙ = =0,357
8 7 14
23
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
X p(X) F(X)
0 5/14 5/14
1 15/28 25/28
2 3/28 1
5 15 3 3 2 45
V(X)=02 ∙ +12 ∙ +22 ∙ - ( ) = =0,402
14 28 28 4 112
3.d- Calcular la probabilidad de que a lo sumo dos cobayos sean negros.
P(X≤2)=F(2)=1
EJERCICIO 10) Para un grupo de hombres adultos con una edad de 40 a 50 años, la distribución de lecturas
de colesterolemia, en mg/dl, tiene distribución normal con media de 210mg/dl y una desviación estándar
de 15mg/dl.
a) Hallar la probabilidad de que un hombre adulto de esta población tenga una lectura de colesterol
en sangre que exceda los 250mg/dl.
b) Hallar la probabilidad de que un hombre adulto de esta población tenga una lectura de colesterol
en sangre de a lo sumo 220mg/dl, sabiendo que tiene por lo menos 215mg/dl.
24
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
SOLUCIÓN
X: " lecturas de colesterol en sangre, en mg/dl, de un hombre adulto con una edad de 40 a 50 años "
b)
P(215≤X≤220)
P (X≤220⁄X≥215) =
P(X≥215)
X-μ 215-210
P(X≥215)=P ( > ) =P(Z>0,33)=1-P(Z≤0,33)=1-0,62930=0,37070
σ 15
Por lo tanto
P(215≤X≤220) 0,11927
P (X≤220⁄X≥215) = = =0,32174
P(X≥215) 0,37070
c) P(Z≤a)=0,10⇒a=-1,28
Pero nos interesa este valor sin estandarizar por lo tanto debemos “des-estandarizar” por lo que despejamos
el valor de X de la fórmula de estandarización:
X0 -μ
-1,28= ⇒-1,28*15+210=X0 ⇒X0 =190,8
σ
Por lo tanto, la lectura de colesterol no superada por el 10% de los adultos de esta población es
190,8 mg/dl
d)
Y: "cantidad de hombres adultos con una edad de 40 a 50 años cuyas lecturas de colesterol en sangre, en
mg/dl, son superiores a 250 mg/dl, en 4 hombres adultos con una edad entre 40 y 50 años."
Es una variable aleatoria con distribución binomial con parámetros p=0,00379 y n=4: YBi (4; 0,00379)
Por lo tanto, la probabilidad de que ninguno de ellos tenga una lectura superior a 250 mg/dl
es de 0,9849258.
25
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
PROBLEMAS PROPUESTOS
EJERCICIO 1) La distribución del número de crías nacidas muertas por parición de un lote de 200 cerdas
Duroc Jersey considerado como población es la siguiente:
xi 0 1 2 3 4 5
p(xi) 0,05 0,20 0,30 0,20 0,15 0,10
0 para x -1
con función de distribución acumulada: F ( X ) -x 2 1 para -1 x 0
1 para x 0
Calcular:
a) ¿De qué tipo es la variable en estudio?
b) F(X) es la función de ................................................ y f(x) es la función de ....................................
c) P (-1 X -0,5)
d) P (-0,5 X -0,1)
e) P (X -2)
f) P (X 1)
g) P (X < -0,25)
xi 1 2 3 4 5 6
p(xi) 0,05 0,10 0,25 0,30 0,20 ?
26
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
EJERCICIO 5) El exceso de lluvias en ciertos campos bajos produce parasitosis en el ganado. Precipitaciones
anuales mayores a 2000 mm son consideradas, en algunos casos, perjudiciales y provocan infestaciones que
involucran al 20% del ganado bovino destetado. Si se toma una muestra de 12 terneros de un lote de 1000,
a) Definir la variable en estudio
b) Analizar si la variable verifica las condiciones de una distribución Binomial
c) Definir la variable auxiliar y especificar su distribución.
d) ¿Cuál es la probabilidad de que ninguno esté parasitado?
e) ¿Cuál es la probabilidad de que10 o menos estén parasitados?
f) ¿Cuál es la probabilidad de que 5 ó 6 no estén parasitados?
g) Calcular la V(X), V(X+10) y V(3X)
0,3
0,25
0,2
0,15
0,1
0,05
0
8 10 12 14 16
EJERCICIO 7) El peso de los novillos de la raza Hereford es una variable normalmente distribuida con media
380 kg. y desvío estándar 23 kg.
a) Definir la variable de interés e indicar su distribución
b) ¿Cuál es la probabilidad de que un novillo de la raza en cuestión elegido al azar pese entre
400 y 430 kg?
c) ¿Cuál es la probabilidad de que el peso de un novillo de raza Hereford sea mayor a 390 kg?
d) ¿Cuál es el peso no superado por el 25 % de los novillos de dicha raza?
EJERCICIO 10) En un criadero de perros se dedican a las razas labrador y Doberman, de pelajes negro y
marrón. Se selecciona una muestra de 20 perros, y se ordenan los datos en la siguiente tabla:
Negro Marrón
Doberman 4 5
Labrador 3 8
EJERCICIO 11) En un pensionado canino se encuentran 20 perros que fueron clasificados por tamaño y
edad:
Cachorro Adulto
Grande 2 1
Mediano 4 6
Pequeño 5 2
1. Calcular la probabilidad de seleccionar un perro:
a- mediano del grupo de los adultos.
b- mediano y adulto.
2. Si se seleccionan dos perros ¿Cuál es la probabilidad de que:
28
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
EJERCICIO 12) Se considera que la concentración de ácido úrico en gatos de menos de un año de edad
tiene una distribución normal con media 0,35 mg/dl y varianza 0,04 (mg/dl)2.
a) ¿Cuál es la probabilidad de que un gato presente una concentración de ácido úrico de entre 0,2 y
0,3 mg/dl?
b) Hallar la probabilidad de que un gato tenga en su orina a lo sumo 0,4 mg/dl de ácido úrico, sabiendo
que tiene una concentración superior a 0,3mg/dl.
c) ¿Cuál es la concentración de ácido úrico no superada por el 20% de los gatos?
EJERCICIO 13) Entre los diabéticos, el nivel de glucosa en sangre (X), en ayunas, puede suponerse de
distribución normal, con media 106 mg/100 ml y desviación típica 8 mg/100 ml, entre los pacientes sanos
esta variable (Y) también es normal pero con media 80mg/100ml y una desviación típica de 9mg/100ml, se
clasifica como diabético a un paciente con glucosa igual o superior 110,
a) hallar la probabilidad de:
1- clasificar como diabético a un paciente sano;
2- clasificar como sano a un paciente diabético;
3- detectar la enfermedad de este criterio.
b) Hallar E(X+Y) y Var(X-Y)
29
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
ESTADÍSTICA DESCRIPTIVA
OBJETIVOS ESPECIFICOS
Identificar una población o muestra
Definir la o las variables que caracterizan a una distribución
Calcular medidas de posición y de dispersión adecuadas para describir cada distribución.
Comprender la utilidad e importancia del Teorema Central del Límite en estadística.
CONTENIDOS TEMÁTICOS
Población y muestra. Variables cuantitativas continuas y discretas. Variable atributo. Principios y tipos de
muestreo. Distribución de frecuencias discretas y continuas. Gráficos. Medidas de posición y dispersión: media
aritmética, mediana, modo, amplitud, varianza, desvío estándar, coeficiente de variación y distancia intercuar-
tílica. Propiedades de media aritmética y varianza. Esperanza, varianza y caso especial de la distribución de
X.
* GLOSARIO
Estadística. Variable: cuantitativa, cualitativa o atributo. Población. Muestra. Muestreo. Gráficos: barras,
bastones, escalones, histogramas; polígonos de frecuencias, ojiva; Boxplot. Media aritmética, Mediana,
Modo, Varianza, Desvío estándar, Coeficiente de variación, Rango o Amplitud. Variación relativa y absoluta.
Conceptos de Muestreo
ALEATORIO: en el que se utilizan los conceptos aportados por la teoría de probabilidad para seleccionar las
unidades de muestreo. Esta aleatorización se usa para tener una distribución muestral y obtener estimaciones
válidas del error de esa estimación para poder concluir acerca de la población.
a) No restringido o simple
En este método todos los sujetos tienen la misma posibilidad de ser seleccionados para la muestra, indepen-
dientemente uno de otro. Para garantizar esto, cada sujeto debería ser devuelto a la población luego de ser
medido y registrado. Sea N el tamaño de la población:
1
a) Si se trabaja con reposición la probabilidad de que cada elemento sea seleccionado es .
N
1
b) Si se trabaja sin reposición la probabilidad para el primer elemento a elegir es , para el segundo es
N
29
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
1 1
, para el tercero , y así sucesivamente.
N 1 N 2
Puede suceder que:
El tamaño de la muestra sea menor al 5% de la población y por lo tanto trabajar sin reposición es casi lo mismo
que trabajar con reposición, vale decir que el error cometido es despreciable numéricamente.
Sea imposible devolverlos a la población porque, por ejemplo, pueden ser destruidos para la investigación, y
no pueden ser repuestos luego de la medición.
b) Restringido
i) Estratificado: la población está dividida en base a una variable estratificadora en grupos homogéneos
o clases llamados “estratos”. Se toma una muestra aleatoria simple de cada grupo y se obtiene una muestra
estratificada. La muestra puede ser “proporcionada” si el número de elementos seleccionado en cada grupo
es proporcional al tamaño del grupo; o “desproporcionada” si se toma igual número de elementos en cada
estrato sin importar su tamaño.
Por ejemplo si estratificamos por género y el 60% de una determinada población corresponde al género
masculino, si tomamos del estrato masculino el 60% de la muestra, esta sería proporcionada; en cambio, si
tomamos igual número de hombres y mujeres sería desproporcionada.
ii) Agrupado o en conglomerados: la población está dividida o se la divide en grupos que presentan
características similares a toda la población y se extrae una muestra de esos grupos heterogéneos llamados
“conglomerados”. Cada grupo es una “unidad primaria de muestreo”; se puede incluir el grupo entero de las
unidades elementales que lo forman en la muestra o tomar una muestra de las unidades primarias más pe-
queñas.
El muestreo para llegar a la muestra final puede ser “monoetápico” (en una sola etapa), “bietápico” o con
“submuestreo” (en dos etapas), o “multietápico” (más de dos etapas).
Por ejemplo, un multietápico seria: en una primera etapa podemos seleccionar las universidades (UNIDAD
PRIMARIA), luego seleccionar las facultades en una segunda etapa, y, por último, los estudiantes en una
tercera etapa.
Cuando no se puede llegar a las unidades de muestreo directamente se divide a la población en grupos.
Se seleccionan algunos al azar y se muestrean solamente los seleccionados en una o varias etapas. Por
ejemplo: barrios, manzanas, viviendas, personas.
Este muestreo por etapas se puede combinar con un muestreo estratificado.
iii) Sistemático: supongamos que las unidades de la población se enumeran en un cierto orden, se
toma una unidad al azar entre las k primeras y luego se toman las subsecuentes en intervalos de k. No se
necesita conocer el tamaño total de la población en estudio ni tener definido el marco de referencia. Para
elegir el valor de k se elige una cifra entera, razonable, generalmente el cociente entre el tamaño de la
población (cuando se conoce) y el tamaño de la muestra, que se establece sobre la base de informaciones
previas.
Este tipo de muestreo suele usarse en control de calidad, y para el caso de sucesiones de elementos,
como por ejemplo, historias clínicas de pacientes, certificados de nacimiento, etc.
Supongamos que se necesita un animal de cada 100, y el primero es seleccionado aleatoriamente de
entre los primeros 100. Si es el animal número 63, entonces la muestra estaría formada por los animales
número 63, 163, 263, y así sucesivamente.
Este tipo de muestreo es un procedimiento fácil, pero insatisfactorio si en la población hay tendencias,
ciclos no reconocidos o periodicidades ocultas. Como ejemplo, tenemos el siguiente caso: Si un ganadero
solamente envía a sus animales al matadero los días martes, y las muestras, en el matadero, se seleccio-
nan sistemáticamente los días miércoles, los animales de este ganadero no estarán representados en la
muestra.
NO ALEATORIO: la elección de la muestra queda en manos del investigador, basado en su juicio experto,
conveniencia u otros criterios. En este caso un riesgo a tener en cuenta es que la estimación obtenida muy
posiblemente sea sesgada.
Por ejemplo, si quiere estimarse la proporción de vacas lecheras rengas (con claudicaciones) en un esta-
blecimiento, y se selecciona como muestra a las 10 primeras vacas que entran a la sala del ordeñe, de un
total de 100 vacas, posiblemente estemos subestimando esta proporción, ya que esas 10 primeras vacas
tendrían menor chance de tener claudicaciones.
30
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
PROBLEMAS RESUELTOS
EJERCICIO 1) En un estudio sobre la detección de pseudotuberculosis, la Dirección de Bromatología se-
leccionó al azar 28 establecimientos, dedicados a la cría y engorde de ovinos, registrando la cantidad de
animales afectados, por establecimiento, al realizar la faena en el frigorífico:
SOLUCIÓN
a) La variable es aquella característica que nos interesa medir en cada unidad experimental, en este caso:
X: “cantidad de ovinos atacados de pseudotuberculosis en un establecimiento dedicado a la cría y engorde
de ovinos al realizar la faena en el frigorífico”.
Se trata de una V. Cuantitativa Discreta.
En este problema la población en estudio corresponde a los establecimientos dedicados a la cría y engorde
de ovinos; como no se especifica la región en donde están ubicados, solamente con esta descripción nos
alcanza. Entonces, la muestra tomada es de:
n (tamaño de la muestra): 28 establecimientos dedicados a la cría y engorde de ovinos.
b) Tabla de frecuencias: la primera columna contiene los valores de la variable que se registraron en la
muestra, y se simboliza con xi; en la segunda columna se registra cuántas veces se observa cada uno de
los valores de la variable (xi), y corresponde a la frecuencia absoluta simple (fi). En la tercera columna se
registra cuántas veces se observan los valores de la variable menores o iguales a x i, o sea, las frecuencias
absolutas acumuladas (Fi). La cuarta columna corresponde al cociente entre fi y n, o sea la frecuencia
relativa simple (hi). En la última columna, correspondiente a las frecuencias relativas acumuladas (Hi), su-
mamos las frecuencias relativas simples de la misma manera que en la tercera columna, hasta acumular
el total de la muestra. Por las características de las frecuencias relativas siempre obtendremos como valor
1, o 100%, o cercanos a ellos, según se expresen en decimales o como porcentajes.
xi fi Fi hi Hi
70 3 3 0,11 0,11
75 4 7 0,14 0,25
77 5 12 0,18 0,43
82 7 19 0,25 0,68
110 5 24 0,18 0,86
118 2 26 0,07 0,93
120 1 27 0,04 0,96
135 1 28 0,04 1,00
TOTAL 28 1,00
La utilidad de la tabla es que el ordenamiento de los datos permite interpretar la información de la muestra.
Por ejemplo, tomemos la información de la cuarta fila de datos, en donde x 4 = 82:
f4 = 7, indica que en 7 establecimientos dedicados a la cría y engorde de ovinos se encontraron 82
ovinos atacados de pseudotuberculosis.
F4 = 19, se interpreta como que en 19 establecimientos dedicados a la cría y engorde de ovinos se
encontraron a lo sumo 82 ovinos atacados de pseudotuberculosis (o hasta 82 ovinos atacados de pseudo-
tuberculosis inclusive).
31
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
4
NOTA: F4 f
1
i f1 f 2 f3 f 4 3 4 5 7 19
h4 = 0,25, expresa que en el 25% de los establecimientos dedicados a la cría y engorde de ovinos se
encontraron 82 ovinos atacados de pseudotuberculosis.
H4 = 0,68, indica que en el 68% de los establecimientos dedicados a la cría y engorde de ovinos se
encontraron a lo sumo 82 ovinos atacados de pseudotuberculosis (o hasta 82 ovinos atacados de pseudo-
tuberculosis inclusive).
4
NOTA: H 4 h h h
1
i 1 2 h3 h4 0,11 0,14 0,18 0, 25 0,68
c) Medidas de posición
MEDIA ARITMÉTICA
xi fi xi fi
Para calcular la media aritmética debemos sacar el promedio de
todos los valores de la variable que hemos obtenido en la muestra. En la 70 3 210
fórmula observamos que aparece la expresión xifi, o sea, la sumatoria de 75 4 300
los productos entre cada valor de la variable y su correspondiente frecuen- 77 5 385
cia absoluta simple. Para facilitar los cálculos podemos agregar una co- 82 7 574
lumna a la tabla de frecuencias en donde realizaremos estos productos, 110 5 550
de la siguiente forma: 118 2 236
Σxi fi 2510
x̄ = = =89,64 120 1 120
n 28 135 1 135
Interpretación: aproximadamente 90 ovinos afectados con pseudotu- 28 2510
berculosis
MEDIANA
Para calcular la mediana, primero debemos ordenar los datos de menor xi Fi
a mayor o de mayor a menor. En este ejercicio ya ordenamos los datos al cons-
truir la tabla de frecuencias. Como sabemos, esta medida divide a la muestra en 70 3
dos partes iguales, por lo que en el primer paso debemos encontrar la posición 75 7
de la misma, o sea, encontrar cuál es el valor central de la muestra (en caso de 77 12
que n sea un número impar), o cuáles son los valores centrales (en caso de que 82 19
n sea un número par). 110 24
n+1 118 26
Pos Me = = 14,5 120 27
2
135 28
Entonces los valores centrales ocupan los lugares 14 y 15. Luego los ubicamos en la tabla de Frecuencias
acumuladas (Fi) y observamos: como los valores centrales son x(14)=82 y x(15)=82, debemos realizar el
promedio entre ellos
32
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
MODO
xi fi Para calcular el modo tenemos que recurrir nuevamente a la tabla de frecuencias,
70 3 porque en ella vamos a ubicar rápidamente cuál es el valor de la variable que se
repite con mayor frecuencia. Debemos observar cualquiera de las columnas de fre-
75 4
cuencias simples, en este caso tomamos la columna de f i. La mayor frecuencia es
77 5 f4, por lo tanto:
82 7
110 5 f 4 = 7 Mo = 82 ovinos afectados con pseudotuberculosis
118 2
120 1
135 1
TOTAL 28
Observar que también estas medidas verifican la condición de ASIMETRÍA POSITIVA:
Me = Mo = 82 < X = 89,64 ovinos afectados con pseudotuberculosis
CUARTILES
Otra medida de posición para datos ordenados son los CUARTILES. Para calcularlos dividimos la
muestra en cuatro partes iguales, por lo que calculamos 3 cuartiles, C1, C2 (=Me) y C3.
Realizamos el mismo mecanismo que para calcular la Mediana, en cada una de las dos mitades, y
obtenemos:
d) Medidas de dispersión:
RANGO o AMPLITUD
Esta medida de dispersión es la más sencilla y consiste en conocer cuántas unidades comprende
la totalidad de los valores observados en la muestra. Para calcularlo sólo basta con realizar la resta entre
el xmáx (mayor valor de la variable) y xmín (menor valor de la variable).
DISTANCIA INTERCUARTÍLICA
Es la medida de dispersión asociada a los cuartiles, se simboliza dC, y en ella observamos la dispersión
de los valores centrales, la forma de calcularla es: d C = C3 – C1, e indica el rango o amplitud donde se
encuentra el 50% “central” de las observaciones.
En este caso es: dC= C3-C1 = 110-75 = 35 ovinos afectados con pseudotuberculosis
VARIANZA
Es una medida de dispersión absoluta,
xi fi xi fi xi2fi
que mide el grado de concentración de las ob-
servaciones con respecto a su promedio ( X ) 70 3 210 14700
En la fórmula observamos que aparece 75 4 300 22500
la expresión ∑xifi, que ya habíamos usado al cal- 77 5 385 29645
cular la media aritmética, y aparece una expre- 82 7 574 47068
sión, xi2fi, la sumatoria de los productos entre 110 5 550 60500
el cuadrado de cada valor de la variable y su co- 118 2 236 27848
rrespondiente frecuencia absoluta simple. Para 120 1 120 14400
facilitar los cálculos podemos agregar una co- 135 1 135 18225
lumna a la tabla de frecuencias en donde reali- TOTAL 28 2510 234886
zaremos estos productos, de la siguiente forma:
33
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
1 (Σxi fi )2 1 (2510)2 1
Sx2 = [Σx2i fi - ] = [234886- ] = (234886-225003,57)= 366,02
n-1 n 27 28 27
Nota: Debemos recordar que se expresa en la unidad de la variable pero elevada al cuadrado.
DESVÍO ESTÁNDAR
El desvío estándar es la raíz cuadrada de la varianza. Por lo que lo calculamos de la siguiente forma:
COEFICIENTE DE VARIACIÓN
Es una medida de dispersión relativa en donde se relaciona una medida de dispersión (Sx) con una
medida de posición ( X ), y su resultado se expresa en porcentaje. No tiene unidades de medida.
S 19,13
C.V.= .100 = .100 = 22,1%
̄X 86,5
2 2 2
SY = 0,902 .SX = 0,81∙366,02= 296,74 (ovinos afectados con pseudotuberculosis)
2
SY = √SY = √296,74= 17,22 ovinos afectados con pseudotuberculosis
El CV no se modifica, ya que:
SY 0,90.SX SX
CVY = = = =CVX
Ȳ 0,90.x̄ x̄
f) Boxplot
34
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
Podemos observar los escalones y relacionarlos con el gráfico de la función de distribución acumulada
F(xi), que ya hemos visto en la unidad anterior (correspondiente a Distribuciones de Probabilidad).
EJERCICIO 2) Los siguientes valores corresponden a la altura, en mm, del complejo QRS de 20 electro-
cardiogramas de galgos de ambos sexos, luego de una competencia:
25,0 29,3 20,0 24,1 22,5 20,5 25,0 24,0 21,0 23,7
17,0 20,5 30,0 20,6 23,2 30,8 27,5 30,3 25,5 33,8
a) ¿Cuál es la variable en estudio y de qué tipo es?
b) Realizar los gráficos correspondientes a los datos ordenados en una tabla de frecuencias.
c) Calcular las medidas de centralidad y de dispersión, indicando las unidades correspondientes.
d) A partir del boxplot analizar la distribución de la variable.
SOLUCIÓN
a) X: “altura del complejo QRS en un electrocardiograma de galgo, luego de una competencia, medida en
mm.”
n = 20 (tamaño de muestra)
b) Tabla de frecuencias:
[ ; ) x'i fi Fi hi Hi
17,0 - 20,4 18,7 2 2 0,10 0,10
20,4 - 23,8 22,1 7 9 0,35 0,45
23,8 - 27,2 25,5 5 14 0,25 0,70
27,2 - 30,6 28,9 4 18 0,20 0,90
30,6 - 34,0 32,3 2 20 0,10 1,00
35
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
Los dos gráficos representan las frecuencias simples (absolutas y relativas), se denominan HIS-
TOGRAMAS y también tienen representado un polígono, llamado POLÍGONO DE FRECUENCIAS, que
pasa por los puntos cuyas abscisas son los puntos medios de los intervalos de clase, o las marcas de
clase, y cuyas ordenadas son las frecuencias correspondientes a dicho intervalo. Se cierra el polígono
uniendo con las marcas de clase de dos intervalos ficticios, uno anterior al 1er. intervalo, y otro posterior al
último intervalo. Ambos gráficos representan la densidad de los valores observados de la variable en esta
muestra, ya que la superficie encerrada dentro del histograma es equivalente a la superficie delimitada por
el polígono de frecuencias. La distribución de la variable en esta muestra presenta una leve asimetría po-
sitiva (cola a derecha).
36
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
c) Medidas de centralidad:
NOTA: Observar que se trata de variables continuas agrupadas en intervalos, por lo tanto, la media y la varianza se calculan
utilizando las marcas de clase.
MEDIA ARITMETICA
Σx'i fi 499,8
x̄ = = = 24,99 mm
n 20
MEDIANA
n + 1 21
Pos Me= = =10,5 ⇒Int Me [23,8 ; 27,2)
2 2
PosMe - F(i-1)
Me= Li + c · [ ]
fi
10,5 - 9 1,5
Me= 23,8+ 3,4 · [ ] = 23,8 + 3,4∙ [ ] = 23,8 + 3,4∙0,3= 23,8 + 1,02= 24,82mm
5 5
Es importante diferenciar POSICIÓN DE MEDIANA y cálculo de la MEDIANA en sí. La primera sólo nos
aporta la ubicación del Intervalo Mediana, es un valor en el rango de las frecuencias absolutas acumuladas,
y la segunda es el valor numérico de la Mediana, es un valor en el rango de la variable.
MODO
Intervalo modal: Intervalo con mayor frecuencia relativa simple ⇒ Int. Mo: [ 20,4 ; 23,8)
∆𝟏
Mo= Li + c · [ ]
∆𝟏 + ∆𝟐
Donde
1 f (Max) f (ant)
2 f (Max) f (post)
Li: Límite inferior del intervalo Modal.
c: Amplitud del intervalo Modal.
f(post): Frecuencia absoluta del intervalo posterior al intervalo Modal.
37
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
5 5
Mo= 20,4+ 3,4 · [ ] = 20,4 + 3,4∙ [ ] = 20,4 + 2,429= 22,829mm
5+2 7
Volvamos a analizar la distribución de la variable en esta muestra utilizando las medidas de posición:
Me= 24,82 mm, Mo = 22,829 mm, x = 24,99 mm. Al ser Mo < Me < x , podemos decir que la distribución
tiene ASIMETRÍA POSITIVA.
Medidas de dispersión:
VARIANZA
2 1 (Σx'i fi )2 1 (499,8)2 1
Sx = [Σx'2i fi - ] = [12796,92- ] = ∙306,918= 16,15mm2
n-1 n 19 20 19
DESVÍO ESTÁNDAR
2
SX = √SX = √16,15mm2 = 4,018mm
COEFICIENTE DE VARIACIÓN
S 4,108
C.V.= .100 = .100 = 16,08%
X̄ 24,99
d) BOX PLOT
El boxplot o diagrama de caja lo utilizaremos para analizar la distribución de la variable en esta muestra.
En este cuadro presentamos las medidas resumen obtenidas, a partir de los datos de la muestra, apli-
cando el programa estadístico InfoStat®.
Estadística descriptiva
Variable n Media D.E. Var(n-1) CV Mín Máx Mediana
Altura 20 24,99 4,02 16,15 16,08 17,00 33,80 24,82
[ ; ) fi
10,0 – 10,5 3
10,5 – 11,0 4
11,0 – 11,5 14
11,5 – 12,0 10
38
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
a) Dada la distribución, completar la tabla con todas las frecuencias. 12,0 – 12,5 5
¿Qué frecuencia usaría si necesita valores relativos al tamaño de 12,5 – 13,0 3
muestra? 13,0 – 13,5 1
b) Grafique el histograma y el polígono de frecuencias.
c) Calcule la mediana, la moda, y el coeficiente de variación.
d) ¿Qué puede decir con respecto a la simetría de esta muestra?
e) ¿Cuál es la probabilidad de seleccionar una paloma al azar de este conjunto de palomas, y que su
anchura interorbital mida entre 10 y 10,5 mm?
f) Sabiendo que hemos seleccionado de este conjunto una paloma al azar cuya anchura interorbital
es menor a 11,5 ¿cuál es la probabilidad de que se encuentre entre 10 y 10,5 mm?
g) Sabiendo que hemos seleccionado de este conjunto una paloma al azar cuya anchura interorbital
es menor a 11,5 ¿cuál es la probabilidad de que se encuentre entre 13 y 13,5 mm?
SOLUCIÓN
a)
Si necesitáramos valores relativos al tamaño de muestra, podríamos trabajar tanto con hi como con Hi
b)
c) MEDIANA:
n+1 41
Pos Me= = =20,5 ⇒ Int. Mediana:11,0 ; 11,5)
2 2
MODO: La mayor frecuencia absoluta simple es f 4 = 14, por lo que el intervalo modal es [11,0 ; 11,5), por
lo que
∆1 10
Mo= Li + c · [ ] = 11,0 + 0,5 · [ ] = 11,0 + 0,357= 11,357mm
∆1 +∆2 10 + 4
COEFICIENTE DE VARIACIÓN:
SX 0,6969
CV% = ·100= ·100≅6,04%
X̄ 11,53
d) Como: Mediana = 11,4821 mm ; Modo = 11,357 mm ; X ̅ = 11,53 mm, si ordenamos numéricamente los
resultados tenemos que Media > Mediana > Moda, lo que nos indicaría que es levemente asimétrica posi-
tiva.
Los valores son muy cercanos entre sí, por lo que veremos que sucede con el boxplot:
3
e) p(10<x<10,5)= =0,075
40
f) p( 10<x<10,5⁄x<11,5 )= =0,1428
3
21
i) p( 13<x<13,5⁄x<11,5 ) = 0 / 21 = 0
EJERCICIO 4) Se quiere estudiar la eficacia de un nuevo insecticida para plantas de interior. Se seleccio-
nan 50 plantas y se cuenta el número de hojas que han sido atacadas por la plaga, después de haber
tratado la planta con el nuevo producto. Los resultados son:
N° de hojas atacadas fi
0 6
1 10
2 12
3 8
4 5
5 4
6 3
8 1
40
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
10 1
SOLUCIÓN
a) Definir la variable en estudio y clasificarla.
X: “número de hojas atacadas por la plaga en una planta tratada con el nuevo insecticida”
Variable cuantitativa discreta
b) ¿Cuál es la población en estudio? ¿Y la muestra observada?
Población: plantas de interior
Muestra: las 50 plantas de interior seleccionadas
c) Encontrar todas las medidas de tendencia central que correspondan.
d) Encontrar todas las medidas de variabilidad que correspondan.
Moda 2 hojas atacadas
Mediana 2 hojas atacadas
Media 2,68 hojas atacadas
Rango 10
Desviación estándar 2,133 hojas atacadas
41
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
f) Complete la tabla encontrando las frecuencias relativas y las frecuencias acumuladas (absolutas y re-
lativas).
N° de hojas atacadas fi hi Fi Hi
0 6 0,12 6 0,12
1 10 0,2 16 0,32
2 12 0,24 28 0,56
3 8 0,16 36 0,72
4 5 0,1 41 0,82
5 4 0,08 45 0,9
6 3 0,06 48 0,96
8 1 0,02 49 0,98
10 1 0,02 50 1
g) Calcule el percentil 15 e interprete en función del problema. ¿Cuál es la cantidad de hojas atacadas
que supera el 33% de las plantas?
Para calcular el percentil 15 primero hay que encontrar su posición:
Pos P15 = (n+1)·0,15 = 51·0,15=7,65
A continuación se busca la frecuencia acumulada que contiene a este valor, en nuestro caso F2=16 por lo
tanto, el percentil 15 es igual a 1 hoja atacada, esto significa que el 15% de la las plantas de interiores
tratadas con el nuevo producto tienen a lo sumo una hoja atacada.
Para saber la cantidad de hojas atacadas superadas por el 33% de las plantas, hay que calcular el percentil
67:
Pos P67= 51· 0,67 = 34.17 → P67 = 3 hojas atacadas.
Podríamos decir entonces, que el 33% de las plantas de interior tratadas con el nuevo producto, tiene más
de 3 hojas atacadas por la plaga
42
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
H4=0,72 de las 50 plantas observadas tratadas con el nuevo insecticida, la proporción de plantas que
tienen a lo sumo 3 hojas atacadas es 0,72. También podemos decir que, el 72% de las plantas obser-
vadas de la muestra fueron atacadas a lo sumo en 3 hojas.
i) La empresa que comercializa el nuevo insecticida dice que, el número de hojas atacadas por planta
cuando se aplica este insecticida, sigue la siguiente distribución de probabilidad:
N° de hojas atacadas 0 1 2 3 4 5 6 8 10
p(x) 0,12 0,2 0,25 0,15 0,1 0,08 0,06 0,03 0,01
i.i) Encontrar la esperanza, varianza y desvío estándar de la variable definida.
E(X)= 0·0,12 + 1·0,2 + 2·0,25 + 3·0,15 + 4·0,1 + 5·0,08 + 6·0,06 + 8·0,03 + 10·0,01=
= 0 + 0,2 + 0,5 + 0,45 + 0,4 + 0,4 + 0,36 + 0,24 + 0,1 = 2,65 hojas atacadas
EJERCICIO 5) Asuma que el aumento de peso los cobayos alimentados con un determinado balanceado,
se distribuye normal con media igual a 105 g y desvío estándar igual a 10,5 g.
a) ¿Con qué probabilidad un cobayo tomado al azar tendrá un aumento de peso de al menos 104 g?
b) ¿Qué valor de aumento de peso no será superado por el 95% de los cobayos?
Si se extrae de esta población de cobayos una muestra aleatoria de tamaño 16:
c) ¿Cuál es la probabilidad de que los cobayos de esta muestra tengan un aumento de peso promedio
inferior a 106 g?
d)¿Qué valor del aumento medio de peso no será superado por el 95% de los cobayos en muestras de
este tamaño?
En este tipo de ejercicios, generalmente nos dan información de una variable (aumento de peso, en g, de
un cobayo, X ) y nos piden resolver cálculos de probabilidad para esa variable, o para la variable promedio
(aumento de peso medio o promedio (en g) de 16 cobayos, X16 ). Las distribuciones de estas dos variables
aleatorias son: X ~N 105;110,25 X16 ~N 105;6,89062
En los gráficos siguientes se representa sendas muestras aleatorias de tamaño 10.000 cada una, a la
izquierda la distribución del aumento de peso en un cobayo, y a la derecha la de aumento de peso medio
o promedio de 16 cobayos.
43
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
SOLUCIÓN
a) En este caso estamos calculando la probabilidad de que un cobayo pese 104 g o más (al menos 104 g),
nos interesa la distribución de X . Entonces se procede:
104-105
P(X≥104)=P (Z≥ ) =P(Z≥-0,095)=1-P(Z<-0,095)
10,5
Entonces, buscamos en la tabla de la distribución normal estándar aproximando –0,095 a –0,1 y obtenemos:
P(X≥104)≅1-P(Z<-0,10)≅1-0,4602≅0,5398
Un cobayo de la muestra tendrá un aumento de peso de al menos 104 g con una probabilidad de 0,54.
b) En este caso nos preguntan sobre el aumento de peso medio (o promedio) de los cobayos de una muestra
de tamaño 16, entonces se debe usar la distribución de X16 .
106 - 105
P(X̄ 16 <106)=P (Z< ) =P(Z<0,38)=0,6480
10,5
⁄
√16
La probabilidad de que el promedio de los individuos de una muestra de tamaño 16 sea menor que 106 g es
igual a 0,65.
c) Se quiere saber qué valor no será superado, con una probabilidad 0,95, por un cobayo tomado al azar. En
este caso interesa la distribución X , entonces, por un lado sabemos que:
xi -105
P(X≤xi )=0,95 → P (Z≤ ) =0,95
10,5
Por el otro, en la distribución normal estándar P(Z ≤ z0,95 )=0,95, sabemos que z0,95= 1,64; entonces igualando
z0,95 con
xi -105
10,5
, y despejando xi de dicha igualdad, 1,64=
xi -105
10,5
, se obtiene el valor de xi .
xi =105+1,64⋅10,5=122,22g.
El valor del aumento de peso que no será superado por el 95% de los cobayos, es 122,2 g.
44
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
d) Esta pregunta, aunque similar a la anterior, se refiere al valor de aumento de peso medio de una muestra
de tamaño 16, entonces, empleamos la distribución de X16 .
xi -105
P(X̄ 16 ≤xi )=0,95→P (Z ≤ ) = 0,95
10,5
⁄
√16
x -105
i
Al igual que antes, igualando z0,95 con 10,5 , y despejando xi se obtiene la solución:
⁄
√16
xi =105+1,64⋅2,625=109,305g.
El valor del aumento medio de peso que no será superado por el 95% de los cobayos en muestras de
tamaño 16 es 109,3 g.
Nota: la solución en d) está más cerca de la media de su distribución que la solución en b) de la suya, aunque ambas
soluciones representen desde el punto de vista probabilístico lo mismo.
45
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
PROBLEMAS PROPUESTOS
EJERCICIO 1) Clasificar las siguientes variables en CUALITATIVAS (NOMINALES u ORDINALES) o
CUANTITATIVAS (DISCRETAS o CONTINUAS) y nombrar de cada una la unidad de observación
a) Peso, en g, de pelo esquilado a un conejo de Angora.
b) Cantidad de lámparas de 40 W fabricadas en un día de trabajo.
c) Valor calórico de la grasa de la leche de una vaca.
d) Tiempo de incubación del sarampión en una persona, en días.
e) Color de ojos de un niño de 10 años nacido en la Provincia de Córdoba.
f) Color de pelaje en un equino.
g) Número de insectos de Trifolium repens, encontrados por parcela.
h) Cantidad de caninos de raza Bóxer con linfosarcoma multicéntrico por distrito, en la Provincia de
Buenos Aires.
i) Efecto de una droga en un canino.
j) Número de cachorros nacidos por camada.
k) Número de llamados telefónicos que recibe una central telefónica por mes.
l) Alzada de un caballo del haras "La Biznaga".
m) Color de una rosa.
n) Circunferencia torácica de un lechón recién parido, expresado en cm.
o) Cantidad de tornillos producidos en ocho horas de trabajo.
p) Volumen de nafta despachada por una compañía petrolera en una semana.
q) Nivel educacional alcanzado por un individuo.
r) Número de errores cometidos por un estudiante en un examen de elección múltiple.
s) Distancia recorrida por un neumático de un vehículo, hasta el primer pinchazo.
t) Nacionalidad de un individuo.
u) Rendimiento de maíz en un campo determinado en la Provincia de Buenos Aires.
v) Número de niños nacidos en un hospital el primer día del año.
EJERCICIO 2) En veintiséis tambos se registró, en el año 1988, la cantidad de partos distócicos en la raza
Holando Argentino, obteniéndose los siguientes datos:
4 3 5 7 4 2 1 0 6 3 5 6 3
0 3 1 2 1 3 6 0 4 3 2 1 2
EJERCICIO 3) Los siguientes datos corresponden a la medición en sangre de GPT (glutámico pirúvico
transaminasa, enzima que demuestra toxicidad hepática) en felinos sometidos a una dosis tóxica mínima
de un nuevo antiparasitario externo:
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
EJERCICIO 7) Los siguientes datos corresponden a los diámetros cardíacos, en mm, medidos en radio-
grafías de tórax de 100 adultos normales:
Intervalos frecuencias
a) Definir la variable y clasificarla.
80,5 - 90,5 8
b) La población en estudio es ..................................................
c) La unidad de observación es ............................................... 90,5 - 100,5 15
d) Completar la tabla de distribución de frecuencias y realizar los grá- 100,5 - 110,5 21
ficos correspondientes a las fi y Hi. 110,5 - 120,5 23
e) Interpretar f2 , F5 , h4 y H6 120,5 - 130,5 16
f) Calcular la media y la varianza. 130,5 - 140,5 9
g) Determinar los intervalos mediana y modal, y calcular las medidas 140,5 - 150,5 8
correspondientes a cada uno.
h) Comparando los valores de las medidas de posición, ¿podemos concluir que la distribución es simé-
trica?
47
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
EJERCICIO 8) Se evaluaron 4 dosis de Nitrógeno, N, (0, 30, 60 y 90 kg/ha) en parcelas de trigo, en las
que se midió el rendimiento obtenido expresado en kg/ha. A continuación, se presentan los diagramas de
caja correspondientes a cada tratamiento.
EJERCICIO 9) Para estudiar las palabras usuales, usted necesita una muestra de las páginas tomadas de
un libro dado. Diseñe brevemente un procedimiento de muestreo que pudiera usar. ¿Qué haría usted con
las páginas que tienen grabados sobre ellas o con aquellas que están llenas sólo parcialmente?
EJERCICIO 10) En un estudio sobre parasitismo un grupo de investigadores registra la cantidad de huevos
por nido parasitados en 1700 nidos. Los datos se registran en la siguiente tabla:
48
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
EJERCICIO 11) Se conocen los pesos al destete (X) de 15 lechones (en Kg) de cada una de dos granjas
diferentes (granja A y granja B).
EJERCICIO 12) Se realizó un experimento con lechones híbridos, criados en sistema extensivo ( al aire
libre en piso de tierra) en la provincia de Buenos Aires, para analizar la ganancia diaria de peso, en gramos.
El objetivo final de este experimento es poder comparar esta variable con la correspondiente a lechones
criados en sistema intensivo ( en piso de concreto). De los primeros se obtuvieron los siguientes resultados:
xi [0;50) [50;100) [100;150) [150;200) [200;250]
Fi 1 4 9 15 16
49
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
c) Calcular el modo, la mediana y la media. ¿Se puede decir que la distribución es simétrica?
d) ¿Cuál es el aumento de peso no alcanzado por el 25% de los lechones?
e) Si se espera que dicha ganancia de peso aumente en un 15%, ¿cómo se vería afectada la me-
diana? ¿Y la varianza? Justifique utilizando propiedades.
f) Si se supone que la variable se distribuye normalmente, con media 180 g y desvío estándar 15 g,
¿cuál es la probabilidad que la ganancia de peso medio de los lechones supere los 182 g en una
muestra de 40?
EJERCICIO 13) La distribución del tiempo de respuesta obtenido en la aplicación de prostaglandinas a hem-
bras caninas preñadas entre 35 y 55 días es normal con media 60 horas y con desvío de 15 horas.
a) Definir la variable en estudio
b) Detallar su distribución
c) 1)¿Cuál es la probabilidad de obtener la reacción luego de 50 horas?
2)¿Cuál es la probabilidad de obtener la reacción antes de 30 horas?
3)¿Cuál es la probabilidad de obtener la reacción entre 30 y 60 horas?
4)¿Cuál es la probabilidad de obtener la reacción luego de 90 horas?
5)¿A partir de qué tiempo la probabilidad de obtener reacción es del 30%?
d)Si se toma una muestra de 16 hembras preñadas, ¿cuál es la probabilidad de que, en promedio, tengan
la reacción:
1)luego de 50 horas?
2)antes de 30 horas?
3)entre 30 y 60 horas?
4)luego de 90 horas?
5)¿A partir de qué tiempo medio la probabilidad de obtener reacción es del 30%?
EJERCICIO 14) La altura de las plantas de una población de Trébol Rojo a las 5 semanas de ser plantadas
se distribuye normalmente con media 3,2 cm y desvío estándar 1,8 cm.
a) ¿Cuál es la probabilidad de que una de dichas plantas a las 5 semanas mida más de 3,5cm?
b) ¿Qué altura es alcanzada por el 20% de las plantas?
c) Si se toma una muestra de 3 plantas, ¿cuál es la probabilidad de que las tres tengan altura superior
a 3,5cm?
d) Si se toma una muestra de 20 plantas:
i. ¿Cuál es la probabilidad de que la media sea superior a 3,3cm?
ii. El resultado de la probabilidad calculada en el punto anterior, ¿es exacto o aproximado?
e) Si se toman muestras de 50, ¿qué altura media es superada por el 15% de las muestras?
50
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
* GLOSARIO
Teorema Central del Límite (TCL). Muestra aleatoria. Unidad de muestreo. Tamaño de muestra. Estimador
puntual.
PROBLEMAS RESUELTOS
EJERCICIO 1) Se está investigando el efecto de una droga para reducir el nivel promedio de glucosa en sangre
(glucemia, en mg/ml), en una línea de ratas diabéticas. Para ello se tomó una muestra de 40 ratas y se trató
con la droga, con la suposición de que la probabilidad de que el promedio sea a lo sumo 2 mg/ml (valor
promedio de la glucemia en ratas sin tratar) sea alta (por ejemplo, mayor a 0,8).
Se desconoce la distribución del nivel de glucemia para las ratas tratadas con la droga, pero se sabe que tiene
media 1,7 mg/ml y desvío 0,8 mg/ml. ¿Se cumple la suposición de los investigadores?
SOLUCIÓN
Tenemos:
X: “glucemia de una rata diabética tratada con la droga, medida en mg/ml.” (Con distribución desconocida,
siendo =1,7 mg/ml y = 0,8 mg/ml).
X : “glucemia media de una muestra de ratas diabéticas tratadas con la droga, medida en mg/ml.”
Nos interesa calcular:
X̄ - μ 2 - 1,7 0,3
P(X̄ ≤2)≅ P (Z ≤ σ ) ≅ P (Z ≤ ) ≅ P (Z ≤ ) ≅ P(Z≤2,31)≅0,98956
⁄ n 0,8 0,13
√ ⁄
√40
Como la probabilidad obtenida es 0,98956, o sea una probabilidad alta, se cumpliría con la suposición de los
investigadores.
EJERCICIO 2) El peso, en gramos, de pollitos blancos de raza Leghorn es una variable aleatoria con función
de probabilidad dada por:
1
s
iX2
80
;3
80
fX
10
0
0 siX 2
80
;38
0
0 s
i X2
80
1 280
La función de distribución es: FX x si28
0X38
0
1
0
0 1
00
1
siX38
0
50
-TEOREMA CENTRAL DEL LÍMITE-
Guía de Trabajos Prácticos
2023 · Bioestadística
a) Se elige un pollito al azar de la población total en estudio. Calcular la probabilidad de que su peso
sea mayor que 330 g.
b) Se eligen al azar 10 pollitos en forma independiente. Calcular la probabilidad de elegir exactamente
6 pollitos cuyo peso sea mayor que 330 g. ¿Y cuál es la probabilidad de que haya menos de 6?
c) Sabiendo que la media de los pesos de los pollitos blancos de raza Leghorn es 330 g y la varianza
de los pesos es 833,33 g2, y se eligen al azar en forma independiente 36 pollitos, calcular la pro-
babilidad de que el peso promedio sea mayor a 330 g. Justificar el cálculo hecho.
SOLUCIÓN
1 280
a) P(X>330)=P(X≥330)=1-F(330)=1- [ ∙330 - ] = 1 - 0,5= 0,5
100 100
La primera igualdad se debe a que la variable es continua.
b) Al elegir 10 pollitos en forma independiente, y considerar como variable Y: “cantidad de pollitos blancos
de raza Leghorn con peso superior a 330g, en 10 pollitos”, se analiza si cumple con los requisitos para ser
considerada binomial. En este punto, sería conveniente que usted escriba los supuestos de la binomial,
aplicándolos a esta situación práctica. Verá que se cumplen, y podemos escribir lo siguiente:
YBi (n=10; p=0,5), por lo que se resuelve:
P(Y=6)=P(Y≤6)-P(Y≤5)=0,8281-0,6230=0,2051
Para responder la siguiente pregunta, hay que plantear P(Y<6)=P(Y≤5), esta igualdad vale porque la va-
riable Y es discreta, por lo tanto, la probabilidad es 0.6230
c) Como X tiene distribución uniforme (la función de densidad es una función constante) con =330 g y 2=
833,33 g2, entonces podemos buscar la distribución del peso promedio aplicando el Teorema Central del
Límite, con lo que nos queda que:
σ2 833,33
X̄ 36 ≈ N (μ=330; σ2X̄ = = =23,148)
n 36
330-330
P(X̄ 36 >330)≅P Z> ≅P(Z>0)≅1-P(Z≤0)≅1-0,5≅0,5
√833,33
( 36 )
EJERCICIO 3) En los últimos años se desarrollan actividades alternativas de cría, basándose en especies
animales autóctonas de la zona. Este es el caso de la cría del lagarto overo, en alguna localidad de la
Mesopotamia argentina.
a) Suponga que, por bibliografía consultada, la longitud de la cola en los lagartos overos hembras juveni-
les es una variable aleatoria con distribución desconocida cuya media es 0,45 m y su varianza es 0,01 m2.
A partir de esta información y considerando que se toma una muestra de 45 ejemplares, ¿puede definir la
distribución de la longitud media de la cola?
b) Si para reproducción se dejan aquellas hembras con longitudes medias de cola superiores a 0,48 m,
¿qué porcentaje de las hembras de la muestra serán seleccionadas para el plantel reproductor?
SOLUCIÓN
51
-TEOREMA CENTRAL DEL LÍMITE-
Guía de Trabajos Prácticos
2023 · Bioestadística
PROBLEMAS PROPUESTOS
EJERCICIO 1) El peso de los perros adultos de raza Labrador Retriever es una variable aleatoria con media
30.7 kg y desviación típica de 1.9 kg. Si consideramos muestras de 80 de estos animales:
a) ¿puede decir que distribución exacta tiene la media muestral para una muestra de 80? ¿por qué?
b) ¿cuál es la probabilidad de que el peso promedio de los 80 animales que conforman una muestra sea
a lo sumo 32 kg?
EJERCICIO 2) La proporción de huevos marrones puestos por gallinas hibridas (mezcla de raza Rhode Island
Red y la White Star) es 0.48. Si en un establecimiento se seleccionan 1200 huevos, ¿Cuál es la probabilidad
de que a lo sumo el 45% de los huevos sean marrones?
EJERCICIO 3) La distribución del peso al nacer de los pollitos Camperos del INTA tiene una media de 55g y
desvió estandar de 5g. Se selecciona una muestra aleatoria de 60 pollitos.
a) ¿Cuál es la probabilidad de que el peso medio del lote
a.1) sea superior a 58g?
a.2) Se encuentre entre 52g y 56g?
b) ¿Cuál es el peso medio no alcanzado por el 25% de las muestras de igual tamaño de pollitos?
EJERCICIO 4) Si el peso de los novillos de la raza Aberdeen Angus es una variable con una media de 360
Kg y un desvío estándar de 18 Kg.
a) Calcular la probabilidad de que el promedio de 49 novillos Aberdeen Angus, elegidos al azar, pesen
entre 380 y 390 Kg .
b) Al tomar una muestra al azar de 36 novillos Aberdeen Angus, calcular la probabilidad de que el
promedio de la misma esté entre 365 y 370 Kg.
52
-TEOREMA CENTRAL DEL LÍMITE-
Guía de Trabajos Prácticos
2023 · Bioestadística
ESTIMACIÓN
* OBJETIVOS ESPECÍFICOS
Conocer las características deseables de los estimadores puntuales.
Aplicar conceptos de inferencia estadística en el contexto de los fenómenos biológicos.
Obtener e interpretar estimaciones puntuales y por intervalos de confianza de los parámetros que
caracterizan las distribuciones de probabilidad del fenómeno en estudio.
* CONTENIDOS TEMÁTICOS
Métodos para encontrar estimadores.
Propiedades de los estimadores
Estimación puntual para
a) la media ()
b) la varianza (σ2)
c) la proporción poblacional (p)
Estimación por intervalo de confianza (IC) para: a) en poblaciones normales cuando 2 es conocida;
b) en poblaciones normales cuando 2 es desconocida; c) en poblaciones grandes; d) 2 e poblaciones
normales; y e) p en poblaciones grandes. Límite superior e inferior del IC. Nivel de confianza 100(1-)%.
Margen de error, relación con el tamaño de la muestra. Aplicaciones.
* GLOSARIO
Estimador. Estimación puntual. Estimación por Intervalo de Confianza. Condiciones para elección de variable
pivotal. Error estándar. Tamaño muestral.
PROBLEMAS RESUELTOS
EJERCICIO 1) Se toma una muestra de 18 caninos de la ciudad de Neuquén. A cada uno se le extrae sangre,
se separa el plasma de la misma; y finalmente se mide la concentración de colesterol libre, que presenta una
distribución normal. Obteniéndose, a partir de los 18 registros de colesterol libre, un promedio de 70 mg/100
cm3 de colesterol libre, y un desvío estándar de 15 mg/100 cm3.
Antes de resolver el problema, vemos que tenemos que estimar intervalos de confianza de nivel 99% y 90%
para la media poblacional, , sin conocer 2 (varianza poblacional), entonces se emplea como la variable pivotal
a la siguiente t de Student:
X̄ - μ
t= tn-1
S
√n
Esta es una variable auxiliar basada en la distribución de X̄ que nos será de utilidad para obtener los
estimadores del intervalo de confianza para , no depende de ningún parámetro desconocido; sólo es función
de las observaciones de la muestra y de , y, además, tiene distribución conocida.
Para obtener las expresiones de los límites interior (LI) y superior (LS), debemos plantear la siguiente
igualdad:
X̄ - μ
𝑃 (tn-1; α ≤ ≤ tn-1; 1-α ) =1-α
2 S⁄ 2
√n
53
-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística
Por conveniencia, ya que la distribución t de Student es simétrica, emplearemos - tn-1; 1-α en lugar de tn-1; α .
2 2
Entonces:
X̄ - μ
P (- tn-1; 1-α ≤ ≤ tn-1; 1-α ) =1-α
2 S⁄ 2
√n
Despejando desde el término entre paréntesis de la igualdad anterior se obtienen las expresiones de los
límites inferior y superior del IC.
-tn-1;1-α/2 · S⁄ ≤ X
̅ -μ ≤ tn-1;1-α/2 · S⁄ Primero despejamos la diferencia que contiene al parámetro
√n √n
̅ - tn-1;1-α/2 · S⁄ ≤ - µ ≤ - X
-X ̅ + tn-1;1-α/2 · S⁄ Luego la media muestral
√n √n
̅ + tn-1;1-α/2 · S⁄ ≥ µ ≥ X
X ̅ - tn-1;1-α/2 · S⁄
√n √n Multiplicamos por (-1)
̅ - tn-1;1-α/2· S⁄ ≤ µ ≤ X
X ̅ + tn-1;1-α/2 · S⁄ Reordenamos
√n √n
S S
Entonces, el intervalo de confianza está dado por: [X̄ - tn-1;1-α . ; X̄ + tn-1;1-α . ], cuya expresión puede
2 √n 2 √n
S
resumirse en: X̄ ∓ tn-1; 1-α ⋅ (1)
2 √n
Notemos que tanto el LI como el LS son variables aleatorias ya que dependen de las observaciones de la
muestra (para calcular X y S), del nivel de confianza, y del tamaño de la muestra; lo que permitiría la siguiente
expresión probabilística:
S S
P (X̄ - tn-1; 1-α ⋅ ≤ μ ≤ X̄ + tn-1; 1-α ⋅ ) =1-α
2 √n 2 √n
Sin embargo, cuando X y S se reemplazan por los valores obtenidos a partir de la muestra, el LI y el LS ya no
son variables pues toman un único valor dependiendo de la muestra. Esto es lo que limita, en el momento de
la conclusión, la interpretación probabilística del intervalo de confianza obtenido.
Entonces, siempre la conclusión de los IC se expresa desde el punto de vista del nivel de confianza que se
haya empleado en la estimación del intervalo. Esto debería quedar claro en las conclusiones siguientes.
SOLUCIÓN
a) Un IC99% para con 2 desconocida. Datos: n = 18 (tamaño de la muestra); x = 70 mg/100 cm3;
S = 15 mg/100 cm3; y nivel de confianza 99%, o sea 1- = 0,99.
Por lo tanto, el valor tabular que emplearemos es tn-1; 1-α = t17; 0,995 = 2,898.
2
Notemos aquí que hay tres formas de expresar el valor tabular 1) simbólico en general: tn-1; 1-α , 2) simbólico
2
en particular (o sea, teniendo en cuenta el tamaño muestral y en nivel de confianza del ejercicio) t17; 0,995 ,
3) mediante su valor numérico: 2,898.
Nota: en el contexto del presente curso de estadística (al resolver ejercicios, parciales o finales), siempre que sea
posible, se debe informar tanto el valor tabular “simbólico en particular” como su “valor numérico”.
15
Reemplazando en (1) tenemos: 70∓ 2,898⋅ .
√18
Entonces, un intervalo de confianza del 99% para es [59,75 mg/100 cm3; 80,25 mg/100 cm3]
CONCLUSIÓN: Con un nivel de confianza del 99%, se espera que el intervalo [59,75 mg/100 cm3; 80,25
mg/100 cm3] cubra al verdadero valor de la media de la concentración de colesterol libre en el plasma
sanguíneo de la población de caninos de la ciudad de Neuquén.
54
-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística
Nota: Debemos observar que se ha concluido empleando el concepto de confianza, y no se ha usado el término
probabilidad. Una forma de interpretar el concepto de confianza (o confiabilidad) aplicado al ejercicio resuelto sería la
siguiente. Supongamos que tomáramos 1000 muestras de tamaño 18, y con cada una estimamos un intervalo de
confianza del 99% para , con lo cual tendríamos 1000 IC99%. Entonces, una confianza del 99% significa que
“esperamos” que 990 de los 1000 IC cubran al parámetro y sólo 10 no lo cubran.
b) En este caso, 1- = 0,90; entonces tn-1; 1-α = t17; 0,95 = 1,74. Los otros datos son iguales al punto anterior.
2
15
Reemplazando en (1) tenemos, ahora: 70∓ 1,74⋅ .
√18
Entonces, un intervalo de confianza del 90% para es [63,85 mg/100 cm3; 76,15 mg/100 cm3]
CONCLUSIÓN: Con un nivel de confianza del 90%, se espera que el intervalo [63,85 mg/100 cm 3; 76,15
mg/100 cm3] cubra al verdadero valor de la media de la concentración de colesterol libre en el plasma
sanguíneo de la población de caninos de la ciudad de Neuquén.
c) El IC90% para es de menor amplitud (diferencia entre el límite superior e inferior, LS – LI) que el IC99%
para , pero también es menos confiable. Eso será una constante para un n fijo, a mayor confianza, mayor
amplitud. Si consideráramos que la amplitud del intervalo se relaciona con su precisión, entonces hay una
relación inversa entre la amplitud del intervalo y la precisión del mismo.
Para hacer una estimación puntual primero hay que recordar que el estimador de la varianza poblacional es
1 n
la varianza muestral calculada a través de la fórmula S 2 ( xi x )2 que es una variable aleatoria, por lo
n 1 i 1
tanto, la estimación puntual (un número) es el valor que obtengo en la muestra utilizando dicha fórmula, en
este caso, s 1225(Ul / ml )
2 2
Para estimar la varianza poblacional ( 2) mediante un intervalo de confianza, primero debemos observar que
la variable aleatoria es la indicada para ser usada como variable pivotal.
2
(n-1)⋅S2
𝜒 = 2
n21
σ2
Como en el caso anterior, para obtener las expresiones de los límites del intervalo de confianza, debemos
plantear la siguiente expresión:
2
(n-1)⋅S
𝑃 (χ2n-1; α ≤ ≤ χ2n-1; 1- α ) =1-α
2 σ2 2
El mecanismo para obtener las expresiones del IC para 2 es bastante sencilla pero requiere cierto cuidado.
Sabemos que esta variable aleatoria no es simétrica, con lo cual no podemos usar un único valor tabular.
Despejando se obtiene el siguiente intervalo:
2 2
(n-1)⋅S 2
(n-1)⋅S
≤ σ ≤ (2)
χ2 α χ2 α
n-1; 1- n-1;
2 2
SOLUCIÓN
Datos: n = 15; x = 96 UI/ml; s = 35 UI/ml ; y 1- = 0,95.
55
-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística
CONCLUSIÓN: Se espera con una confianza del 95% que el intervalo [656,58 (UI/ml)2; 3046,72 (U/ml)2] cubra
o abarque a la varianza poblacional de la concentración de amilasa en suero en la población de individuos
aparentemente normales.
¿Qué hubiera ocurrido si en el ejercicio nos hubieran solicitado un intervalo de confianza para el desvío
estándar poblacional ()?
En principio nada muy distinto. Primero se obtiene un intervalo de confianza para 2 y se arma la conclusión
para esta, luego se obtiene la raíz cuadrada de los LI y LS, y finalmente se concluye para el desvío.
Hubiera resultado ser algo así:
Para el ejercicio 2), estime el desvío estándar poblacional mediante un intervalo de confianza el 95%.
Un IC95% para : a) LI= √656,58=25,62 UI/ml y b) LS= √3046,72=55,20 UI/ml
CONCLUSIÓN: Se espera con una confianza del 95% que el intervalo [25,62 UI/ml; 55,20 U/ml] cubra al
verdadero valor del desvío estándar de la concentración de amilasa en suero en la población de individuos
aparentemente normales.
EJERCICIO 3) Un fabricante de material de laboratorio desea saber qué proporción de sus productos no
contienen fallas. Estimar puntualmente y mediante un intervalo de confianza la proporción de material sin fallas
si se sabe que en una muestra de 100 unidades producidas se contó sólo 4 unidades con fallas. Usar un nivel
de confianza del 90% (1 - = 0,90).
En este caso, la variable pivotal a emplear es:
p̂ - p
Z= ≈ N(0; 1)
√p ̂ (1-p
̂ )
n
Usando el mismo razonamiento que antes se pueden obtener las expresiones de los límites inferior y
p̂ (1-p̂ )
superior del IC para p, que presentamos en la siguiente expresión: p̂ ∓Z1 - α ⋅√ (3)
2 n
SOLUCIÓN
Datos: n = 100; número de unidades con fallas = 4; 1 - = 0,90
#casosfavorables 96
Estimación puntual: p̂ = = , o sea p̂ =0,96
tamaño de muestra 100
CONCLUSIÓN: Con un nivel de confianza del 90%, se espera que el intervalo [0,928; 0,992] cubra al valor de
la proporción poblacional de unidades producidas sin fallas correspondiente al fabricante de material de
laboratorio.
56
-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística
margen de error no mayor a 5%, con una confiabilidad del 95%. Se sabe, por un muestreo piloto anterior, que
de una muestra de 100 individuos, 35 resultaron machos.
Antes de resolver el ejercicio, veamos algunos conceptos asociados a este problema. Llamamos margen de
error a la semiamplitud del intervalo de confianza y lo simbolizamos con la letra d.
Si la amplitud a = (LS – LI), entonces la semiamplitud d = (LS – LI) / 2. En los casos de los Intervalos de
Confianza expresados en (1) y (3), la semiamplitud coincide con el término a la derecha del signo . Entonces,
nos podemos dar cuenta, analizando la función semiamplitud, de qué factores depende y cómo depende de
estos.
En el presente problema, el parámetro de interés es la proporción poblacional, por lo tanto se trabaja con el
intervalo presentado en (3), del cual se obtiene:
p̂ (1-p̂ )
d= Z1-α ⋅√ (4)
2 n
Observando (4) podemos ver que el nivel de confianza influye en el valor de z. La experiencia piloto nos permite
usar un valor de p̂ ; el margen de error, d, es igual a 0,05. Por lo tanto, sólo se debe despejar n para tener una
respuesta al problema.
SOLUCIÓN
Datos: d = 0,05; 1- = 0,95; xm = 35 (número de machos o #casos favorables); y tamaño de la muestra
piloto np = 100.
Como el enunciado dice: “... un margen de error no mayor a 5%...”, entonces deberíamos plantear que
p̂ (1-p̂ )
d≥ Z1-α ⋅√ (5)
2 n
Despejando n desde (5) obtenemos:
z1-α 2
2
n0 ≥ ( ) ⋅p̂ (1-p̂ ) (6)
d
[Notaremos n0 al tamaño de muestra calculado para satisfacer los requisitos de “margen de error” y “nivel
de confianza” deseados.]
Reemplazando en (6) con los datos, y recordando que z1-α =z0,975 = 1,96, y resolviendo para la igualdad:
2
1,96 2
n0 = ( ) ∙0,35∙0,65= 349,58 ≅ 350 moscas
0,05
Respuesta: el tamaño de la muestra debe ser como mínimo de 350 moscas para tener un margen de error de
a lo sumo 0,05 y una confianza de por lo menos 95%.
[Siempre que sea necesario redondear al buscar el tamaño de muestra, lo haremos redondeando
hacia el entero superior.]
Nota: Muchas veces, antes de realizar un muestreo para estimar con cierto margen de error un parámetro, no se cuenta
con información relativa a la variación de la población. En tal caso, se puede adoptar alguna de las siguientes opciones: a)
hacer un muestreo piloto, b) tomar información de bibliografía, c) consensuar un valor sobre la base de la experiencia del
investigador en el tema o tratando de considerar algún caso extremo.
(Ejemplo: p̂ =0,5 en caso de no contar con información previa)
EJERCICIO 5) Se desea estimar el peso promedio de materia verde por m2 en un campo de 4 ha, sembrado
con alfalfa. Se admite un error en la estimación (sinónimo de margen de error) de 0,5 Kg, con una confianza
del 99%. Dado que no se dispone de información anterior se procedió a seleccionar una muestra piloto de 30
unidades (o sea, 30 m2) y se calculó s = 5,4 kg. Determinar el tamaño de muestra adecuado a las restricciones
enunciadas suponiendo que la variable registrada se distribuye normalmente y definir: a) Variable y población
en estudio; y b) Unidad de muestreo.
En este ejercicio se agrega un concepto que es de utilidad cuando las poblaciones son de tamaño finito.
Generalmente, consideramos que N (el tamaño de la población) es infinito, pero en muchas situaciones, como
en la del ejemplo, la población tiene un tamaño finito. Entonces, para considerar esta situación se debe usar la
siguiente corrección:
57
-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística
n0
nf =n
1+ 0
N
Notemos que ahora se denomina nf al tamaño de muestra requerido para satisfacer las restricciones de margen
de error y nivel de confianza cuando el tamaño de la población es finito.
SOLUCIÓN
Datos: N = 4 ha = 40.000 m2 (tamaño de la población); np = 30 m2 (tamaño de la muestra piloto);
s = 5,4 kg2; 1- = 0,99 t29; 0,995 2,756; y d = 0,5 Kg
a) Variable en estudio: peso de materia verde en una parcela de 1 m2 expresado en Kg sembrada con alfalfa.
Población en estudio: 40.000 m2 sembrados con alfalfa de un campo.
b) Unidad de muestreo: una parcela de 1 m2 sembrada con alfalfa.
Debemos estimar un nuevo tamaño muestral, utilizaremos una muestra piloto de 30 unidades para su cálculo:
σ s
d=tn-1;1-α/2 ≅ tn-1;1-α/2
√n √n
2
tn-1;1-α/2 ∙S 2,756⋅5,4 2
n0 = ( ) =( ) =885,94
d 0,5
En este punto sería necesario aproximar hacia el entero superior, pero como emplearemos la fórmula de
corrección por tamaño finito de la población, la aproximación se pospone hasta haber realizado el siguiente
cálculo:
885,94
nf = = 866,74 867 parcelas de 1 m2
885,94
1+
40000
El tamaño de la muestra para una población de tamaño finito debe ser de 867 parcelas de 1m2 para
satisfacer las restricciones (margen de error y confiabilidad) en la estimación.
EJERCICIO 6) En los últimos años se desarrollan actividades alternativas de cría, basándose en especies
animales autóctonas de la zona. Este es el caso de la cría del lagarto overo, en alguna localidad de la
Mesopotamia argentina. En un estudio realizado en un centro de reproducción y cría, de dicha localidad,
se midieron 45 colas de lagartos hembra juveniles, obteniéndose una media de 0,5 m y una varianza de
0,008 m2. La variable de interés se distribuye en forma normal.
a) Estimar, utilizando un nivel del 95%, la longitud media de la cola.
b) Si usted hubiera decidido realizar el intervalo con un nivel de confianza del 90%, ¿qué modificación
hubiera tenido la amplitud del mismo? Justifique su respuesta y realice los cálculos correspondientes.
c) Suponga que, por bibliografía consultada, la longitud de la cola en los lagartos overos hembras juveniles
es una variable aleatoria con distribución desconocida cuya media es 0,45 m y su varianza es 0,01 m 2.
c.1) A partir de esta información y considerando que tiene los mismos elementos en su muestra, ¿puede
definir la distribución de la longitud media de la cola?
c.2) Si para reproducción se dejan aquellas hembras con longitudes medias de cola superiores a 0,48 m,
¿qué porcentaje de las hembras de la muestra serán seleccionadas para el plantel reproductor?
c.3) Si se deseara que la amplitud del intervalo para la estimación de la media poblacional de la longitud
de la cola de lagarto overos resultara la mitad de la lograda en el ítem a), manteniendo el nivel de confianza
utilizado, ¿cuál debería ser el tamaño muestral?
SOLUCIÓN
a) La variable en estudio es X: “Longitud de la cola de un lagarto overo hembra del centro de reproducción
y cría de algún lugar de la Mesopotamia argentina”, y está medida en m. Los datos que tenemos son: n=45;
2
X̄ =0,5m ; S =0,008m2 , por lo que S=0,089m
58
-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística
Conclusión: Con un 95% de confianza se espera que el intervalo [0,473 m; 0,525 m] cubra al verdadero
valor medio de la longitud de la cola de la población de lagartos overos hembras juveniles del centro de
cría y reproducción de alguna localidad de la Mesopotamia argentina.
b) La amplitud (simbolizada con a) del intervalo anterior la calculamos restando los valores de los límites
obtenidos: a = LS – LI = 0,525 – 0,473 = 0,052
Veamos qué ocurre si la confianza disminuye como en este caso, ya que pasamos a tener 90%.
Recordemos que la semiamplitud del intervalo corresponde al producto entre el valor tabular de la variable
pivotal y el error estándar de la media, en este caso, dado que estamos armando un intervalo para la media,
quedando así:
s
d= tn-1;1-α ∙
2 √n
c.1) Sí, porque se puede aplicar el Teorema Central del Límite, quedando:
σ2 0,01
̅ )=μ=0,45m ; V(X
E(X ̅ )= X = =0,0002m2 ⇒ X ̅ ≈ N(0,45m;0,0002m2 )
n 45
0,48-0,45
𝐜.2) P(X̄ >0,48)= P Z> = P(Z>2,01)= 1 - P(Z≤2,01)= 1 - 0,97778= 0,02222
√ 0,01
( 45 )
c.3) La longitud del intervalo utilizado para estimar la media de la longitud de la cola de lagarto overos, con
nivel 95% es: a = 0,525 m - 0,473 m = 0,052m
Si se desea reducir esta amplitud a la mitad, entonces: a’= 0,052m/2 = 0,026m, siendo d’= 0,013m.
Dado que estamos utilizando el Teorema Central del Límite y la variable pivotal es una Z, la fórmula para
calcular el n es la siguiente:
2
Z1-α ∙ S 1,96 ∙ 0,089 2
2
n= ( ) =( ) =180,05 ≅181 lagartos
d 0,013
PROBLEMAS PROPUESTOS
EJERCICIO 1) Se desea estimar el peso promedio de un lote de 500 cerdas, a partir de una muestra de 36.
Los pesos obtenidos se presentan en la siguiente tabla:
PESO (Kg) Cant. animales
40 - 42 3
42 - 44 5
44 - 46 7
46 - 48 10
48 - 50 6
50 - 52 3
52 - 54 2
Proponer una respuesta trabajando con un nivel de confianza del 99%, y suponiendo que la distribución de la
variable es normal.
59
-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística
EJERCICIO 2) Se desea estimar el desvío estándar de la alzada de potrillos PSC (Pura Sangre de Carrera)
de la provincia de Entre Ríos, con una confianza del 95%, sabiendo que una muestra de 20 animales presentó
un CV% de 19,03% y un promedio de 1,10 m. Suponga que la variable tiene distribución normal.
a) Definir la variable en estudio y la población de interés.
b) Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c) Indicar los valores tabulares empleados para el LI y el LS.
d) Estimar el desvío estándar poblacional puntualmente y mediante un intervalo de confianza y concluir.
EJERCICIO 3) Al examinar 154 vacas de raza Holando Argentino, en un determinado tambo, el 15%,
aproximadamente, dio reacción positiva de brucelosis.
a) Estimar puntualmente y a través de un intervalo de confianza del 90%:
a.1) la proporción poblacional de vacas en ordeñe sin brucelosis.
a.2) la proporción poblacional de vacas con brucelosis.
b) Definir la variable en estudio y la población de interés
c) Si se toma una muestra aleatoria de 15 vacas, ¿cuál es la probabilidad de detectar
alguna como positiva?
EJERCICIO 4) Un investigador necesita conocer el nivel medio de una enzima en una población. Con los
datos disponibles, correspondientes a determinaciones realizadas en una muestra piloto de 10 individuos, se
obtuvo una media de 22 UI y una varianza de 49 UI2. Suponga que la variable tiene distribución normal.
a) Definir la variable en estudio y la población de interés.
b) Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c) ¿Qué cantidad de determinaciones deberá realizar para estimar la media poblacional con una
confianza del 99% y con un margen de error no mayor a 2 UI?
Asuma que se tomó una muestra del tamaño por Ud. recomendado en el punto c), y que entonces las
estimaciones para y 2 resultaron ser 23 UI y 48,5 UI2, respectivamente.
a) Indicar los valores tabulares empleados para el LI y el LS.
b) Estimar la media poblacional mediante un intervalo de confianza y concluir.
EJERCICIO 5) Se quiere estimar la proporción de familias del Conurbano Bonaerense que tienen alguna forma
de seguro de salud.
a) Definir la variable en estudio y la población de interés.
b) Considerando que no se dispone de información previa, ¿qué tamaño de muestra se deberá tomar
para asegurar un nivel de confianza del 99% y un margen de error de 0,3?
c) Si se cree que el 70% de las familias tienen seguro, ¿qué tamaño de muestra se deberá tomar para
asegurar un nivel de confianza del 99% y un margen de error de 0,3?
EJERCICIO 7) ¿Cuál sería el tamaño de muestra necesario para que la amplitud de un intervalo de
confianza del 95% para la media poblacional de una variable, medida en mm, con distribución normal sea
igual a 2mm, si la varianza es conocida e igual a 4mm 2?
EJERCICIO 8) Al estimar la media poblacional mediante un intervalo de confianza del 90% se obtuvieron
los siguientes límites: [95; 110]. Sabiendo que se trabajó con una muestra de 26 individuos, dar el valor del
promedio y de la varianza que se utilizó para el cálculo de dicho intervalo si 2 era desconocida. Suponga
que la variable tiene distribución normal.
60
-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística
EJERCICIO 9) El administrador de un rodeo está interesado en conocer la edad promedio de las vacas de
cría en un año dado. Decide tomar una muestra de tamaño 25, con la que se obtuvo un promedio de 5,3
años. Si se conoce que esta variable tiene una distribución normal con varianza poblacional de 2,25 años 2.
EJERCICIO 10) Con el fin de analizar el contenido de proteínas del salmón enlatado, medido en %, se
seleccionó una muestra de 15 unidades y se realizó la determinación correspondiente. Los datos obtenidos
son los siguientes:
22,4 24,5 23,0 27,1 24,2 25,7 26,4 28,3 26,4 25,2 24,7 26,3 25,3 24,9 27,4
61
-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística
PRUEBA DE HIPÓTESIS
* OBJETIVOS ESPECÍFICOS
Comprender y analizar la lógica de los ensayos de hipótesis, así como de sus componentes
fundamentales.
Aplicar correctamente los conceptos de nivel de significación, potencia de una prueba y regla de decisión
estadística a la resolución de problemas.
Desarrollar espíritu crítico para evaluar la correcta aplicación de una dócima en un determinado contexto.
* CONTENIDOS TEMÁTICOS
Concepto de hipótesis estadística. Errores tipo I y II. Nivel de significación. Concepto de potencia de una prueba
estadística. Esquema para contrastar una hipótesis. Prueba de hipótesis para la media (), la proporción (p) y
la varianza (2). Aplicaciones.
* GLOSARIO
Prueba, dócima, test o contraste de hipótesis. Condiciones para elección de variable pivotal. Hipótesis de
trabajo. Hipótesis estadística. Hipótesis nula y alternativa. Error tipo I y tipo II. Nivel de significación. Región
crítica. Regla de decisión. Potencia. Test exacto. Test aproximado o asíntótico. Test de libre distribución.
PROBLEMAS RESUELTOS
EJERCICIO 1) En una chimenea se ha instalado un sistema de precipitación con el que se cree que la
concentración de sólidos en el humo, que es en promedio de 1,8 g/m3, será menor a la tercera parte. Puesta
en marcha la instalación se efectúa una serie de mediciones, obteniéndose los siguientes valores (g/m3):
En base a estos valores, ¿cree usted que se ha obtenido el resultado esperado? (=0,05)
SOLUCIÓN
Variable en estudio
X: “concentración de sólidos en el humo de una chimenea luego de instalar un sistema de precipitación (g/m3)”
La hipótesis de trabajo (HT) expresa el supuesto o conjetura que motiva al experimentador. Se expresa
siempre como una afirmación y está dada en forma coloquial, no en términos estadísticos, ya que el
investigador no necesita tener conocimientos estadísticos específicos.
Es formulada antes de cualquier estudio estadístico.
En este caso HT es: “el sistema de precipitación instalado en la chimenea disminuye la concentración
de sólidos en el humo a menos de la tercera parte”.
Para poner a prueba la HT se necesita transformar las afirmaciones allí expresadas a términos estadísticos
a los fines de poder aplicarles la técnica adecuada que permita responder sobre la hipótesis formulada. Esta
consta de varios pasos y es importante tener claro en que consiste cada uno de ellos y el orden en que se
presentan.
En este caso: De acuerdo a lo formulado en la hipótesis de trabajo, y teniendo en cuenta que el valor de la
concentración media de sólidos antes de instalar el sistema de precipitación era de 1,8 g/m3, será:
Este valor proporciona una medida del riesgo con el que se desarrollará la prueba, consecuencia del
método inductivo. Significa que de cada cien muestras obtenidas, cinco nos pueden llevar a resultados
erróneos; esperamos que la nuestra sea una de las noventa y cinco “buenas”.
En este caso:
= 0,05 = P(rechazar H0 /H0 es verdadera) = P(suponer 0,6 cuando en realidad es 0,6)
Esto significa que, en cinco de cada cien veces, concluiremos que el sistema disminuye la concentración
de sólidos a menos de la tercera parte cuando en realidad no lo hace.
Antes de elegir el estadístico de prueba, necesitamos tener información sobre la distribución de la
variable en estudio, ya que en este caso no está aclarada en el enunciado del problema.
La condición para elegir la variable pivotal que hacemos sobre la variable en estudio es:
X ~ N ( , 2) ó X N ( , 2)
Para verificar esta condición se realizó una prueba de Shapiro-Wilks, llegando a la conclusión de que se
puede suponer que la variable se distribuye aproximadamente normal.
Esta prueba es no paramétrica y las hipótesis estadísticas son:
H0 : X ~ N ( , 2)
H1: X no se distribuye N ( , 2)
El estadístico de prueba a utilizar es W para esta dócima, pero en este curso no se verá su distribución,
por lo tanto, se va a trabajar con el p-valor. Este dato va a estar dado por la salida de InfoStat;
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Sólidos 10 0,55 0,04 0,91 0,4176
El p-valor, p-value o simplemente p, es la probabilidad de que siendo cierta Ho nos encontremos con un
valor como el que nos arrojó la muestra o peor en el sentido de la hipótesis alternativa. Esto significa igual o
mayor al obtenido si la región crítica es unilateral derecha, igual o menor que el obtenido si la región crítica es
unilateral izquierda e igual al doble de la menor de las colas desde el obtenido si la región critica es bilateral.
Lo utilizaremos en el caso de Shapiro Wilks para decidir rechazar o no H0 ya que de lo único que
disponemos es de la salida de computadora y siempre trabajaremos al nivel de significación del 10%,
en este test; dado que no es muy potente.
En los demás test es importante que la decisión se base en el estadístico de contraste su
distribución, el nivel de significación y la región crítica.
La regla de decisión, para este caso particular, la armaremos comparando el p-valor con el valor de
=0,10, para cualquiera de las H1:
o Si el p-valor rechazo H0
o Si el p-valor > no rechazo H0
Como p=0,4176 > 0,10 (nivel dado), no rechazo H 0. Por lo tanto, al nivel del 10%, no tengo evidencias
suficientes para rechazar H0 y puedo suponer que la concentración de sólidos en el humo de las chimeneas
luego de instalar un sistema de precipitación (g/m3) se distribuye normalmente con media y varianza 2.
63
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística
Una vez analizado la condición, podemos hacer la prueba respecto a la media poblacional. El estadístico
de prueba a utilizar en este caso es:
X̄ - μ
t= tn-1
S⁄
√n
El estimador utilizado del parámetro en estudio es la media muestral. Si suponemos que la distri-
bución de la variable es normal, la media muestral también tendrá una distribución normal. Estandarizando
esta variable obtenemos una normal estándar, y como la varianza poblacional es desconocida entonces
utilizamos una t de Student. Así cumplimos con la necesidad de tener una distribución conocida para poder
emplear las tablas estadísticas.
Necesitamos ahora determinar la región crítica. Recordemos que la región crítica está formada por
los valores del estadístico de prueba en los cuales se va a producir el rechazo de la hipótesis nula. Se
determina a partir de la distribución del estadístico de prueba, el nivel de significación de la prueba, la
hipótesis alternativa y a veces, del tamaño de la muestra.
También se puede expresar la región crítica como un subconjunto de valores del estimador del
parámetro, pero no lo usaremos en este curso.
Gráficamente:
Tomando una muestra aleatoria de la población en estudio, se estima el parámetro que se está
poniendo a prueba, y teniendo en cuenta toda la información obtenida de la muestra, se calcula el valor del
estadístico de prueba bajo la hipótesis nula y se toma la decisión.
0,552 - 0,600
tH0 = = -4,095
0,037
3,16
CONCLUSIÓN: Con un nivel de significación del 5%, tengo evidencias suficientes para rechazar H0: 0,6
por lo tanto consideramos que < 0,6; es decir, la media poblacional de la concentración de sólidos en el humo
de la población de chimeneas en las que se ha instalado el sistema de precipitación es menor a 0,6 g/m3 ; en
consecuencia se concluye que la disminución producida por la instalación de este nuevo sistema lleva el valor
medio poblacional de concentración de sólidos en la chimenea por debajo de la tercera parte; por lo tanto se
ha obtenido el resultado esperado.
64
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística
EJERCICIO 2) En la situación práctica del problema 1), se sospecha que la varianza no se mantiene en el
valor histórico de 0,0015 (g/m3)2, por lo que se ponen a prueba las siguientes hipótesis estadísticas:
H0: 2=0,0015 vs H1: 2 0,0015 al mismo nivel de significación
SOLUCIÓN
Parámetro en estudio: varianza poblacional de la concentración de sólidos en el humo de las chimeneas en las
que se ha instalado este sistema de precipitación.
Hipótesis de trabajo:
La varianza de la concentración de sólidos en el humo de la chimenea una vez
instalado un sistema de precipitación difiere de 0,0015 (g/m3)2
La condición de normalidad sobre la variable en estudio ya fue verificado; por lo tanto el estadístico de
prueba es:
(n-1)⋅S2
n1
2
𝜒2=
σ2
Observación: la región critica o de rechazo del test no puede en este caso escribirse en una sola expresión
matemática.
9∙0,00139
𝜒𝐻20 = =8,34
0,0015
Como no rechazo H0 se puede suponer que 2= 0,0015 (g/m3)2, es decir, que, al 5%, la varianza poblacional
de la concentración de sólidos en el humo de la población de chimeneas en las que se ha instalado el sistema
de precipitación no difiere de 0,0015 (g/m3)2.
65
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística
EJERCICIO 3) Un laboratorio está dispuesto a lanzar al mercado un nuevo fármaco si es aceptado al menos
por el 50% de los profesionales. Para ello selecciona una muestra aleatoria de 100 médicos veterinarios a
quienes pregunta si utilizarían el fármaco en cuestión, obteniendo 38 respuestas positivas. ¿Cuál será la
decisión del laboratorio trabajando con un nivel de significación del 5%?
SOLUCIÓN
Variable en estudio
Para verificar esta condición no se utilizan pruebas estadísticas. Sólo las condiciones de la distribución
Binomial vistas en la Unidad 2.
Hipótesis de trabajo: al menos el 50% de los médicos veterinarios acepta el nuevo fármaco que propone el
laboratorio
Hipótesis estadísticas
Las expresiones dadas por porcentajes se traducen a proporciones para el estudio estadístico. Se trata
entonces de un caso de una prueba de hipótesis para la proporción poblacional.
En este caso, el 50% indica 50 de cada 100 médicos, por lo tanto p = 0,50.
Pero la hipótesis de trabajo expresa que “al menos el 50%...”, lo cual es equivalente a decir “como mínimo el
50%...”, o también “por lo menos el 50%....”, y esto se expresa entonces como p 0,50.
Teniendo en cuenta además que en la hipótesis nula debe colocarse siempre la igualdad, tenemos:
H0: p 0,50
H1: p 0,50
p̂ - p
El estadístico de prueba es: ZH0 = ≈ N(0,1)
√p∙(1-p)
n
Observación: este test se basa en la aproximación de la distribución binomial a la normal (puede aplicarse
pues n = 100 > 30), es decir es un test de nivel aproximado o asintótico.
x 38
Información muestral: n= 100 ; x = 38 ; p̂ = = = 0,38
n 100
66
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística
0,38-0,50
Z H0 = = - 2,4 ⟵ valor calculado del estadístico de prueba
√0,5⋅0,5/100
Conclusión: Con un nivel de significación del 5%, hay evidencia suficiente para rechazar H0: p 0,50. Por lo
tanto, se puede decir que la proporción poblacional de médicos veterinarios que aceptan el nuevo fármaco es
menor al 50%. En consecuencia, al mismo nivel, se aconseja que el laboratorio no lance al mercado el nuevo
fármaco.
EJERCICIO 4) Se registró la edad de los niños atendidos por quemaduras en la última Navidad en los
hospitales y centros asistenciales de la ciudad “Quemucho” (Argentina) resultando:
Edad frecuencia
3–5 3
5–7 8
7–9 10
9 – 11 7
11 - 13 4
Se solicita:
a) Definir y clasificar la variable
b) Completar la tabla de frecuencias con las columnas de frecuencias relativas y la columna de fre-
cuencias absolutas acumuladas.
c) Interpretar el significado, en términos del problema, del número “10” que figura en la tabla
d) ¿Cuál es la proporción de niños de menos de 7 años que fueron atendidos por quemaduras en
este grupo?
e) Si se considera la ciudad “Quemucho” es representativa de las ciudades de la Argentina respecto
a los casos de niños atendidos por quemadura durante la última Navidad:
e.1) Estimar la proporción de niños menores de 7 años que fueron atendidos por quemaduras durante
la última Navidad en las ciudades de Argentina, con un 95% de confianza.
e.2) ¿Se puede afirmar, con un nivel de significación del 1%, que la edad media de los niños que se
atendieron en la última Navidad en Argentina es superior a 7 años? Suponga que la variable cumple la
condición de normalidad.
SOLUCIÓN
a) X: “edad de un niño atendido, por quemaduras en la última Navidad, en los hospitales y centros asisten-
ciales de la ciudad “Quemucho”. Variable aleatoria cuantitativa discreta.
b)
Edad fi Fi hi Hi
3-5 3 3 0,094 0,094
5-7 8 11 0,250 0,344
7-9 10 21 0,312 0,656
9-11 7 28 0,219 0,875
11-13 4 32 0,125 1,000
c) f3= 10 niños, de entre 7 y menores a 9 años, fueron atendidos por quemaduras en la última Navidad en
los hospitales y centros de asistencia de la ciudad “Quemucho”.
d) Me fijo en la columna Hi, y la que corresponde a lo pedido es H2=0,344, siendo esa la proporción de
niños menores de 7 años que fueron atendidos la última Navidad en los hospitales y centros de atención
sanitaria de “Quemucho”.
67
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística
e)
e.1) Los niños menores de 7 años atendidos por quemaduras, son 11 de los 32 atendidos por quema-
duras en los centros sanitarios de la localidad de “Quemucho”, por lo que la estimación puntual de la pro-
porción es: p̂ =0,344. Como estamos diciendo que dicha localidad es representativa de las ciudades de
Argentina, entonces estimaremos la proporción poblacional de niños menores de 7 años que fueron aten-
didos por quemaduras, la última Navidad, en centros sanitarios y hospitales de Argentina.
El intervalo de confianza del 95% correspondiente es:
p̂ ∙(1-p̂ ) 0,344∙0,656
p̂ ∓ Z1-α √ = 0,344 ∓ 1,96√ = 0,344 ∓ 0,165= [0,179;0,509]
2 n 32
Con un nivel de confianza del 95%, se espera que el intervalo [0,179; 0,509] contenga la verdadera propor-
ción de la población de niños menores de 7 años atendidos por quemaduras en los hospitales y centros de
atención sanitaria de Argentina en la última Navidad.
e.2) La hipótesis de trabajo es: la edad media de los niños que se atendieron en la última Navidad en
Argentina es superior a 7 años
Variable pivotal: como se supone que la variable se distribuye normal pero la varianza poblacional es
desconocida se utiliza una t-student.
X̄ - μ
t= tn-1
S
√n
2
Los datos a tener en cuenta son: X̄ =8,0625 ; S =5,54 por lo tanto S=2,35
X̄ - μ 8,0625 - 7
tobs = = = 2,55
S⁄ 2,35
⁄
√n √32
Decisión: Rechazo H0 pues 2,55>2,457
Conclusión: Con un nivel de significación del 1% hay evidencia suficiente para rechazar la hipótesis nula
(H0 : μ=7), por lo que se puede decir que la edad media poblacional de los niños que se atendieron por
quemaduras en la población de los pacientes de los hospitales y centros de atención sanitaria en la última
Navidad en Argentina es superior a 7 años.
68
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística
[ ; ) x’i fi
4,45 - 4,70 4,58 3
4,70 - 4,95 4,83 9
4,95 - 5,20 5,08 7
5,20 - 5,45 5,33 13
5,45 - 5,70 5,58 7
5,70 - 5,95 5,83 9
5,95 - 6,20 6,08 2
SOLUCIÓN
La variable en estudio es X: “peso del vellón de una llama del establecimiento dedicado a la cría, luego de
la esquila”, medido en Kg.
a) Los resultados se pueden representar mediante el histograma y/o el boxplot. Ambos muestran que la
distribución de la variable es simétrica.
b) El parámetro de interés es la media poblacional del peso del vellón de la población de las llamas,
luego de esquilado, del establecimiento en el que se emplearon técnicas de mejoramiento produc-
tivo.
x'i ∙ fi 265,75
X̄ = ∑ = = 5,315kg
n 50
i
69
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística
d) Para estimar puntualmente la varianza, debemos calcular S2. A partir de la tabla de frecuencias obte-
nemos: ∑i x'i ∙fi =265,75 ; ∑i x'2
i ∙fi =1420,6375
2
(n-1)S 49*0,1669 8,1781
L.S.= = = =0,3347(Kg)2
χ2 α χ249;0,025 24,433
n-1;
2
Como conclusión, podemos decir que, con un nivel de confianza del 95%, podemos esperar que el intervalo
[0,1378 (Kg)2; 0,3347 (Kg)2] cubra el verdadero valor de la varianza del peso de los vellones esquilados de
la población de las llamas del establecimiento, luego de introducir mejoras a nivel productivo.
A partir de esto podemos comparar con el valor histórico y, sin realizar la prueba de hipótesis correspon-
diente, tomar una decisión al respecto de si la varianza se modificó o no. Para ello, debemos elevar al
cuadrado el desvío informado, quedando la varianza con un valor: 1,52 = 2,25 (Kg)2.
Las hipótesis que se plantean son: H0: 2 = 2,25 vs H1: 2 2,25. El nivel de significación es del 5%, y se
utiliza la misma información muestral que la usada en el intervalo.
70
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística
La región crítica es bilateral, coincidiendo con el tipo de intervalo de confianza, también bilateral (límite
inferior y límite superior).
La pregunta concreta sería: ¿2,25 es un valor cubierto por el intervalo de confianza? Por lo que vemos, no
es así, dado que el intervalo es [0,1378 (Kg)2; 0,3347 (Kg)2]. A partir de esto tomamos como decisión
rechazar la hipótesis nula, al 5%, ya que hay evidencias suficientes para decir que la varianza poblacional
del peso de los vellones, luego de la esquila, de la población de las llamas del establecimiento en el que
se implementaron prácticas de mejoramiento productivo es distinto a 2,25 (Kg)2.
A los fines prácticos, esto indica que en este sentido también se observa la mejora, dado que los pesos
tienen menor dispersión, y se logra mayor homogeneidad en ellos.
EJERCICIO 6) Un grupo de investigadores supone que el peso medio al nacer de lechones de raza Lan-
drace es de 500g, para ello se toma de la población en estudio una muestra aleatoria de 21 lechones al
nacer y se pesan. Las mediciones obtenidas son:
Pesos
529,77 541,08 467,91
462,75 486,04 542,15
464,20 539,94 495,13
489,17 489,07 531,73
531,09 500,65 527,88
502,35 456,89 512,13
523,15 535,15 499,75
Se sabe por estudios previos que la distribución de esta variable en esta población en particular no es
normal, si bien puede considerarse simétrica. Usar α=0,05 para probar la sospecha de los investigadores.
Dado que: la variable es cuantitativa, por lo tanto es de escala superior a la ordinal, y al comentario “puede
considerarse simétrica….” se dan las condiciones para realizar el test de Wilcoxon.
Restando el valor de la mediana propuesto bajo H0 (500g) a cada observación y ordenando esas diferencias
según sus valores absolutos, se obtienen los siguientes resultados:
Ordenamos los valores absolutos de las observaciones y les asignamos un rango a cada una de ellas en
este ordenamiento.
71
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística
x x- θ Ri
499,75 -0,25 1
500,65 0,65 2 (+)
502,35 2,35 3 (+)
495,13 -4,87 4
489,17 -10,83 5
489,07 -10,93 6
512,13 12,13 7 (+)
486,04 -13,96 8
523,15 23,15 9 (+)
527,88 27,88 10 (+)
529,77 29,77 11 (+)
531,09 31,09 12 (+)
531,73 31,73 13 (+)
467,91 -32,09 14
535,15 35,15 15 (+)
464,2 -35,8 16
462,75 -37,25 17
539,94 39,94 18 (+)
541,08 41,08 19 (+)
542,15 42,15 20 (+)
456,89 -43,11 21
Construimos el estadístico T+, sumando los rangos correspondientes a las diferencias Positivas:
T+ = 2+3+7+9+10+11+12+13+15+18+19+20 = 139
Debemos comparar el valor obtenido de T+ (en este caso 139) con los valores críticos de la distribución
de Wilcoxon. T+ tendrá una distribución exacta T n cuyos valores críticos se encuentra en la tabla de
“Prueba de rangos con signos de Wilcoxon”. En nuestro ejemplo: VP: T + ~ T21
Valores Críticos: la tabla sólo ofrece los valores críticos inferiores para cuando se trabaja a una cola o a
dos colas con ciertos niveles de significación. Si se necesita algún valor crítico superior, se deberá hallar
mediante la fórmula:
n(n+1)
Tn;1-α/2 = - Tn;α/2
2
En nuestro caso, la región crítica es bilateral, por lo que tendremos que usar la fórmula anterior para calcular
el valor crítico superior. Buscamos en la tabla el valor crítico inferior, T 21; 0,025 = 59, y aplicamos la fórmula
n(n+1) 21(21+1)
T21;0.975 = -T21;0.025 = -59=172
2 2
72
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística
Como 59 < 139 < 172, la decisión es no rechazar Ho, es decir que no tenemos evidencia de que el peso
mediano poblacional al nacer de los lechones de la raza Landrace difiera de 500g, con un nivel de signifi-
cación del 5%.
Conclusión: Con un nivel de significación del 5% no existen evidencias suficientes para rechazar H 0 (Ho: θ
= 500), por lo tanto podemos concluir que la mediana poblacional del peso al nacer de los lechones de raza
Landrace es de 500 gramos, en la población de lechones Landrace.
En caso de tener otro par de hipótesis, la selección del valor crítico correspondiente se realizará según la
siguiente tabla:
H0 H1 Región crítica
H 0 : 0 H1 : 0 nn 1
T Tn; / 2 ó T Tn; / 2
2
H 0 : 0 H1 : 0 T Tn;
H 0 : 0 H1 : 0 nn 1
T Tn;
2
PROBLEMAS PROPUESTOS
EJERCICIO 1) Un lote de 25 animales recibe una ración durante un período de 60 días. A partir de las
ganancias de peso por animal, se calcula x = 420 g/día y s = 100 g/día. Al nivel de significación del 5%:
a) ¿es sustentable la hipótesis de que el tratamiento produce una ganancia media de peso mayor a 400
g/día?
b) ¿Cuáles son las condiciones que necesitan cumplirse para que la prueba anterior sea válida?
c) Responda el punto a) suponiendo que = 90 g/día.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(una cola)
Concentr 10 3,37 0,31 0,91 0,4330
Considerando que el método anterior tiene varianza 2=1,20, decida si el nuevo método es mejor que el
anterior (=0,05).
Indique:
a) Verificación la condición para la elección de la variable pivotal:.................................................................
b) Hipótesis de trabajo: .....................................................................................................................................
c) Hipótesis estadísticas: ..................................................................................................................................
d) Región crítica: ...............................................................................................................................................
e) Población en estudio: ...................................................................................................................................
EJERCICIO 3) Los investigadores desean probar si la proporción de pacientes cuya úlcera sanó después del
tratamiento con cimetidina supera el 50%. Para ello se administra la droga a 66 enfermos y luego de 6 semanas
resultaron 43 pacientes curados. Probar la hipótesis de interés (=0,05).
73
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística
Indique sólo: variable en estudio, distribución de la misma, región crítica, decisión, interpretación biológica
del nivel de significación de la prueba, parámetro en estudio y su interpretación biológica acorde a la decisión
tomada.
A partir de estos valores, ¿puede sustentar la hipótesis de que el valor de la desviación estándar poblacional
de la glucosa en sangre no supera el valor 9 mg/dl? ( = 0,05).
Indique: variable en estudio, condiciones para la elección de la variable pivotal, hipótesis estadísticas, regla
de decisión, decisión, parámetro en estudio y su interpretación biológica acorde a la decisión tomada, y
respuesta a la pregunta planteada.
Si posteriormente se informa que el desvió poblacional es de 10 mg/dl ¿qué error se cometió? ¿cuál es la
probabilidad?
EJERCICIO 5) Un profesor de estadística, al final del cuatrimestre, les pregunta a los alumnos si han asis-
tido a clases de consulta, en dicho cuatrimestre, codificando como 0 (no asistió) y 1 (asistió). Las respuestas
codificadas reportadas por cada estudiante son las siguientes:
00001000000000101011001010101000
10001000001000100001100000000001
Se solicita:
a) Definir y clasificar la variable
b) Construir una tabla de frecuencias.
c) Si se define una variable que cuenta la cantidad de alumnos que utilizan los horarios de consulta por
comisión:
c.1) ¿Qué distribución tiene dicha variable? Interprete los parámetros.
c.2) Suponiendo que todas las comisiones tienen cupo de 64 alumnos, y en base a la información
anterior, ¿cuál es la estimación puntual del parámetro “proporción de alumnos que no utilizan el horario de
consulta”?
c.3) Considerando la distribución de la variable con los valores de los parámetros dados por lo obtenido
en c.2), se pide calcular la probabilidad de que, entre 20 alumnos elegidos al azar de esta población, 10 de
ellos NO usen el horario de consulta.
c.4) Suponiendo que se abre una nueva comisión de sólo 20 alumnos y considerando la misma pro-
porción de éxitos que en el inciso anterior, ¿cuál es la probabilidad de que más de 15 no utilicen el horario
de consulta? ¿cuál es la probabilidad que entre 5 y 15 lo utilicen?
c.5) La Docente “My Plantas” afirma que “al menos el 30% de los alumnos utilizan el horario de con-
sulta”, por lo cual propone no suspenderlo. Al nivel de significación del 5%, ¿qué puede decir de dicha
afirmación?
74
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística
EJERCICIO 7) Se midieron los tiempos de coagulación de pacientes con trastornos hepáticos severos (en
seg) de veintidós pacientes para estudios prequirúrgicos y se quiere testear si el valor central de dicho
tiempo en la población de estudio es superior a 11 seg; los datos recogidos se exhiben a continuación:
9,9 12,56 13,71 11,47 9,74 14,72 11 7,99 8,5 12,5 8,96
13 14 10,41 11,77 17,64 23,77 15 11,24 14 8,17 10,15
Plantee las hipótesis adecuadas para el problema sabiendo que los datos son simétricos.
Realice el test correspondiente al nivel del 5%.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Tpo de Coagulación 22 12,28 3,57 0,88 0,0290
Estadística descriptiva
Variable n Media D.E. Mín Máx Mediana
Tpo de Coagulación 22 12,28 3,57 7,99 23,77 11,62
EJERCICIO 8) La Haemobartonella en caninos es un parásito que se adhiere a la membrana del glóbulo rojo,
provocando una severa anemia hemolítica con pirexia y hemoglobinuria.
Para realizar estudios en la cuidad de Buenos Aires se toman muestras de sangre a 19 caninos y se obtienen
los resultados de hemoglobina. A partir de los mismos se desea saber si el valor central de la concentración
de hemoglobina en los perros parasitados es inferior a 11,5 g, al nivel del 5%. (Suponga que la variable en
estudio tiene distribución simétrica).
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Hemoglobina 19 11,72 1,89 0,86 0,0196
Prueba de Wilcoxon
Obs.(1) Obs.(2) N Suma(R+)
Hemoglobina Hemoglobina11.5 19 127,50
EJERCICIO 9) Un veterinario dedicado a la nutrición animal, está formulando una nueva ración para equi-
nos deportivos de prueba completa, considerando el tipo de entrenamiento, la composición, cantidad y
forma de suministrar el alimento. Se desea evaluar la Energía Digestible (ED) de la Alfalfa.
El veterinario utilizará dicho forraje sólo si el valor central de la ED es mayor a 2 Mcal/kg MS.
Trabajando con un nivel de significación del 10%, ¿qué decisión tomará el veterinario? Según la decisión
tomada, ¿se justificaría hacer un intervalo de confianza? Explique qué error de decisión pudo haber come-
tido en términos del problema.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(Unilateral D)
ED 15 2,08 0,35 0,97 0,9304
Medidas resumen
Variable n Media D.E. Var(n-1) Mín Máx Mediana
ED 15 2,08 0,35 0,12 1,45 2,87 2,03
75
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística
EJERCICIO 10) En los últimos años se están realizando exámenes de líquido sinovial (LS) como complemento
diagnóstico de artropatías en equinos, mediante los cuales se estudian las propiedades fisicoquímicas del LS,
entre ellas la glucosa, que normalmente toma valores centrados en 0,76 g/l.
La disminución de la glucosa es común en las artritis infectadas, llegando incluso a valores muy pequeños.
Se estudian 24 muestras de LS de equinos que están fuera competencia debido a esta patología y se desea
saber si presentan un nivel de glucosa inferior al normal.
a) Trabajar con un nivel de significación del 5%, suponiendo que la distribución de la variable es si-
métrica. Establecer variable en estudio, hipótesis de trabajo, condiciones para elección de variable pivotal,
hipótesis de interés, Región Crítica, Decisión, Conclusión y responder la pregunta del investigador.
b) Si la distribución de la variable no fuera simétrica, ¿se podría aplicar Wilcoxon?
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Gluc. 24 0,53 0,13 0,72 <0,0001
76
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística
2.- Se tienen dos jaulas con conejos, la primera con 2 blancos y 4 grises, y la segunda con 5 blancos. Se
selecciona un conejo de la primera jaula al azar y se lo coloca en la segunda. Luego se selecciona un conejo
de la segunda jaula. ¿Cuál es la probabilidad de que el conejo de la segunda jaula sea blanco si:
a) el primero fue gris?
b) el primero fue blanco?
3.- Se desea probar el efecto letal de una toxina, que se inyecta a huevos embrionados. Luego del período
considerado suficiente para obtener el efecto tóxico, se hace el recuento de embriones muertos por cada
bandeja de la incubadora:
8 7 7 5 9 10 12 8 6 12 6 5 10 9 5 11 15 16
8 10 6 8 12 10 6 8 15 7 11 12 5 6 7 9 5 15
9 10
14
a) Indicar y clasificar la variable en estudio. 13
b) La unidad de observación es ..............................
Embriones muertos
12
c) Ordenar los datos en una tabla de distribución de
frecuencias. 11
d) Interpretar f4 , h2 , F3 , H6. 10
e) Construir los gráficos correspondientes.
9
f) Calcular las medidas de tendencia central y de disper-
sión. 8
esta muestra. 6
h) A partir de la información del punto anterior clasifique la
5
distribución de la variable con respecto a la simetría.
77
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística
b) A cada histograma le corresponde un gráfico de caja. De acuerdo a la observación que usted realiza,
¿cuáles son los pares de gráficos correspondientes?
...................................................................................................................................
5.- Un especialista en ictiología tropical está interesado en calcular cuánto tiempo puede vivir cierto tipo de
pez en aguas con determinado porcentaje de toxicidad. Luego de una larga serie de experimentos llega a
concluir que la vida media de este tipo de pez alcanza los 90 días, con una desviación estándar de 20 días. En
apariencia, la distribución de los días sobrevividos es normal.
a) ¿Cuál es la probabilidad de que un pez viva más de 120 días?
b) ¿Cuál es la probabilidad de que un pez viva entre 90 y 125 días?
c) ¿Cuál es la probabilidad de que un pez viva menos que la media de vida?
d) Sin utilizar tabla, ¿entre qué valores de la variable quedan el 68% de los valores centrales?
6.- El 60% de los bovinos de un establecimiento está parasitado con Fasciola hepática. Al revisar una muestra
de 12 animales,
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) ¿Cuál es la probabilidad de encontrar a lo sumo 8 parasitados?
d) ¿Cuál es la probabilidad de encontrar 10 que no estén parasitados?
e) ¿Cuál es la probabilidad de encontrar 8 animales parasitados?
f) ¿Cuál es la probabilidad de encontrar por lo menos 8 animales parasitados?
g) Calcular la E(X)
7.- El Servicio de Sanidad Ambiental luego de realizar tareas de desinfección y desratización en el área vecina
a una nueva autopista, hizo el recuento de ratas muertas por manzana, en parte del área afectada:
20 15 30 18 15 18 21 27 19 12 19 18 26
18 19 18 19 21 19 19 20 20 20 26 15
a) Definir y clasificar la variable en estudio.
b) Clasifique como Verdadera o Falsa la siguiente oración: “La unidad de observación es una rata.” Justifique
su respuesta.
c) Ordenar los datos en una tabla de distribución de frecuencias.
d) Interpretar f5 , H2
e) Construir los gráficos correspondientes.
f) Calcular las medidas de tendencia central y de dispersión.
g) Interprete el Boxplot correspondiente a los datos de esta muestra.
h) Con toda la información anterior, clasifique la distribución de la variable con respecto a la simetría.
78
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística
31
26
Ratas muertas
21
16
11
8.- Al estudiar la influencia de la dieta en el contenido de hemoglobina en sangre, se tomaron tres grupos
de animales y se alimentaron con tres raciones distintas. Si se supone que las dietas tienen distinto
comportamiento en cuanto a la variabilidad del contenido de hemoglobina, ¿qué medida recomendaría para
determinar:
a) la dieta que presenta mayor variación absoluta en el contenido de hemoglobina en sangre?
b) la dieta que presenta mayor variación relativa en el contenido de hemoglobina en sangre?
Justificar la respuesta.
9.- En una población de animales, la presión sistólica en reposo se distribuye normalmente con = 115 mm
de Hg y 2 = 225 (mm de Hg)2. Hallar la probabilidad de que un animal de esta población tenga:
a) presión sistólica inferior a 140 mm de Hg.
b) presión sistólica entre 110 y 120 mm de Hg.
c) la presión sistólica por debajo de la cual está el 99% de la población.
10.- Un conjunto de vacas está constituido por 2 razas R1 y R2, clasificadas según estén o no vacunadas, V
y NV.
R1 R2 TOTAL
V 80 200 280
Se selecciona un animal al azar. Calcular la probabilidad de
que: NV 120 0 120
a) esté vacunado. c) sea de R2 sabiendo que está vacunado
b) esté vacunado y sea de R2. d) esté vacunado o sea de R2.
11.- Se comprobó que en un establecimiento de cría el 5% de los lechones que nacen son hermafroditas. Si
se extraen 12 animales al azar,
79
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística
13.- Se comprobó que cabras preñadas a partir de cruzamientos consanguíneos tienen un 30% de
probabilidad de parir crías con prognatismo superior, produciendo la consecuente muerte del animal por
imposibilidad de succionar en forma normal. Para 10 hembras preñadas en esas condiciones,
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) ¿Qué probabilidad hay de que 5 tengan sus crías normales?
d) ¿Qué probabilidad hay de que 4 tengan sus crías no normales?
e) ¿Qué probabilidad hay de que entre 5 y 7, inclusive ambos extremos, tengan sus crías normales?
14.- Si el número de casos favorables al suceso A es 40 y el número de casos favorables al suceso no A es
80, entonces la probabilidad de ocurrencia del suceso A, será (Seleccione la respuesta correcta y argumente
brevemente):
a) p(A) = 0,50 c) p (A) = 0,33
b) p(A) = 0,67 d) p (A) = 0,05
15.- Calcular la probabilidad que corresponde al área comprendida entre los siguientes valores tabulares y
representarla gráficamente:
a) Z = -1,96 y Z = 2,20
b) t20 = -1,725 y t20 = 2,845
c) 302 = 16,79 y 302 = 50,89
16.- La edad en meses en que aparece la parvovirosis tiene distribución normal, siendo la media de 5,5, con
un desvío estándar de 2 meses. Al recibir en consulta un perro enfermo, ¿cuál es la probabilidad de que tenga:
a) entre 2 y 7,5 meses?
b) más de 4 meses?
c) menos de 1 año?
17.- La probabilidad de que Juan Sonrisa se levante malhumorado, en la semana, es 0,1 y cada vez que
comienza un nuevo día es independiente de lo que haya sucedido el día anterior.
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) ¿Cuál es la probabilidad de que 2 días de la semana se levante malhumorado?
d) ¿Cuál es la probabilidad de que más de la mitad de la semana se levante malhumorado?
e) Calcular la E(X)
18.- Considerando que la variable aleatoria t tiene distribución de Student con 25 grados de libertad,
a) Calcular la probabilidad de que:
a.1) t sea mayor que 2,48
a.2) t esté comprendido entre -1,32 y 1,71
b) Hallar el valor tp, tal que deje el 95% de los valores por debajo de él.
19.- Sea la variable aleatoria Z, definida en el intervalo (0,1), con una función de densidad: f(z) = 3/2(1 - z2 ),
y función de distribución:
Calcular:
a) P (z 0,8) d) P (z > 1/2)
b) P (0,5 < z < 1) e) P (z 0)
c) P (z > 1,5)
20.- En una fábrica de lámparas UV se realiza el control de las partidas antes de que salgan a la venta. Uno
de los controles corresponde a la duración, medida en horas. Un día en particular llegan al laboratorio 25 de
ellas, obteniéndose los siguientes resultados:
80
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística
Duración (hs) fi hi
170 - 180 3/25
180 - 190 4/25
190 - 200 8/25
200 - 210 6/25
210 - 220 4/25
a) Definir la variable y clasificarla.
b) La unidad de observación es ................................................................................
c) Completar la distribución de frecuencias y graficar hi y Fi.
d) El “8” de la columna de fi significa que se observaron:
i. 8 lámparas de luz UV con una duración de hasta 200 horas.
ii. Hasta 8 lámparas de luz UV con una duración entre 190 hasta 200 horas.
iii. 8 lámparas de luz UV con una duración entre 190 hasta 200 horas.
e) Calcular la media, la varianza y el C.V.
f) Determinar los intervalos mediana y modal.
g) ¿Cuál es el porcentaje de lámparas con una duración menor a 200 hs?
h) La distribución de la variable es ................................. ¿Por qué?
i) En la última semana el proceso de manufactura sufrió modificaciones que llevarían a un aumento en el
10% de la duración de las lámparas.
i. ¿Qué valor numérico tiene la media luego de la modificación?
ii. ¿Qué valor numérico tiene la varianza luego de la modificación?
21.- Sea X una variable aleatoria que representa el nivel normal de glucosa en sangre. Se supone que esa
variable X tiene una distribución aproximadamente normal, con media = 95mg/100ml y desviación estándar
= 6mg/100ml. ¿Para qué nivel de glucosa en sangre se puede tener un 90% de probabilidad de encontrar
un individuo que lo supere?
22.- Se comprobó que el 20% de los perros adultos que llegan a consulta por motivos diversos, dan respuesta
positiva al análisis de materia fecal, sin presentar síntomas clínicos de parasitosis. Calcular, sobre una muestra
de 14 animales atendidos en forma sucesiva durante una jornada,
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) Calcular la probabilidad de hallar como máximo 7 animales parasitados.
d) Calcular la probabilidad de hallar exactamente 5 animales parasitados.
e) Calcular la probabilidad de hallar que 10 o más no estén parasitados.
23.- Un camión jaula que transporta 10 Shorthorn, 5 Polled Hereford, y 7 Aberdeen Angus para participar en
la Exposición Rural de Palermo, sufre un accidente y queda tumbado en la ruta. Se escapan 2 animales.
Calcular la probabilidad de que:
a) sean de la misma raza,
b) uno de ellos sea Polled Hereford,
c) sean de dos razas distintas.
24.- Un experimentador suministró a un grupo de ovejas una hierba tóxica. Se sabe que el tiempo (en hs.)
que transcurre desde la ingestión hasta su muerte se distribuye aproximadamente normal (=15;2=2).
¿Cuánto tiempo transcurrió hasta que murió el 90% de las ovejas?
25.- Sea la función de densidad: f(x) = 2 (x - 3), en [ 3 , 4 ] y
Encontrar:
a) P(x 3,5) c) P(x < 3) f) P(3,8 < x < 4)
b) P(x > 3,5) d) P(x < 5) g) F(X) es la función de............
e) P(3 < x < 3,5)
81
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística
26.- Un criadero industrial de conejos obtiene individuos de raza Neocelandés con un peso que se distribuye
normalmente con media igual a 2020 g y desvío estándar de 78 g.
a) ¿Cuál es la probabilidad de que el promedio de peso de los animales de una muestra de 20 supere
los 2 kg?
b) Si se desea mantener como futuros reproductores a los de peso mayor a 2150 g, ¿Cuál es la
probabilidad de que un individuo supere los 2150 g?
27.- Un veterinario sospecha que una nueva hierba introducida en la región donde él se desempeña produce
toxicidad en ovinos. En la primera parte del estudio decide alimentar a un grupo de 15 ovinos con fardo más el
agregado de cierta cantidad de la hierba, para medir el tiempo
que transcurre desde la ingestión hasta la muerte (en horas). Al Intervalos Frecuencias
terminar el experimento obtiene la siguiente tabla: 7 - 10 2
10 - 13 4
a) ¿Cuál es la variable en estudio? Clasificarla.
b) Calcular: media, mediana, modo y C.V. 13 - 16 3
16 - 19 6
c) El “9/15” de la columna de Hi significa que se observaron:
i. De los 15 ovinos, hasta 9 murieron entre las 13 y las 16 horas de haber ingerido el fardo y la
hierba tóxica.
ii. De los 15 ovinos, 9 murieron entre las 13 y las 16 horas de haber ingerido el fardo y la hierba
tóxica.
iii. De los 15 ovinos, 9 murieron entre las 7 y las 16 horas de haber ingerido el fardo y la hierba
tóxica.
d) El veterinario aplica los conocimientos de fisiología ruminal, por lo que decide cambiar el fardo por una
pastura verde, lo que aumentaría en 45% el tiempo que transcurre desde la ingestión hasta la muerte de los
ovinos.
i. ¿Cuál es el valor numérico de la media?
ii. ¿Cuál es el valor numérico del desvío estándar?
28.- Sea la función de densidad: f(x) = 3x2 – 12x + 12 para 1< x 2, con función de distribución
0 para x 1
F ( x) x 3 6 x 2 12 x 7 para 1 x 2
1 para x 2
Calcular:
a) P ( 1 x < 2 ) d) P ( 0 x 1,5 )
b) P ( x > 1,5 ) e) P ( 1,5 x < 3 )
c) P ( x 1,75 )
29.- En un lote de 20 animales hay 10 normales, 6 con defectos importantes y 4 con defectos leves. Se
escoge uno al azar. Calcular la probabilidad de que sea:
a) sin defectos;
b) sin defectos o con defectos leves.
Suponga que se escoge un segundo animal sin reposición del primero, calcular la probabilidad de que sea:
c) normal, pero sabiendo que el primero escogido fue normal;
d) con defectos importantes, sabiendo que el primero fue con defectos leves.
30.- Encontrar los valores de la variable en la distribución Ji-cuadrado que satisfagan:
a) P( 15; p1 15
2 2
15;
2
p
2
) = 0,95 y área equivalente en las colas.
c) P( 46 46; p ) = 0,95
2 2
31.- Los siguientes datos corresponden al dosaje de urea, en mg%, obtenidos en 25 perros sometidos a
pruebas renales en el período operatorio.
[ ; ) 16,5 – 21,9 21,9 – 27,3 27,3 – 32,7 32,7 – 38,1 38,1 – 43,5
Fi 2 6 12 21 25
82
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística
83
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística
37.- En un estudio sobre tumores benignos y malignos en felinos se analizaron todos los casos que se
presentaron en el último año en el Hospital Escuela de la Facultad resultando:
Estado de malignidad
benigno maligno
Lugar Cabeza 64 45
del Cara 21 18
Tumor Cuerpo 36 24
Suponga que se seleccionan 2 felinos del grupo antes citado para realizar ciertos estudios.
¿Cuál es la probabilidad de que:
a) ambos tengan tumores malignos?
b) el segundo tenga tumor maligno sabiendo que el primero tiene tumor benigno?
c) uno tenga el tumor en la cabeza y el otro en la cara?
d) el primero tenga un tumor benigno en la cara y el segundo un tumor maligno en el cuerpo?
Nota: En todos los casos especificar: planteo simbólico, sustitución de valores y resultados.
38.- Al personal técnico y profesional de un hospital se lo clasificó según la tarea que realiza y la edad,
obteniéndose la siguiente tabla:
Edad
Hasta 25 Desde 26 a 35 Mayor a 35 total
Médicos 0 70 120 190
Enfermeros 145 520 195 860
Tarea
Laboratoristas 65 42 33 140
Otras 35 260 15 310
Total 245 892 363 1500
a) Del personal del hospital se elige una persona al azar. Aplicar la teoría clásica de probabilidades para
hallar la probabilidad de que:
i. sea médico y tenga más de 35 años
ii. tenga más de 35 años
iii. sea médico sabiendo que tiene más de 35 años
b) ¿Los sucesos “ser médico” y “tener más de 35 años” son independientes? ¿Por qué?
39.- Investigadores que han conducido un estudio de habitación en una cierta ciudad, examinan todas las casas
ubicadas en manzanas seleccionadas aleatoriamente. ¿Constituye esto una muestra simple aleatoria de las
casas de la ciudad?
40.- Para analizar el estado civil de los habitantes de una gran ciudad se tomó un grupo de 500 familias e
individuos solteros. ¿Le parece correcto seleccionar a esas 500 familias e individuos solteros, sólo de la zona
residencial de la ciudad? ¿Por qué?
41.- Con el objetivo de validar la prueba ELISA (Enzyme-Linked Immunosorbent Assay) comercial para la de-
tección de Brucella ovis en la población ovina de la región de Magallanes (Chile), se realizó un estudio donde
evaluó la presencia/ausencia de Brucella ovis y el diagnostico del test en 500 ejemplares, obteniéndose los
siguientes resultados.
Brucella ovis
Infectados No infectados
ELISA Positivo 68 36
Negativo 14 382
84
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística
a) Si se selecciona un ovino al azar, ¿cuál es la probabilidad de que no esté infectado o resulte negativo en
la prueba ELISA?
b) Si se seleccionan dos ovinos al azar, ¿cuál es la probabilidad de que el primero esté infectado y el test
de positivo, y el segundo esté infectado y el test de negativo.
c) Calcular la sensibilidad del test.
42.- En la industria de la leche, el descenso crioscópico es usado principalmente para determinar si fue aña-
dida agua a la misma. El máximo tolerado es de -0,5120C, es decir que a valores superiores a este, se co-
rresponden a muestras adulteradas. Se toma una muestra de leche de diferentes tambos y se mide el des-
censo crioscópico de cada una.
[;) -0,530 ; -0,524 -0,524 ; -0,518 -0,518 ; -0,512 -0,512; -0,506 -0,506 ; -0,500
Fi 5 14 19 24 25
43.- Alcat test, es un test de intolerancia alimentaria. Hay sustancias presentes en ciertos alimentos, coloran-
tes o aditivos de uso común en la industria alimentaria que generan reacciones nocivas o agresivas hacia
nuestro organismo. Este test da positivo en caso de presentar intolerancia a cierta sustancia en un 90% de
los casos. Si no la hay, dará negativo en un 80%. La probabilidad de que un individuo presente intolerancia
es de 0,15. Calcular:
85
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística
2.- En un cultivo de mejillón a mar abierto, se eligieron al azar 25 mejillones y se los pesó individualmente.
Esta variable, peso, tiene distribución normal. El peso medio fue de 16 g, y el desvío estándar de 5 g. Con una
confianza del 95%:
a) Indicar la estimación puntual del peso medio de la población cultivada y con una confianza del 95%.
b) Calcular el número de individuos necesarios para estimar el peso medio poblacional con un margen
de error de 1,5 g y con una confianza del 95%.
3.- Se tomó una muestra de 16 quesos de la producción del mes de agosto en el establecimiento CRUP SA,
con el objetivo de estimar el peso medio. Los quesos fueron pesados individualmente, y con los datos obtenidos
se estimó el peso medio en 15 kg y el CV en 10%. Suponga que la variable se distribuye normal.
a) Definir la variable en estudio y la población de interés.
b) Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c) Indicar los valores tabulares empleados para el LI y el LS.
d) Estimar el peso medio poblacional mediante un intervalo de confianza del 95% y concluir.
4.- Con datos de una muestra de 25 pollos se estimó la varianza poblacional del peso individual de pollos,
obteniéndose el siguiente intervalo de confianza del 95%: (0,2342 g2; 0,7432 g2). ¿Cuál es el valor de la
estimación de la varianza?
5.- Se desea estimar la varianza del peso individual en una línea de conejos para carne con un coeficiente de
confianza del 95%. A partir de una muestra de 30 conejos se obtuvo una media de 2,40 kg y un desvío estándar
de 0,37 kg.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Peso 30 2,40 0,37 0,91 0,6113
a) Estimar la varianza poblacional del peso individual mediante un intervalo de confianza del 95% y
concluir.
b) Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c) Indicar los valores tabulares empleados para el LI y el LS.
d) Definir la variable en estudio y la población de interés.
6.- En una muestra de 31 adolescentes que se prestaron como sujetos para un estudio inmunológico, una
variable de interés fue la prueba del diámetro de reacción de la piel a un antígeno. La media y la desviación
estándar obtenidas fueron, respectivamente, 21 y 11mm. ¿Es posible concluir a partir de estos datos y con un
nivel del 5%, que la media de la población es menor que 30mm?
Indique sólo: variable en estudio, condición de distribución requerido para ésta, hipótesis de trabajo, hipó-
tesis estadísticas, región crítica y población en estudio.
7.- En la estimación de la media poblacional de una variable con distribución normal, mediante un intervalo de
confianza del 95% se obtuvieron los siguientes límites: LI = 450 y LS = 550. Si dichos valores se calcularon
con una muestra de 30 elementos, determinar el valor de la media y de la varianza utilizados para determinar
dicho intervalo si 2 es desconocida.
8.- Se tomó una muestra aleatoria de 16 informes de urgencias de los archivos de un servicio de
ambulancias. De ella se obtuvo que el tiempo medio en que las ambulancias llegaban a destino era de 13
minutos. Suponiendo que los tiempos de llegada de las ambulancias siguen una distribución normal con
varianza 9min2, ¿es posible concluir, a un nivel del 5%, que la media de la población es mayor a 10 min?
Indique sólo: variable en estudio, hipótesis estadísticas, regla de decisión, decisión e interpretación biológica
del parámetro en estudio acorde a la decisión tomada.
86
-COMPLEMENTARIO 4 y 5-
Guía de Trabajos Prácticos
2023 · Bioestadística
9.- Un establecimiento avícola cuenta con 5000 gallinas ponedoras. A los fines de la organización, se desea
saber qué tamaño de muestra será necesario para estimar la media poblacional de huevos puestos por
semana, con un nivel de confianza del 95%, si se desea admitir un error no mayor a 0,8 huevos. En un estudio
previo se analizaron 28 gallinas y se obtuvo un promedio individual de 5,4 huevos por semana con una
desviación estándar de 1,8 huevos por semana. Suponiendo que la variable se distribuye normalmente:
a) Definir la variable en estudio.
b) Hallar el tamaño de muestra necesario para satisfacer el nivel de confianza y el error a tolerar.
10.- Se supone que el nivel de proteínas totales en plasma de bovinos adultos se distribuye
aproximadamente normal. ¿Qué tamaño de muestra se tomará si se desea estimar el nivel medio de proteínas
totales, mediante un intervalo de confianza del 95%; con una semiamplitud de 0,7 g/ml; sabiendo que en una
muestra piloto de 10 bovinos, es obtuvo x 9,7 g/ml y s = 1,303 g/ml?
11.- En una muestra aleatoria de 60 ovejas de una zona de la provincia de Santa Cruz, el 20% manifiesta
signos de "cabeza grande". ¿Cuál sería el margen de error de una estimación del 95% para la proporción de
ovejas con esta característica?
12.- Si en el ejercicio 1 (pág. 30) se deseara disminuir un 50% el margen de error en la estimación de
manteniendo el nivel de confianza:
a) ¿Cuál debería ser el tamaño de la muestra?
b) ¿Cuál sería el tamaño adecuado si Ud. sabe que el núcleo de selección cuenta con una población de 450
machos?
13.- Se compraron lechones para engorde en condiciones de crianza intensiva. Por compras anteriores,
se sabe que la varianza del peso es de 3600 g2. ¿Cuántos lechones habría que tomar en una muestra para
estimar el peso promedio del lote con una confianza del 95% y un error no mayor a 20 g? Suponga que la
variable se distribuye aproximadamente normal.
14.- En un criadero industrial de conejos de Angora, se quiere saber con qué probabilidad el largo promedio
del pelo es de a lo sumo 5 cm, en muestras de tamaño 30.
Si bien se desconoce la distribución del largo del pelo de un conejo de Angora, se sabe que tiene un
promedio de 4,5 cm y un desvío de 2 cm. Justifique el procedimiento empleado.
15.- Los siguientes datos son los consumos de oxígeno (en ml) durante la incubación, de una muestra de 15
suspensiones celulares:
14,0 14,1 14,5 13,2 11,2 14,0 14,1 12,2
11,1 13,7 13,2 16,0 12,8 14,4 12,9
¿Proporcionan estos datos suficiente evidencia, a un nivel del 5%, de que el valor central es de al menos
12ml? Si bien no se tiene información sobre la distribución de la variable, se sabe que es simétrica.
Indique: verificación de la condición requerido a la variable, hipótesis estadísticas, región crítica, regla de
decisión, decisión y población en estudio.
16.- Un grupo de 31 animales, elegidos al azar, recibe una ración por un período de dos semanas. Con los
aumentos de peso se obtuvo: x = 420g y s = 60g. ¿Qué tamaño de muestra se debe tomar si se desea un
margen de error que sea a lo sumo de 10g, para estimar el aumento medio de peso con una confianza de
95%?
17.- En una granja de pollos se desea experimentar con una nueva dieta de engorde. Si se sabe que el
desvío estándar del aumento de peso individual en un mes es igual a 60 g, ¿qué tamaño de muestra se debe
escoger para que la estimación del aumento medio de peso no contenga un margen de error mayor a 16 g,
con una confianza del 95%? Suponga que la variable se distribuye aproximadamente normal.
18.- De una población de vacas lecheras se obtiene una muestra de 1000 vacas que se someten a la prueba
de tuberculina en la tabla del cuello, resultando 90 vacas con resultado positivo. Se desea estudiar si esta
información concuerda con la hipótesis de que la proporción (P) de positivos es 10%.
a) Interpretar el parámetro en términos del problema.
b) Plantear las hipótesis estadísticas correspondientes a esta situación.
c) Expresar variable pivotal y su distribución.
d) Expresar en forma analítica la región critica.
e) Decidir al 5%, justificando la misma. (No redacte la conclusión)
87
-COMPLEMENTARIO 4 y 5-
Guía de Trabajos Prácticos
2023 · Bioestadística
19.- De una población de bovinos se seleccionó una muestra de 25. Sesenta días después de vacunados
contra la fiebre aftosa, fueron sangrados y se determinó el título de anticuerpos contra esta enfermedad
mediante la técnica de seroneutralización en tubos (cultivo celular), obteniéndose una media de 2,3 y una
varianza de 0,64. ¿Confirman estos valores que el título promedio de anticuerpos poblacionales es de 2,5?
= 0,05.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Título de ac 25 2,3 0,8 0,91 0,5429
20.- Por una experiencia se ha determinado que los valores de capacidad de cierto tipo de ampollas para
envasar vacunas sigue una distribución normal con media 10ml y desviación estándar 0,1 ml. Luego de dos
años de uso continuo, se toma una muestra de 25 ampollas, obteniéndose una media de 9 ml y una desviación
estándar de 0,2 ml. ¿Puede considerarse, con un nivel de significación del 5%, que se mantiene la variabilidad
luego de 2 años?
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
volumen 25 9,00 0,2 0,87 0,3416
21.- Se ha establecido que la media y la desviación estándar de la longitud del cráneo humano son de 20,5cm
y 3,61cm, respectivamente. Suponga que un explorador descubre una isla, en donde los nativos han estado
aislados del resto del mundo. Una muestra de 25 de estos nativos indica una longitud media del cráneo de
24,6cm. ¿Tienen los investigadores suficiente evidencia para suponer que la longitud media del cráneo de los
habitantes de la isla es superior? Use = 0,05
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Longitud 25 24,6 3,3 0,91 0,6728
22.- Se estudió el tiempo al primer amamantamiento en 16 cerdos recién nacidos, obteniéndose los
siguientes resultados(en minutos):
7,8 8,0 9,0 10,0 10,9 8,5 9,5 7,0
6,3 8,7 9,1 10,3 9,3 9,7 9,9 9,8
¿Concuerdan estos resultados con la afirmación de que la desviación estándar del tiempo al primer
amamantamiento es mayor a 1,1 min, con un nivel de significación del 5%?
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Tiempo 16 8,9906 1,2343 0,9506 0,7130
23.- Por razones económicas sólo se continuará fabricando determinado medicamento si es utilizado por
más del 25% de los establecimientos hospitalarios. Para esto se realizó un estudio sobre 150 establecimientos
de los que 40 respondieron que lo usaban. ¿Qué aconsejaría al fabricante, al nivel del 5%?
24.- Una población de insectos de la especie X tiene una longitud media de sus antenas de 3,2 cm y un desvío
estándar de 1,8 cm. De una muestra aleatoria de 16 insectos tomados de la población se obtuvo un promedio
de 2,72 cm y un desvío de 1,16 cm. ¿Puede suponerse, con un nivel de significación del 5%, que hubo una
disminución en la longitud promedio de la antena? Suponga que la distribución es simétrica.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Longitud 16 2,72 1,16 0,87 0,0483
Prueba de Wilcoxon
variable N Suma(R+) E(R+) Var(R+)
88
-COMPLEMENTARIO 4 y 5-
Guía de Trabajos Prácticos
2023 · Bioestadística
Longitud 16 37,00 68,00 373,88
25.- En una muestra de 50 pollitos tratados con una vacuna, se encontraron 10 muertos, ¿cuál es el número
adecuado de pollitos para estimar la proporción de muertos con un error de hasta 10% y una confianza del
95%?
26.- Al estimar el parámetro poblacional , con un nivel de confianza del 95% y una muestra de tamaño 20,
se tienen las siguientes alternativas:
s x
A 10 100
B 11 110
C 9 90
¿En cuál de ellas se tendrá un mayor margen de error en la estimación? Considere que provienen de variables
con distribución normal. Demuestre su respuesta.
27.- Se realizó un estudio para analizar la efectividad de un nuevo medicamento sobre cierta anomalía en
embriones de pollo. Se inyectaron 50 huevos fertilizados y en el vigésimo día de incubación se observó que 12
de ellos presentaban anomalía.
a) Estimar la proporción poblacional de embriones sanos mediante un intervalo de confianza del 95%.
b) ¿Qué cantidad de huevos habría que haber inyectado para que, con un nivel de confianza del 95%,
se pudiera estimar la proporción poblacional de embriones sanos de modo que el margen de error no
sea mayor que 0,1?
28.- Un laboratorio investiga sobre el consumo diario de aves en crecimiento. Con tal motivo se desea
determinar el tamaño de la muestra a tomar para que la semiamplitud de la estimación del consumo medio
diario no supere 5 g, suponiendo que se decide trabajar con una confianza del 95% y que en una muestra
piloto de 30 aves se obtuvo un promedio de 100 g y una varianza de 490 g2.
29.- Se examinó una muestra de 100 empleados de un hospital que habían estado en contacto con sangre
o sus derivados, para averiguar si presentaban evidencia serológica de hepatitis B. Se encontró que en 23 de
ellos se obtuvieron resultados positivos. ¿Es posible concluir a partir de estos datos que la proporción de
individuos que presentaron resultados positivos es a lo sumo del 15%? (=0.01)
Indique: variable en estudio, condición de distribución requerido para ésta, hipótesis de trabajo, hipótesis
estadísticas, región crítica, decisión, interpretación biológica del parámetro en estudio acorde a la decisión
tomada y población.
30.- Como parte de un proyecto de investigación, se seleccionó una muestra de 25 niños nacidos en los
hospitales de un área metropolitana. La desviación estándar de los pesos de los niños obtenida fue de 150
g. ¿Proporcionan estos datos la evidencia suficiente para afirmar que el desvío poblacional es superior a
100g? Suponga que la variable se distribuye aproximadamente normal y que = 0,05.
Indique: variable en estudio, hipótesis estadísticas, región crítica, decisión, interpretación biológica del
parámetro en estudio acorde a la decisión tomada y respuesta a la pregunta planteada.
31.- Un establecimiento dedicado a la elaboración de alimentos balanceados para aves, afirma que su
producto, si bien aumenta el peso promedio de las aves, no influye en la variabilidad del mismo. En una
muestra de 16 aves que habían consumido el alimento se obtuvo un peso promedio de 85g con una
varianza de 225g2. ¿Se puede suponer que la afirmación del establecimiento en cuanto a la variabilidad es
correcta, teniendo como dato que la varianza del peso de las aves es de 200g2? (=0.05).
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Peso 16 85 15 0,94 0,4464
Indique: hipótesis de trabajo, hipótesis estadísticas, región crítica, decisión, interpretación del nivel de
significación y población en estudio.
32.- Antes del inicio de un programa de inmunización contra la rubéola realizado en un área metropolitana,
una encuesta reveló que 150 integrantes de una muestra de 500 niños de primaria habían sido inmunizados
contra esta enfermedad. ¿Son compatibles estos datos con el punto de vista de que el 50% de los niños de
primaria de dicha área habían sido inmunizados contra la rubéola? (=0,10)
89
-COMPLEMENTARIO 4 y 5-
Guía de Trabajos Prácticos
2023 · Bioestadística
RESULTADOS
EJERCICIOS PROPUESTOS
PROBABILIDAD
1.- a1) 0,30; a2) 0,10; b1) 0,061; b2) 0,079
2.- a1) 0,125; a2) 0,363; a3) 0,1; b1) 0,0031; b2) 0,2024; b3) 0,494
3.- a) 0,53; b) 0,03; c) 0,18; d) 0,36
4.- a) 0,00428; b) 0,996
5.- sensibilidad = 0,99; especificidad = 0,98; a) VPP = 0,0476; b) VPN = 0,999
VARIABLE ALEATORIA
1.- d) 0,75; e) 0,55; f) 0,65; g) 2,5; h) 2
2.- c) 0,75; d) 0,24; e) 1; f) 1; g) 0,9375
3.- c1) 0; c2) 0,5; c3) 0; d) 3,6
4.- c) 0,1; g) 3,8; 11,4 y 3,3; h) 0,85; i) 0,05; j) 0; k) 1
5.- d) 0,0687; e) 1; f) 0,0188; g) 1,92, 1,92 y 17,28
6.- c) 0,984
7.- b) 0,17715; c) 0,3336; d) 364,59kg.
8.- a) 1) 0,995; 2) 0,025; 3) 0,01; 4) 1,325; 5) –1,725; 6) a = -1,725 b = 1,725
b) 1) 0,99; 2) 0,995; 3) 0,975; 4) 1,372; 5) –1,812; 6) a = -1,812 b = 1,812; 7) E(t)=0 V(t)=1,25
9.- a) 1) 0,95; 2) 0,25; 3) 24,48; 4) 40,26; 5) a = 18,49 b = 43,77
b) 1) 0,75; 2) 0,05; 3) 11,04; 4) 22,31; 5) a = 7,261 b = 24,996; 6) E(X)= 15 V(X)= 30
10.- b) p(X=0) = 0,7157 ; p(X=1) = 0,268 ; p(X=2) = 0,0157 ; d) P(X>1) = 0,0157 y P(X<2) = 0,984
11.- 1.a) 0,666 ; 1.b) 0,30 ; 2.a) 0,0263 ; 2.b) 0,052 ; 3.b) 0,4044 ; 3.c) 0
12.- a) 0,1746; b) 0,3297; c) 0,182
13.- a1) 0; a2) 0,69146; a3) 0,30857; b) E(X+Y)= 186 y V(X+Y)= 145
ESTADISTICA DESCRIPTIVA
2.- c) X = 2,96; Me = 3; Mo = 3; d) P24= 1e) S2 = 4,03; S = 2,009; C.V.= 67,87%
3.- d) X = 31,79; Me = 33,05; Mo = 34,5; e) S2 = 36,32; S = 6,027; C.V. = 18,96%
4.- a) V.R. = zanahoria, V.A. = lechuga y zanahoria; b) V.R. = lechuga, V.A.= chaucha
5.- a) anatomía, estadística; b) histología
6.- c) n = 23; d) X = 203,04; S = 21,41
7.- f) X = 113,8; S2 = 276,87;
g) int. Me: [110,5 – 120,5) Me = 113,3; int. Md: [110,5 – 120,5) Md = 112,72
10.- b) X =12,63 ; S2 =0,692 ; Mo=12 ; C1=12 ; C3=13
e) 13
f) P(X≥13)= 0,487
g) P(1ro: 13 y 2do: 15)= 0,008
h) C1=Me= 12; P(x=11/x є[C1;C2])= 0,0596
11.-c)GRANJA A: X =5,89 ; Me= 6,4 ; Mo= 6,75
GRANJA B: X =5,16 ; Me= 5,1 ; Mo= 4,48
d)GRANJA A: s2= 2,97 ; s= 1,72 ; CV%= 29,2 ; dC= 2,5
GRANJA B: s2= 1; s= 1 ; CV%= 19,38 ; dC= 1,6
f) GRANJA A: 53,3%
GRANJA B: 20%
Granjas A y B: 36,6%
g) 0,3707
h) 0,0007; 0,1737
12.- c) X =134,38; Me=145; Mo=158,33
d)100 gramos; e)Me=166,75; S2=3623,09; f)0,2
13.- c) 1) 0,7454; 2) 0,02275; 3) 0,47725; 4) 0,02275; 5) 67,8 h
d) 1) 0,99609; 2) 0; 3) 0,5; 4) 0; 5) 61,95 h
90
-RESULTADOS-
Guía de Trabajos Prácticos
2023 · Bioestadística
ESTIMACIÓN
1.- [45,11 ; 48,01] kg
2.- c) 2(19,0.025)=8,907 2 (19,0.975)=32,85; d) S=0,2093m; I.C.:[ 0,158 ; 0,307] m
3.- a.1) p̂ = 0,85 I.C.: [0,802 ; 0,898] ; a.2) p̂ = 0,15 I.C.: [0,102 ; 0,198]; c) P(x 1) = 0,9126
4.- c) no = 129,39 130 individuos; d) t 129 ; 0,995 uso t 100 ; 0,995 = 2,626 ; e) [21,4 ; 24,6] UI
5.- b) no=18,49 19 familias; c) no= 15,53 16 familias
6.- a) 2; 211; 0.05 = 4,575 y 211; 0.95 = 19,68
b) El intervalo de confianza fue ASIMÉTRICO con respecto al estimador puntual
7.- no = 15,36 16 unidades
8.- X 102,5 S2 = 501,31
9.- a) I.C.: [4,71 ; 5,89] años; b) no= 100 vacas; c) nf= 83,3 84 vacas
10.- a) X =25,45 ; S=1,6026; c) [24,562 ; 26,338]; d) [1,1733 ; 2,5274]
11.- b) 0,436; I.C.:[03358 ; 0,5362]; c) 0,3696; I.C.:[0,3077 ; 0,4315]
12.- 0,18673
PRUEBA DE HIPÓTESIS
1.- a) H1: > 400 tHo = 1 No rechazo H0 ; c) zHo = 1,11 No rechazo H0
2.- c) H1: 2 < 1,2 d) R. C. : 2 3,325
3.- R. C. : Z 1,64 ZHo = 2,5 Rechazo H0
4.- H1: 2 > 81 R. C.: 2 18,31; 2Ho = 14,61 No rechazo H0
5.- c2) 0,75 ; c3) 0,01 ; c4) 0,4148 ; 0,5852 ; c5) H 1: p < 0,3 ; ZHo= -0,87 ; No rechazo H0
6.- a) H1: p > 0,6 ; ZHo= 1,63 ; No rechazo H0 ; b) 90
7.- Normalidad: H0: X se distribuye normal vs H1: X no se distribuye normal; S-W: p-valor= 0,0283
Rechazo H0 ; T+=156 ; No Rechazo H0
8.- Normalidad: H0: X se distribuye normal vs H1: X no se distribuye normal; S-W: p-valor= 0,0196
Rechazo H0 ; T+=127,5 ; No Rechazo H0
9.- Normalidad: H0: X se distribuye normal vs H1: X no se distribuye normal; S-W: p-valor= 0,9323
No Rechazo H0; tH0=0,84 No Rechazo H0
10.- Normalidad: H0: X se distribuye normal vs H1: X no se distribuye normal; S-W: p-valor< 0,0001
Rechazo H0 ; <0,76 ; Rechazo H0
91
-RESULTADOS-
Guía de Trabajos Prácticos
2023 · Bioestadística
PROBABILIDAD
2.- a) 0,83; b) 1
10.- a) 0,7; b) 0,5; c) 0,71; d) 0,7
14.- c) p(A)=0,33
23.- a) 0,329; b) 0,411; c) 0,671
29.- a) 0,5; b) 0,7; c) 0,47; d) 0,32
36.- a) 0,68; 0,12; b) 0,8; 0; c) 0,65; 0,15
37.- a) 0,174; b) 0,42; c) 0,197; d) 0,0117
38.- a1) 0,08; a2) 0,242; a3) 0,33 b) No
41.- a) 0,864; b) 0,0038; c) 0,829
43.- a) 0,443; b) 0,015; c) 0,865
VARIABLE ALEATORIA
1.- c) 0; d) 0,0006; e) 0,0307; f) 0,75
5.- a) 0,06681; b) 0,45994; c) 0,5; d) 70; 110 días
6.- c) 0,7747; d) 0,0025; e) 0,2129; f) 0,4382; g) 7,2
9.- a) 0,95254; b) 0,2586; c) 149,89 mmHg
11.- c) 0; d) 0; e) 0,00224; f) E(X) = 0,6 V(X) = 0,57
12.- c) 0; d) 0,9444; e) 0,0003; f) 0,1841; g) 20 animales no vacunados
13.- c) 0,103; d) 0,2001; e) 0,5699
15.- a) 0,9611; b) 0,945; c) 0,965
16.- a) 0,80124; b) 0,7734; c) 1
17.- c) 0,124; d) 0,00273; e) 0,7
18.- a1) 0,01; a2) 0,85; b) 1,708
19.- a) 0,944; b) 0,3125; c) 0; d) 0,3125; e) 0
21.- 87,32 mg/100 ml
22.- c) 0,9976; d) 0,0859; e) 0,8702
24.- 16,82 h
25.- a) 0,25; b) 0,75; c) 0; d) 1; e) 0,25; f) 0,36
28.- a) 1; b) 0,125; c) 0,9844; d) 0,875; e) 0,125
30.- a) 6,262; 27,488 ; b) 8,231; c) 26,51 o 34,76
32.- a) 0,15; d) 0,75; g) 2,2
33.- b) 0,025; d) 476 tiradas ; e) 2,47
ESTADISTICA DESCRIPTIVA
3.- f) X = 8,58; Me = 8; Mo = 5,6,8 y 10; S2= 7,45; S = 2,73; C.V.= 31,8%
7.- f) X = 19,68; Me = 19; Mo = 19; S2 = 16,06; S = 4,007; C.V.= 20,36%
8.- a) S2 o S; b) C.V.
20.- e) X = 196,6; S2 = 155,66; C.V.= 6,345%; f) int. Me [190 – 200); int. Md [190 – 200);
g) 60% ; i1) 216,26 i2) 188,35
26.- a) 0,87286; b) 0,04746
27.- b) X = 14,1; Me = 15; Mo = 17; C.V. = 23,94%; d1) Y = 20,445; d2) SY = 4,90
31.- e) X = 31,944; Me = 33,3; Mo = 34,725; f) S2 = 41,0184; S = 6,404; C.V.= 20,04%; h) 24%
34.- c) X = 2,92; Me = 2,95; Mo = 2,328; d) C.V. = 27,72%; e) Y = 3,42
35.- a1) 0,97193; a2) 0,874344; b1) 13; b2) 9
42.- c) 24%; d) X = -0,5178; S = 0,0069 e) Aprox. simétrica
92
-RESULTADOS-
Guía de Trabajos Prácticos
2023 · Bioestadística
ESTIMACIÓN
1.- a) [177,09 ; 182,91] ml ; b) [30,49 ; 96,77] ml2
2.- a) 16 g e Int. de Conf. [13,936 ; 18,064] g ; b) 47,33 48 mejillones
3.- b) t15 ; c) t15 ; 0,975 = 2,131 t15 ; 0,025 = -2,131 ; d) [14,201 ; 15,799] Kg
4.- S2= 0,384 g2
5.- a) [0,087 ; 0,247] Kg2 ; b) 229 ; c) 229 ; 0,975 = 45,722 229 ; 0,025 = 16,047
7.- S2= 17934,57 (unidades correspondientes) 2 ; X = 500 unidades correspondientes
9.- b) n0 = 21,32 22 gallinas, nf=21,24 22 gallinas
10.- n0 = 17,72 18 bovinos
11.- d = 0,102
12.- a) n0=100,6 101 machos; b) nf = 82,22 83 machos
13.- n0 = 34,57 35 lechones
14.- 0,91466
16.- n0 = 138,29 139 animales
17.- n0 = 54,02 55 pollos
25.- n0 = 61,46 62 pollitos
26.- A = 4,68 B = 5,148 C = 4,212
27.- a) [0,6424 ; 0,8776] ; b) n0 = 70,07 71 huevos
28.- 76 aves
33.- 0,113
34.- 0,025
PRUEBA DE HIPÓTESIS
6.- H1: < 30 R. C. : z -1,64 ; zH0= -4,55
8.- H1: > 10 R. C.: Z 1,64 ZHo = 4 Rechazo Ho
15.- H1: < 12 R. C.: T 30 THo = 113 No Rechazo Ho
18.- b) H1: p 0,1; e) ZHo = -1,05 No rechazo H0
19.- H1: 2,5 tHo = -1,25 No rechazo H0
20.- H1: 2 0,01 2Ho = 96 Rechazo H0
21.- H1: > 20,5 ZHo = 6,21 Rechazo H0
22.- H1: 2 > 1,21 2Ho = 18,72 No rechazo H0
23.- H1: p > 0,25 ZHo = 0,57 No rechazo H0
24.- H1: < 3,2 THo = 37 No Rechazo H0
29.- H1: p > 0,15 R.C.: Z 2,33 ZHo = 2,24 No rechazo H0
30.- H1: 2 > 10000 R.C.: 2 36,42 2Ho = 54 Rechazo H0
31.- H1: 2 200 R.C.: 2 6,262 y 2 27,488 2Ho = 16,875 No rechazo H0
32.- H1: p 0,5 R.C.: Z -1,64 y Z 1,64 ZHo = -8,94 Rechazo
93
-RESULTADOS-
94
-RESULTADOS-
Guía de Trabajos Prácticos
2023 · Bioestadística
Problema 1
Nota: En los casos que haya que calcular probabilidades expresar simbólicamente lo solicitado e indicar
tanto el reemplazo numérico como el resultado.
En un experimento de inmunología, se tomaron 111 ratones que fueron divididos en dos grupos.
Cincuenta y siete de ellos fueron tratados con una dosis estándar de una bacteria patógena y los restantes
fueron tratados además de con la bacteria patógena con un antisuero. Luego de un tiempo de incubación
suficiente para que la enfermedad causada por la bacteria se desarrolle, se contabilizó en cada
tratamiento la cantidad de ratones muertos y vivos. En el grupo que fue tratado solamente con la bacteria
patógena se contaron 29 vivos, mientras que en el grupo de bacteria más antisuero se contabilizó 13
muertos.
MUERTOS VIVOS
BACTERIA MAS ANTISUERO
BACTERIA
Problema 2
0 si x 1
F(x)= x2 -1 si 1 x 2
1 si x 2
1) (4p) Enunciar y verificar las condiciones para analizar si F(X) es función de distribución.
2) (3p) ¿Cuál es la probabilidad de que el valor de la variable sea a los sumo 1.4?
3) (3p) ¿Cuál es la probabilidad de que el valor de la variable sea mayor a 0,5 y menor o igual a 1,3?
4) (3p) ¿Cuál es la probabilidad de que el valor de la variable sea 1,25?
5) (6p) Enunciar la definición de varianza de una variable aleatoria continua y 3 propiedades de la
misma.
6) (6p) Definir una variable con distribución binomial, explicitar su distribución y verificar las
condiciones que cumple.
95
-MODELO 1er PARCIAL-
Guía de Trabajos Prácticos
2023 · Bioestadística
Problema 3
El registro de la producción bimestral de huevos por gallina de un establecimiento de la
provincia de Buenos Aires con 100 gallinas tiene la siguiente tabla.
11
10
0
A B c
Problema 4
En un establecimiento de la Provincia de Santa Fe, se seleccionaron 25 cerdas, en las cuales se registro
el tiempo de lactancia de sus camadas. Si la lactancia de los lechones en los sistemas de producción
extensivos tiene distribución normal con una media de 35 días y una varianza de 49 días2.
1) (3p) Cuál es la probabilidad de que el tiempo sea de al menos 34 días?
2) (4p) Explicitar simbólicamente la distribución de la media del tiempo de lactancia. Justificar
3) (3p) ¿Cuál es la probabilidad de que el tiempo medio sea de al menos 33,208 días?
4) (3p) ¿Cuál es el tiempo medio de la lactancia de los lechones superada por el 30% de las cerdas?
5) Si se eligen 9 cerdas en forma aleatoria, calcule la probabilidad de que...
i) (3p)...el tiempo medio de lactancia de 3 de ellas sea de al menos 33,208 días
ii) (3p)...el tiempo medio de lactancia de al menos 2 de ellas sea de cómo máximo 33,208 días
6) (6p) Explique que es un experimento Binomial y enuncie las condiciones de binomialidad en
términos del problema.
96
-MODELO 1er PARCIAL-
Guía de Trabajos Prácticos
2023 · Bioestadística
Problema 1
Se están estudiando las características seminales de la llama (Lama glama), para lo cual se miden varias
variables, entre ellas el volumen espermático que se sabe que tienen una distribución normal con varianza
2,1025 ml2.
a) (3p) Definir la variable en estudio.
b) (7p) Hallar el tamaño de muestra necesario para calcular un intervalo de confianza para la media
poblacional del volumen espermático de la llamas, sabiendo que se pretende una amplitud de 0,7. (Usar
1- = 0,95).
c) (10p) Suponiendo que se extrajo una muestra con el tamaño calculado en el punto anterior y que el
valor medio calculado fue de 3,22 ml, hallar e interpretar el correspondiente intervalo de confianza del
99%
d) (5p) También se quiere estudiar la proporción poblacional de espermatozoides normales. Enunciar y
verificar las condiciones para estimar a este parámetro.
e) (5p) Dar un ejemplo de un intervalo de nivel asintótico, justificar.
Problema 2
El peso del ñandú petiso de la Patagonia, [choique o ñandú overo (Pterocnemia pennata)] es una variable
con desvío estándar poblacional de 3,2 kg. Con un muy buen manejo se sospecha que se pueden
conseguir animales de peso vivo menos variable. Para probar la sospecha se trabaja con un lote de 25
crías en tales condiciones de manejo consiguiendo un peso medio de 28,5 kg y una varianza de 9 kg2.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Peso 25 28,5 3 0,93 0,3012
Problema 3
Un tambero de la provincia de Santa Fe está al borde de la quiebra y todas sus esperanzas están puestas
en la producción del próximo mes; por lo cual decide utilizar una dieta más concentrada para aumentar
la producción lechera de sus vacas. Para que el negocio sea rentable, el valor medio de la producción
diaria no debe ser menor a 17,5 litros/vaca.
16,3 18,2 17 16,6 17,2 18
16,2 15,2 17,9 17,3 16,7
a) (5p) Defina la variable en estudio.
b) (10p) Verifique las condiciones para elegir la variable pivotal aplicadas al problema.
c) (5p) Especifique el parámetro en estudio
d) (15p) ¿Es posible afirmar con un nivel de significación del 5% que el tambero salvará su empresa?
97
-MODELO 2do PARCIAL-
Guía de Trabajos Prácticos
2023 · Bioestadística
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
producción 11 16,96 0,89 0,85 0,0804
Prueba de Wilcoxon
variable N Suma(R+) E(R+) Var(R+)
producción 11 13,50 33,00 126,38
Firma ……………………………
98
-MODELO 2do PARCIAL-