Curso Estad.-11
Curso Estad.-11
Curso Estad.-11
11.1 Introducción
Las razones para efectuar una inferencia en una población, en lugar de estudiarla directa-
mente, pueden ser: tamaño de la población infinito, muestreo destructivo, población finita pero
demasiado grande, razones de costo o tiempo, que aconsejan tomar muestras. Hay dos maneras
básicas de hacer estimaciones:
Estimaciones por intervalos: se estima el parámetro desconocido con un intervalo, el cual tiene
asociado una cierta probabilidad de ocurrencia.
Siempre es más aconsejable estimar con intervalos en lugar de hacerlo con un solo valor
puntual, por las mismas razones que tienen los granjeros para no poner todos los huevos en una
misma canasta. En efecto, suponiendo que un paciente concurre a varios bioquímicos a efectuar-
se el mismo análisis y estos le informan, por ejemplo: Bioq. A = 85 mg/dl; Bioq. B = 75 mg/dl;
Bioq. C = 90 mg/dl. El paciente podría llegar a desconfiar de estos valores por la diversidad de
resultados obtenidos: a simple vista le parecerían diferentes. Por su parte, el médico que encargó
el trabajo podría mandar a hacer de nuevo el análisis. Muy diferente hubiese sido la situación si
Bioestadística aplicada a Bioquímica y Farmacia 11-2
en sus informes hubieran usado intervalos como: Bioq.A: (85 ± 15)mg/dl; Bioq. B: (75 ± 4)
mg/dl y el Bioq. C: (90 ± 20) mg/dl. En este caso hay coincidencia entre los tres informes, A dice
entre 70 y 100, B dice entre 71 y 79 y C dice entre 70 y 110. El intervalo informado por B cae
dentro de los otros dos y el de A cae dentro del intervalo informado por C. Esto es, hay una zona
donde los tres informes coinciden, cosa imposible de ver si se hubieran usado estimadores pun-
tuales. Por su parte, en la industria farmacéutica lo normal es trabajar con límites superiores e in-
feriores en las composiciones químicas de los medicamentos, tanto para el proceso productivo
como para su posterior control de calidad. Otro tanto ocurre en la industria alimenticia o de cos-
méticos. La idea es siempre informar o establecer la probabilidad de que el verdadero valor caiga
dentro del intervalo informado. Usar intervalos, entonces, es una forma más prudente de infor-
mar que la puntual.
Una estimación puntual se logra con: µe = µ donde, por ejemplo, si e es la media aritméti-
ca, el valor µe es el promedio de las medias muestrales bajo la condición de tener una cantidad de
muestras superior o por lo menos igual a 30. Este tipo de mediciones no es exacto sino que hay
una cierta incertidumbre al hacerla, llamada error típico de estimación: σe ,= SE(e), dado por el
error estándar de la distribución muestral multiplicada por un cierto factor. Todo esto se muestra
en la segunda columna de la Tabla 10.1. Para el caso de la media es: SE(e) = σe = σ / n . Enton-
ces, se puede construir la estimación por intervalos con:
µ ∈ ( µe ± Zα . σe) (a)
11.1 se muestran algunos coeficientes de uso frecuente. A veces, se necesitan intervalos diferen-
tes, de tipo abierto, donde no se necesitan dos valores extremos sino solo uno. En tal caso:
Estos intervalos abiertos por izquierda o por derecha se denominan de una cola, mientras que los
comunes para la estimación de parámetros poblacionales son de dos colas. En la Figura 11.1 se
muestran las dos formas usuales de una y de dos colas, con los respectivos valores de zα en las
Tablas 11.1 y 11.2.
En clínica la notación de los intervalos de confianza para un nivel de confianza NC% es:
CI NC% ( µe ± Zα . SE(e))
Esta es la notación recomendada para los trabajos en Medicina desde hace unos años para expre-
sar los resultados de investigaciones en publicaciones científicas.
µ ∈ ( X ± Ζα σ / n )
En nivel de significación adoptado hará variar el ancho del intervalo de confianza. Como puede
verse en la Tabla 14.1, a medida que aumenta el Nivel de Confianza aumenta el coeficiente de
confianza Ζα mientras los demás términos no se alteran. Por su parte, cuanto mayor sea el inter-
valo, mayor será el error ∆x = Ζα σ / n (recordando la expresión general del error vista). Esto
significa que se tendrá una menor precisión. Se puede formular ahora una regla general para to-
dos estos casos: a mayor confianza, menor precisión. Conviene desarrollar ejemplos para ilustrar
esta tesitura, como sigue:
Ejemplo 1) Suponiendo que a un paciente se le extrae una muestra de sangre y al suero obtenido
se lo fracciona en 50 alícuotas, luego a cada una se le determina la creatinina, y con los valores
medidos se obtienen un promedio de 10 mg/dl y un desvío de 2,2 mg/dl. El verdadero valor de la
creatinina en el paciente se puede estimar con un nivel de confianza del 95 % (Ζα = 1,96) con:
Eso significa que se tiene una probabilidad del 95 % de encontrar la creatinina real del paciente
entre 9,4 y 10,6 mg/dl. Si se quiere aumentar la confianza al 99% el nuevo intervalo tendrá una
mayor indeterminación, o sea, el intervalo será más ancho: entre 9,2 y 10,8 mg/dl.
µ ∈ ( 10 ± 2,58 . 2,2 / 50 ) mg/dl = ( 10,0 ± 0,8 )mg/dl !CI 99% (9,2 ; 10,8)
Se trata de un caso de intervalo de una sola cola. El 99,9% del área bajo la curva normal tipifica-
da debe quedar a la izquierda de un valor crítico (como el dibujado en el Gráfico 14.1). O sea,
Esto significa que hay un 99,9% de confianza de que el contenido de Sulfato de Neomicina del
medicamento examinado nunca supere 95,09 mg.
Si se hubiese tratado de determinar el intervalo de estimación del verdadero contenido del Sulfa-
to en el medicamento, entonces se debería calcular su intervalo de confianza con:
Con esos datos se puede obtener: µ ∈ ( 7,5 ± 1,96 . 0,123) ~ ( 7,50 ± 0,24 )
NOTA: cuando el valor poblacional del desvío estándar es desconocido, como en los casos anteriores, se
suele aproximar con el desvío estándar muestral para resolver los problemas (σ ~ DS).
p .q
µ ∈ ( p ± Ζα . )
n
Ejemplo 4) Se lanza una moneda al aire 100 veces y se obtienen 56 caras. El intervalo de con-
fianza del 99 % para la probabilidad de sacar cara con tal moneda se calcula con:
p .q 0,5 . 0,5
p ~ 56/100 = 0,56 Y el desvío con: σp = = = 0,05 O sea,
n 100
Expresado de otra forma: µ ∈ ( 56 ± 13 )%. Esto es, hay una probabilidad del 99 % de obtener
entre 43 y 69 caras, si se arroja 100 veces esa moneda al aire.
Bioestadística aplicada a Bioquímica y Farmacia 11-6
Ejemplo 5) En un estudio por cohortes se tuvo 50 casos de enfermos en un total de 200 sujetos.
Se esperaba una prevalencia del 20% en la enfermedad; hallar el intervalo de confianza:
p .q 0,2 . 0,8
p ~ 50/200 = 0,25 Y el desvío con: σp = = = 0,03 O sea,
n 200
σ
µ ∈ ( DS ± Ζα . )
2n
Y para la varianza es:
2
µ ∈ ( DS2 ± Ζα . σ2 )
n
En ambos casos se usa la aproximación σ ~ DS para resolver los problemas prácticos. Para ilus-
trar su aplicación se tomarán los datos de problemas anteriores:
(1) µ ∈ ( 2,2 ± 1,96 . 2,2 / 2 . 50 ) mg/dl = ( 2,2 ± 0,4 )mg/dl !CI 95% (1,8 ; 2,6) (desvío)
2
µ ∈ ( 4,84 ± 1,96 . 4,84 ) mg/dl = ( 4,8 ± 1,9 ) mg/dl ! CI 95% (2,9 ; 6,8) (varianza)
50
(2) µ ∈ ( 6,0 ± 1,96 . 6 / 2 . 36 ) mg/dl = ( 6,0 ± 1,4 )mg/dl ! CI 95%(4,6 ; 7,4) (desvío)
La técnica más importante para hallar estimadores se debe a R.A. Fisher y es el Método
de Máxima Verosimilitud (Likelihood). Consiste en hallar una función de verosimilitud para cada
caso y así elegir, como estimador de valor poblacional desconocido, al valor que hace máxima a
esta función. Su desarrollo matemático excede los límites del presente trabajo quien desee verlo
con más detalle puede recurrir a texto, más específicos como los de H. Crámer, etc. Por ahora,
basta mencionar que el estimador máximo verosímil de un índice de tendencia central es la media
aritmética y de un índice de dispersión es el desvío estándar.
Ξ (Med) = µMed = µ
Es un estimador sesgado pues (n-1) / n siempre diferente de la unidad y eso sesga la estimación.
Sin embargo, el sesgo se elimina cuando para el cálculo de la varianza se usa la fórmula
Estimador eficiente: si las distribuciones muestrales de dos estadígrafos tienen la misma esperan-
za (o media), aquel que tenga menor error de estimación (varianza) será el más eficiente de am-
bos. En otro caso, se dice que el estimador es no eficiente.
Existen otros métodos para la obtención de los estimadores como el de los momentos
desarrollados por K. Pearson, el de Ráo-Cramer o el de suficiencia para funciones de densidad
conjunta de probabilidad. Sin embargo, para los alcances de esta obra basta saber que los estima-
dores máximos verosímiles cumplen a la vez con las propiedades de ser insesgados, eficientes y
suficientes. En resumen, para efectuar estimaciones apropiadas, cuando se pueda se deben usar
las estimaciones por intervalo antes que las puntuales y se deben emplear los estimadores máxi-
mos verosímiles para construirlos. Los niveles de confianza para el caso de variables biológicas
se adoptan por costumbre en 95 %, 99 % y 99,9 %, y se calculan siempre los tres para poder in-
Bioestadística aplicada a Bioquímica y Farmacia 11-8
formar en las publicaciones científicas, como se podrá ver mejor en el próximo capítulo. En Me-
dicina, lo habitual es usar el nivel del 95% para expresar los resultados, lo que se hace extensivo
a sus disciplinas derivadas como: Epidemiología, Inmunología, y otras.
Donde el SE (e1 - e2) = σ1,2. Los dos casos más interesantes son la media y las proporciones. Se
reemplazan los valores de los estadígrafos y los de sus respectivos errores típicos (ver Tabla 4)
en la fórmula anterior y se puede obtener para la media aritmética:
σ 12 σ 22
µ x1 − x 2 = ( x1 − x 2 ) ± Zα . +
n1 n 2
p1.q1 p 2 .q 2
µ p1 − p 2 = ( p1 – p2 ) ± Zα . +
n1 n2
Ejemplo 1) Se tomaron 200 muestras aleatorias de presión sistólica a niños cuyos padres son hi-
pertensos, obteniéndose una media de 107 y un desvío de 7. Luego se tomaron 100 muestras de
niños cuyos padres tienen la presión sanguínea normal, y se obtuvo una media de 98 con un des-
vío de 6. Obtener los límites de confianza del 95 % a la diferencia de medias.
σ 12 σ 22 49 36
µ x1 − x 2 = ( x1 − x 2 ) = 107 - 98 = 9 y SE(1-2) = σ1-2 = + = + = 0,778
n1 n 2 200 100
Ejemplo 2) Se inoculan dos organismos aislados durante dos epidemias distintas, a dos muestras
diferentes obtenidas de la misma población. A las dos semanas se enferman el 68,5 % de las 200
pruebas realizadas con el primer organismo, y el 65,3 % de las 150 pruebas efectuadas para el
segundo caso. Hallar un intervalo de confianza de esta diferencia de proporciones encontradas.
Capítulo 11 Teoría de la estimación estadística 11-9
Esto significa que hay un 95% de probabilidades de que el verdadero valor de la diferencia de los
porcentajes esté entre 3,1% y 3,3%. Si se postula que la diferencia es nula, se ve que el valor cero
no está dentro del intervalo, y eso es una prueba para decidir que en realidad los datos muestran
diferencias entre los dos casos, como se explica en el capítulo siguiente.
1) Una estimación de tipo puntual es más recomendable que una por intervalos. V F
2) Un intervalo de confianza se arma con el estimador y su error típico. V F
3) La fórmula para obtener un intervalo de confianza es: ............................................... ...............
4) El mejor estimador es el máximo verosímil. V F
5) La fórmula general para la diferencia de los estadígrafos de dos muestras es: . ..............
6) Un estimador es insesgado cuando su valor esperado coincide con el valor poblacional V F
7) Los errores típicos de estimación se pueden obtener de ......................................................... ...............
8) Un estimador es más eficiente que otro cuando su error típico es mayor. V F
9) Un estimador máximo verosímil es insesgado y eficiente a la vez. V F
10) La probabilidad asociada a un intervalo de confianza se relaciona con la significación. V F
11) El valor coeficiente de confianza se calcula con α y la tabla de Gauss V F
12) El intervalo de confianza para la diferencia de medias es:.................................................. ...............
13) El intervalo de confianza para la diferencia de proporciones es: ......................................... ...............
14) A mayor nivel de confianza, mayor ancho del intervalo. V F
15) La relación entre el Nivel de significación y el Nivel de confianza es: ............................... ...............
2) La vida útil de un medicamento A se midió con 200 muestras y dio una media de 1400 días
con un desvío de 120 días. El medicamento B se determinó con 100 muestras y se obtuvo una
media de 1200 días con un desvío de 80 días. Hallar el intervalo de confianza para la diferencia
de vidas útiles de ambos medicamentos, al nivel del 95%, 99% y 99,9%.
3) El colesterol de una paciente medido 30 veces dio una media de 256 mg/dl y un desvío de 32
mg/dl. Encontrar el intervalo de confianza para el 95%.
4) A la muestra de suero de la paciente del problema anterior se la divide en 40 alícuotas y se le
mide el colesterol con un nuevo método clínico. Su media es de 280 mg/dl y su desvío de 40
mg/dl. Encontrar el intervalo de confianza para el 99%.
Bioestadística aplicada a Bioquímica y Farmacia 11-10
5) Calcular la diferencia de medias entre el método clínico y el nuevo, usando los datos de los
problemas 3 y 4 anteriores. Fijarse si el valor cero cae dentro del intervalo. Explicar los resulta-
dos obtenidos desde el punto de vista de la exactitud.
6) Calcular la diferencia de desvíos estándar encontrados en los problemas 3 y 4, expresada me-
diante un intervalo de confianza. Explicar los resultados desde el punto de vista de la precisión
en mediciones clínicas.
7) Para hacer un test VDRL se emplea el kit A en 200 pacientes y se encuentran 120 pacientes
que dieron un resultado (-). Los aciertos en (+) fueron 70 y 110 en (-). Con estos datos calcular la
Sensibilidad y Especificidad de A y B. Si con los mismos pacientes se empleó el Kit B y resulta-
ron 140 pacientes con (-), mientras el número de aciertos en (+) fue de 55 y en (-) 130. Obtener
los intervalos de confianza al 95% para cada uno de los dos kits usados.
8) Se midieron 50 alícuotas de un suero con el Kit de Glucosa marca 1, y otros 50 con la marca
2. Los resultados fueron:
Marca 1: entre (80-80,9) 8 veces, (81-81,9) 22 veces, (82-82,9) 15 veces y 5 entre (83-83,9);
Marca 2: entre (80-80,9) 6 veces, (81-81,9) 30 veces, (82-82,9) 10 veces y 4 entre (83-83,9).
a) Obtener los intervalos de confianza para las medias de cada método y para los desvío es-
tándar, a un nivel del 95% y del 99%.
b) Si el suero era uno de control con un valor de 79 mg/dl, determinar si cae dentro o fuera
de los intervalos de confianza calculados en el punto anterior.
c) Si la precisión máxima admisible para una glucosa es del 8% de acuerdo con los criterios
de Aspen. Comparar este valor límite contra los hallados en cada marca.
9) Se sabe que la concentración de coloides en el agua de un río es del 5,4 /ml. Se tomó una
muestra del mismo a la que se le agregó un reactivo. Luego de un rato se extrajo una pequeña
cantidad para analizarla en una cámara de recuento. Los resultados fueron:
Nº de coloides: 2 3 4 5 6 7 (nº/ml)
Frecuencia: 10 20 170 100 90 10
10) En un recuento de rojos en cámara se espera obtener 4,5 millones por cm3 de cierto paciente.
Se le toma una muestra de sangre y los resultados hallados son:
Detectar si el valor esperado del recuento cae dentro o fuera del intervalo de confianza para el
95% de confianza. Discutir los resultados.