1 Bioestadistica KDJKFDF

BIOESTADÍSTICA BÁSICA
Pedro Henríquez Zenteno

Apunte Docente
2015
Contenidos:
I.- INTRODUCCIÓN
II.- DEFINICIONES BÁSICAS EN ESTADÍSTICA
III. POBLACIÓN Y MUESTRA
IV.- MEDIDAS DE TENDENCIA CENTRAL
V.- MEDIDAS DE DISPERSIÓN
VI.-MEDIDAS DE FRECUENCIA, ASOCIACIÓN E IMPACTO
VII.- BIBLIOGRAFÍA
I.- INTRODUCCIÓN
La bioestadística es una rama de la estadística que se ocupa de los problemas planteados dentro de
las ciencias de la vida, como la biología, la medicina, entre otros, aquellos procedimientos propios de
la estadística tradicional. Desde esa perspectiva este tipo de conocimiento es una aplicación práctica
de aquellos postulados, ya conocidos, de recolección de datos e inferencia futura. En este contexto,
la bioestadística tiene una estrecha relación con el método científico, conjunto de procedimientos
que se realizan con el fin de asegurar un aumento o mejora del conocimiento, de modo sistemático y
coherente.
La estadística es una ciencia destinada a la recolección y análisis de datos de modo eficiente con el
fin de lograr resultados significativos y, a partir de ellos, lograr interpretaciones que permitan
obtener explicaciones verosímiles y fundamentadas. Las estadísticas son de gran importancia a la
hora de definir planes de acción, tomar decisiones y tener un panorama claro del contexto en que se
opera. Sus orígenes se remontan al siglo XVII lo que implica un recorrido suficientemente largo
como para garantizar un desarrollo significativo. En la actualidad tiene aplicación en variados ámbitos
y, con el desarrollo de la informática, ha alcanzado mayor eficacia y sencillez ya que le permite
realizar cálculos complejos y de análisis de manera más fácil y rápida.
Cuando esta disciplina se combina con ciencias de la vida se logra una colección sistematizada de
datos, un ordenamiento y, finalmente, una interpretación de los mismos que es útil a la hora de
elaborar o contrastar diversas hipótesis de trabajo. En este sentido la bioestadística tiene, como fin
último, transformar la realidad partiendo de los datos que la misma suministra para elaborar un
campo de acción en función de un diagnóstico o modelo inferido.
Ejemplos de aplicaciones de la bioestadística pueden ser: pruebas de fármacos para el tratamiento

de una enfermedad específica; la formas en las que una enfermedad se propaga, considerando
características de individuos o poblaciones afectadas en relación a sus condiciones ambientales; la
relaciones entre muertes y nacimientos con el aumento poblacional, o la evaluación de resultados de
una política de salud en el tiempo, etc.
Se puede resumir entonces, que la preocupación de la estadística es:
 Registrar datos obtenidos de estudios relacionados con la biología y las ciencias relacionadas
con ella y, a partir de ellos, inferir, predecir o asociar estos datos con fenómenos que afecten
a los individuos o las poblaciones.
 También se preocupa de establecer algunas características que pueden presentar los datos
registrados como, por ejemplo, cuál es el dato u observación que más se registra, entre qué
valores se registran los datos, cuál es el promedio aritmético de los datos, etc.
 También se refiere a a los métodos utilizados para obtener los datos, la forma de
organizarlos, analizarlos y hacer inferencias o predicciones a partir de ellos.
Luego, el aporte de la estadística respecto a la investigación médica biológica está orientado,

principalmente, a:
1. Guiar el diseño de una investigación o encuesta antes de la colección de datos.

2. Analizar datos usando los procedimientos y técnicas estadísticas adecuadas
3. Presentar e interpretar resultados a los investigadores, o a quienes deban tomar decisiones,
incluyendo gobiernos o la industria.
Lo anterior implica que el cconocimiento de la Estadística es esencial para personas que hacen
investigación, dirigen estudios o deben hacer una presentación efectiva, ya que ayuda a discriminar
entre hechos y suposiciones de la vida diaria o saber cuándo se debe consultar a un estadístico para
estos fines
II.- DEFINICIONES BÁSICAS EN ESTADÍSTICA
En un inicio es importante entregar algunas decisiones básicas utilizadas en estadística, a fin de

establecer un lenguaje común que permita una mejor comprensión de sus propósitos y métodos.
Medida. Es el número o categoría que se asigna al medir un fenómeno. Un sinónimo de “medida” es

“observación”.
Medición. El concepto de “medir” se usa para indicar la asignación de valores numéricos, o

dimensiones, a uno o varios objetos mediante determinados procedimientos. Es la observación de un
fenómeno o propiedad y la asignación de un número, o categoría, como forma de representar tal
fenómeno. Los términos “observaciones” o “mediciones” se usan comúnmente como sinónimos.
Medir la estatura de una persona equivale a observar una característica o cualidad de ella y asignarle
un número, en este caso los centímetros de estatura, pero también podríamos observar la cantidad
de niños con ojos café presentes en el curso y asignar un número, en cuyo caso estaríamos
clasificando esa propiedad en varias categorías: niños con ojos café, azules o verdes.
Escala de medida. Una escala de medida es el conjunto de valores que puede tomar una determinada
medida. Las escalas de medidas pueden ser:
Categóricas: nominales u ordinales.
Numéricas: de intervalo o de razón.
Las escalas categóricas sólo asignan una categoría o clasifican el fenómeno o propiedad que se mide.
Pueden ser nominales u ordinales Los valores de una escala ordinal tienen un orden natural. La
escala nominal clasifica los objetos o fenómenos según ciertas características, tipologías o nombres,
dándoles una denominación o símbolo sin que implique ninguna relación de orden, distancia o
proporción entre los objetos o fenómenos.
Las escalas numéricas asignan números. Si la escala tiene un cero absoluto la escala es de razón, si el
cero es arbitrario la escala es de intervalo. La escala de intervalo representa un nivel de medición más
preciso, matemáticamente hablando, que las anteriores: no sólo se establece un orden en las
posiciones relativas de los objetos o individuos, sino que se mide también la distancia entre los
intervalos o las diferentes categorías o clases. Una escala de intervalo se caracteriza por una unidad
de medida común y constante que asigna un número real a todos los pares de objetos en un
conjunto ordenado. En esta clase de medida la proporción de dos intervalos cualquiera es
independiente de la unidad de medida y del punto cero. En una escala de intervalo, el punto cero y la
unidad de medida son arbitrarios.
Si tomamos una persona como ejemplo, cuando determinamos el color de sus ojos se está midiendo
en una escala categórica nominal, mientras su fecha de nacimiento se mide en una escala categórica
ordinal. Su temperatura corporal en grados centígrados se mide en una escala numérica de intervalos.
Su estatura, en una escala numérica de razón. En esta escala tiene sentido decir que una persona mide
la mitad que otra.
Inferencia estadística. Conjunto de procedimientos que permiten confirmar o concluir propiedades

de una población como fuente de información, de la que sólo conocemos una parte representativa o
muestra.
Población. Es el conjunto de todos los valores de un fenómeno o propiedad que se quiera observar.
Muestra. Es la parte de la población que se mide de manera efectiva, con el objeto de obtener
información acerca de toda la población. Es un conjunto de medidas u observaciones tomadas a
partir de una población determinada. La selección de la muestra se hace por un procedimiento que
asegure un alto grado de representatividad de la población.
Censo. Es el proceso de observar la población completa. Es decir, tomar una muestra igual a la
población.
Variable estadística. Es cada una de las características o cualidades que poseen los individuos de una
población.
Se puede distinguir dos tipos de variables:
1.-Variables Cualitativas: se refieren a características o cualidades que no pueden ser medidas con
números.
a.- Variable cualitativa nominal: una variable cualitativa nominal presenta modalidades no numéricas
que no admiten un criterio de orden.
Ejemplo: el estado civil de una persona; soltero, casado, separado, divorciado y viudo.
b.-Variable cualitativa ordinal: una variable cualitativa ordinal presenta modalidades no numéricas, en
las que existe un orden.
Ejemplos: la nota en un examen; reprobado, aprobado, notable, sobresaliente.
Puesto obtenido en una carrera: 1º, 2º, 3º,...
2.- Variable cuantitativa: una variable cuantitativa es la que se expresa mediante un número y, por
tanto, se puede realizar operaciones aritméticas con ella. Es posible distinguir dos tipos:
a.- Variable discreta: una variable discreta es aquella que toma valores aislados, es decir que no
admite valores intermedios entre dos valores específicos.
Ejemplo: el número de hermanos de 5 personas: 2, 1, 0, 1, 3.
b.- Variable continua: es aquella que puede tomar valores comprendidos entre dos números.
Ejemplo: el peso de 5 personas: 65 Kg., 70 Kg., 62 Kg., 72 Kg y 67 Kg.
Variabilidad. Determina el grado de cercanía o distanciamiento de los valores de una distribución de

observaciones frente a su promedio de localización. Mientras mayor sea el grado de variación menor
uniformidad tendrán los datos (sinónimo de heterogeneidad) y, por tanto, menor será la
representatividad o confiabilidad del promedio de tendencia central Por el contrario, si este valor es
pequeño (respecto a la unidad de medida) entonces hay una gran uniformidad entre los datos.
Cuando es cero quiere decir que todos los datos son iguales.
III. POBLACION Y MUESTRA
Cuando se realiza un estudio de investigación se pretende, generalmente, inferir o generalizar los

resultados de una muestra a una población. Este proceso de inferencia se efectúa por medio de
métodos estadísticos basados en la probabilidad.
La población representa el conjunto grande de individuos que deseamos estudiar y, generalmente,

suele ser inaccesible.
La muestra es el conjunto menor de individuos de una población determinada. La muestra debe ser
representativa de la población y con ello se quiere decir que cualquier individuo de la población, en
estudio, debe haber tenido la misma probabilidad de ser elegido.
Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas se puede
señalar:
1. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.
2. Ahorro de recursos: para ello se debe estudiar menos individuos.
3. Cuando las poblaciones son muy grandes, estudiar la totalidad de los individuos con una
característica determinada puede ser una tarea inaccesible o imposible de realizar.
4. Aumentar la calidad. Al disponer de más tiempo y recursos las observaciones y mediciones
realizadas a un reducido número de individuos pueden ser más exactas y plurales que si las
tuviésemos que realizar a una población.
5. La selección de muestras específicas permite reducir la heterogeneidad de una población al
indicar los criterios de inclusión y/o exclusión.
OBSERVACION: para variables numéricas en las que puede haber un gran número de valores
observados distintos se opta por un método de análisis diferente, respondiendo a las siguientes
preguntas:
 ¿Alrededor de qué valor se agrupan los datos?

 Suponiendo que se agrupan alrededor de un número, ¿cómo lo hacen? ¿muy concentrados?
¿muy dispersos?
IV.- MEDIDAS DE TENDENCIA CENTRAL
En oportunidades, para los datos u observaciones ya registrados y organizados se desea encontrar

una suerte de punto central en función de la frecuencia con que se presentan. En Estadística se
conocen tres formas diferentes, llamadas “medidas de tendencia central”, cuya utilización varía de
acuerdo a lo que se requiera del conjunto de datos recolectados. Esas medidas de tendencia central
son la media, la mediana y la moda.
a.- La Media Aritmética: x
La media, llamada también “media aritmética”, es la medida de tendencia central conocida

generalmente como “promedio”.
a.- 1.- La media para frecuencias simples:
Cuando los datos recolectados han sido organizados en una tabla de distribución de frecuencias
simples, la media para poblaciones y para muestras se puede calcular por gracias a la fórmula:
 media o promedio = x.
 suma de las frecuencias por f x∑ su correspondiente dato no minal.
 n = suma de todas las frecuencias (número de datos recolectados).
En otras palabras, la media es la medida que se obtiene al dividir la suma de todos los valores de una
variable por la frecuencia total. En palabras más simples, corresponde a la suma de un conjunto de
datos dividida por el número total de dichos datos.
Ejemplo
Mediante los siguientes datos hallar la media aritmética de los siguientes datos numéricos de
frecuencia simple: 10, 8, 6, 5, 10, 7
Solución
a.- 2.- La media para frecuencias por intervalos:
Cuando los datos recolectados han sido organizados en una tabla de frecuencias por intervalos, la
media para poblaciones y para muestras se puede calcular gracias a la fórmula:
 x = media
 x = punto medio del intervalo
 ∑fx = suma de las frecuencias por su correspondiente dato nominal
 N = suma de todas las frecuencias (número de datos recolectados). .
Ejemplo:
Considerando la siguiente distribución de frecuencias de los espesores en pulgadas de recipientes de

acero, encuentre la media aritmética:
Características de la Media Aritmética
1. La media se puede hallar sólo para variables cuantitativas.

2. La media es independiente de las amplitudes de los intervalos.
3. La media es muy sensible a las puntuaciones extremas.
4. La media no se puede calcular si hay un intervalo con una amplitud indeterminada.
b.-La Mediana: Me
La mediana es la medida de tendencia central que se define como aquel valor nominal que tiene,
dentro de un conjunto de datos ordenados, arriba y abajo de él, el mismo número de datos
nominales. En otras palabras, es el dato que está a la mitad y que divide en dos partes iguales a un
conjunto de datos. Es la observación equidistante de los extremos. Según el número de valores que
se tengan se pueden presentar dos casos:
 Si el número de valores es impar, la Mediana corresponderá al valor central de dicho

conjunto de datos.
 Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores
centrales (los valores centrales se suman y se dividen por 2..
Para datos no agrupados, la mediana viene dada por:
EJEMPLO:
Hallar la mediana en los siguientes datos: 15, 25, 30, 28, 21, 226, 32
SOLUCIÓN:
Se ordenan en forma creciente o decreciente y se toma el valor central.
12,15,25,26,28,30,32 . Mediana = 26
Para datos agrupados:
EJEMPLO:
Del conjunto 2, 2, 3, 3, 3, 4, 5, 5, 5, 5, 5, 6, 6, 7, 8, 9, 9, 10, 10 Mediana= 5
El cinco remarcado en rojo y subrayado es el que está en mitad del conjunto ordenado, ya que antes
de él existen 9 datos y 9 después de él.
EJEMPLO:
Hallar la mediana en la siguiente distribución de frecuencias, la mediana se encuentra en el intervalo

donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas:
Li-1 es el límite inferior de la clase donde
se encuentra la mediana.
N / 2 es la semi suma de las frecuencias

absolutas.
Fi-1 es la frecuencia acumulada anterior a

la clase mediana.
Fi es la frecuencia absoluta en la clase

donde se encuentra la medina
ai es la amplitud de la clase.
c.- Moda: Mo
La moda es el valor que tiene la mayor frecuencia absoluta.Se representa por Mo. .Se puede hallar la
moda para variables cualitativas y cuantitativas.
Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o más puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la
distribución es bimodal o multimodal, es decir, tiene varias modas.
Ejemplo: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
En el caso de que todas las puntuaciones de un grupo tengan la misma frecuencia, no hay moda.
Ejemplo: 2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia máxima la moda es el promedio de las dos
puntuaciones adyacentes, dispuestas ordenadamente.
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
V.- MEDIDAS DE DISPERSIÓN
Así como las medidas de tendencia central nos permiten identificar el punto central de los datos, las
medidas de dispersión nos permiten reconocer cuánto se dispersan los datos alrededor del punto
central: es decir, nos indican cuánto se desvían las observaciones alrededor de su promedio
aritmético (media).
Este tipo de medidas son parámetros informativos que nos permiten conocer cómo los valores de los
datos se reparten a través de eje X, mediante un valor numérico que representa su promedio de
dispersión. Las medidas de dispersión más importantes y utilizadas son la varianza y la desviación
estándar (o típica).
a.-Varianza
La varianza de las variables aleatorias es una medida vinculada a su dispersión. Se trata de la

esperanza del cuadrado de la desviación de esa variable, considerada frente a su media, midiéndose
en una unidad diferente. Por ejemplo: en los casos en que la variable mide una distancia en
kilómetros, su varianza se expresa en kilómetros al cuadrado.
Cabe destacar que las medidas de dispersión (también identificadas con el nombre de medidas de
variabilidad) se encargan de expresar la variabilidad de una distribución mediante un número, en los
casos en que las diferentes puntuaciones de la variable estén muy alejadas de la media. A mayor
valor de la medida de dispersión, mayor variabilidad. En cambio, a menor valor, más homogeneidad.
La varianza establece la variabilidad de la variable aleatoria. Es importante tener en cuenta que, en

ciertos casos, es preferible emplear otras medidas de dispersión según las características de las
distribuciones.
b.-La desviación estándar o típica
Uno de los conceptos más importantes relacionados con la varianza es la desviación estándar,
también conocida como típica, que representa la magnitud de la dispersión de variables de intervalo
y de razón, y resulta muy útil en el campo de la estadística descriptiva. Para obtenerla, simplemente
se comienza desde la varianza y se calcula su raíz cuadrada.
Si tenemos, por ejemplo, los valores (expresados en milímetros) 14 mm, 11 mm, 10 mm, 6 mm y 4
mm, podemos calcular su promedio sumándolos y dividiendo el resultado por 5, que es la cantidad
de elementos. Obtendríamos 9 mm, que es la media aritmética. Para conocer la varianza restamos
cada valor a la media recién calculada y elevamos cada resultado al cuadrado (para evitar números
negativos que afecten el estudio), sumándolos entre sí y se dividiendo por 5, que es el número de
datos. La varianza es 93,8 milímetros cuadrados. Por último, para obtener la desviación estándar,
calculamos la raíz cuadrada lo que nos deja con 9.68 mm (nótese que la unidad vuelve a ser
milímetros).
VI.-MEDIDAS DE FRECUENCIA, DE ASOCIACIÓN E IMPACTO
Este tipo de medidas se usa en Salud Publica, especialmente en Epidemiologia, y sirven para:
1. Estudiar la aparición, distribución y desarrollo de las enfermedades en la comunidad.

2. Proporcionar los datos para la comprensión de la etiología de la salud y enfermedad.
3. Describir el estado de salud de las poblaciones.
4. Describir la historia natural de las enfermedades.
5. Evaluar los efectos de las medidas terapéuticas, pruebas diagnósticas, intervenciones
preventivas.
6. Proporcionar información y conceptos epidemiológicos para su uso en la administración de
los servicios de salud.
7. Desarrollo de modelos de vigilancia en salud.
a.- MEDIDAS DE FRECUENCIA
La medida simple de frecuencia de una enfermedad, o de cualquier otro suceso, es el número de

personas que la padecen o lo presentan (por ejemplo, el número de pacientes diabéticos), el número
de fallecidos por accidentes de tráfico o el número de pacientes con cáncer en una población. Sin
embargo, este tipo de medidas por sí solas carecen de utilidad para determinar la importancia de un
problema de salud determinado, ya que no indican el tamaño de la población en observación, por
tanto no dan indicios de la gravedad del problema: no es lo mismo 10 casos en una población de
1000 habitantes que 10 casos en una población de 1 millón de habitantes, por lo tanto será
importante saber a qué tamaño de población está asociado el número de casos para dimensionar la
gravedad y trascendencia de la situación, además del periodo de tiempo en el que fueron
identificados. Para este propósito en epidemiología se trabaja con diferentes tipos de fracciones, que
permiten cuantificar correctamente el impacto de una determinada enfermedad:
a.- 1.- PROPORCIÓN
Es el cociente con que el numerador está incluido en el denominador. Es decir, el cociente entre el
número de casos y el total de la población.
Por ejemplo, si en una población de 25.000 habitantes se diagnostican 1.500 pacientes con diabetes,
la proporción de diabetes en la población es de 1.500/25.000 = 0.06. El valor de una proporción
puede variar de 0 a 1. Si multiplicamos este valor por 100 obtenemos el tanto por ciento: en este
caso sería, el 6%
a.- 2.-RAZÓN
En este cociente el numerador no forma parte del denominador.
En el ejemplo anterior, la razón entre la población con diabetes y la población no diabética es de

1.500/23.500 = 3/47 =0,064. En el denominador, a la población total se ha restado el número de
casos de pacientes con diabetes, o sea se trata del el cociente entre el número de pacientes con
diabetes versus los pacientes sin diabetes.
a.- 3.- TASA
El concepto de “tasa” es similar al de una proporción, con la diferencia de que las tasas llevan
incorporado el concepto de tiempo. El numerador lo constituye la frecuencia absoluta de casos del
problema a estudiar. A su vez, el denominador está constituido por la suma de períodos individuales
de riesgo a los que han estado expuestos los sujetos susceptibles de la población en estudio. De su
cálculo se desprende la velocidad con que se produce el cambio de una situación clínica a otra.
En epidemiología, las medidas de frecuencia de enfermedad más comúnmente utilizadas so la

prevalencia y la incidencia.
a.- 4.- PREVALENCIA
La prevalencia (P) mide la proporción de individuos de una población que padecen una enfermedad
en un momento o periodo de tiempo determinado. Para su cálculo se usa la fórmula:
Ejemplo: en una población de 240 adultos mayores se encontró que 80 de ellos eran obesos. La
prevalencia de obesidad en ese grupo, será:
P= 80/240 =0,33 (este valor va ser siempre menor que 1)
Si queremos expresarlo en porcentaje, corresponde al 33%.
Como toda proporción, la prevalencia no tiene dimensión y sus valores fluctúan entre 0 y 1. Se
puede expresar en porcentaje, en tanto por ciento, tanto por mil, etc., según el tamaño del número
de casos y las poblaciones. La prevalencia de un problema de salud, en una comunidad, suele
medirse a partir de estudios transversales para determinar su importancia, en un momento concreto,
y no puede utilizarse con fines predictivos.
Otra medida de prevalencia utilizada en epidemiología es la prevalencia de periodo, también

denominada prevalencia lápsica, que corresponde a la proporción de personas que han presentado la
enfermedad en un periodo de tiempo determinado (por ejemplo, la prevalencia de cáncer en España
en los últimos 5 años). El problema que plantea el cálculo de este índice es que la población total a la
que se refiere puede haber cambiado durante el periodo de estudio, por lo cual se toma como
denominador al punto medio del periodo considerado.
Prevalencia del Periodo = Prevalencia Inicial +Número de casos nuevos en el periodo

Población a mitad del periodo
a.-5.-INCIDENCIA
La incidencia se define como el número de casos nuevos de una enfermedad o evento, que se
desarrolla en una población durante un período de tiempo determinado. Hay dos tipos de medidas
de incidencia: la incidencia acumulada y la tasa de incidencia o densidad de incidencia.
La incidencia acumulada (IA) es la proporción de individuos sanos que desarrollan la enfermedad a lo

largo de un período de tiempo concreto. Se calcula como el cociente entre el número de casos
nuevos y el total de la población en riesgo, al inicio de la medición:
La incidencia acumulada es una estimación de la probabilidad o el riesgo, para un individuo libre, de

desarrollar una determinada enfermedad durante un período específico de tiempo. Como cualquier
proporción se puede expresar en términos de porcentaje y, como no es una tasa, debe ir
acompañada del periodo de observación para poder ser interpretada.
EJEMPLO: el año 2010 se tomó un grupo de 400 individuos, entre 40 y 59 años, con niveles de
colesterol normal. Durante el año 2015, en este grupo se habían presentado 10 casos de cardiopatía
isquémica producto del aumento en los niveles de colesterol. La IA, este caso, sería:
IA = 10/400 = 0,025 2,5 %

Tasa de incidencia. Se calcula como el cociente entre el número de casos nuevos de una
enfermedad, ocurridos durante el periodo de seguimiento, y la suma de todos los tiempos
individuales de observación:
Representa la frecuencia con la que se presentan nuevos casos, en una población. El valor se obtiene
dividiendo el número de los nuevos casos, ocurridos en un período definido, por la población en
riesgo en el mismo período: a veces se expresa como personas/tiempo. La tasa de incidencia más
habitual, en la práctica de la salud pública, es la obtenida mediante la siguiente fórmula:
Tasa de incidencia = TI = Nº de nuevos casos en el periodo especificado x 10n

Nº de personas expuestas al riesgo durante el periodo
En una población dinámica, el denominador incluye el tamaño medio de la misma (que suele ser el
valor calculado de población en la mitad del periodo). Si el periodo es de un año el resultado es la
llamada tasa de incidencia anual, y así sucesivamente. Esta tasa representa un cálculo de la tasa de
incidencia por persona-tiempo, es decir: la tasa por cada 10 npersonas-años, decenios, etc. Si la tasa
es baja, tal y como ocurre con muchas enfermedades crónicas, puede servir al cálculo de la tasa de
incidencia acumulativa.
La prevalencia y la incidencia son conceptos muy relacionados. La prevalencia depende de la

incidencia y de la duración de la enfermedad, entre otros factores. Si la incidencia de una
enfermedad es baja y la enfermedad se mantiene por un largo período de tiempo, la proporción de la
población que tenga la enfermedad en un momento dado puede ser alta en relación a su incidencia.
Por el contrario, si la incidencia es alta y la duración es corta, ya sea porque se recuperan pronto o
fallecen, la prevalencia puede ser baja en relación a la incidencia de dicha patología. Luego, los
cambios de prevalencia en un periodo de tiempo puede ser resultado de cambios en la incidencia,
cambios en la duración de la enfermedad, o ambos.
Factores que influyen en el aumento de la Factores que influyen en el descenso de la
Prevalencia Prevalencia
 Mayor duración de la enfermedad.  Menor duración de la enfermedad.
 Prolongación de la vida en los  Elevada tasa de letalidad por la
incurables. enfermedad.
 Incremento de la Incidencia.  Disminución de la incidencia.
 Importación de casos.  Inmigración de personas sanas.
 Inmigración de susceptibles.  Emigración de casos.
 Emigración de los sanos.  Incremento de la tasa de curación de
 Incremento de las posibilidades casos.
diagnósticas.
De lo anterior se deduce que la prevalencia no es útil para confirmar hipótesis etiológicas, por lo que
resulta más adecuado trabajar con casos incidentes. Los estudios de prevalencia pueden obtener
asociaciones que reflejen los determinantes de la supervivencia y no las causas de la misma,
conduciendo a conclusiones erróneas. Sin embargo, su relación con la incidencia en ocasiones
permite que se pueda utilizar como una buena aproximación del riesgo para evaluar la asociación
entre causas y enfermedad.
b.- MEDIDAS DE ASOCIACIÓN
El razonamiento causal es complemento indispensable del análisis estadístico de una relación entre
dos o más fenómenos. La explicación etiológica de una enfermedad es, en la mayoría de los casos un
proceso largo, progresivo y a menudo sin posibilidad de prueba final por ensayo, generalmente por
razones éticas. Una asociación causal, en epidemiología, es seguida por el estudio de riesgo; el riesgo
y su cuantificación es la medida e indicador de la asociación que se está analizando.
Son medidas que se usan para evaluar la asociación entre un evento y un factor de estudio, por
ejemplo: mutación de un gen (factor) y una enfermedad (evento); tratamiento (factor) y curación
(evento).
En general, se puede decir que las medidas de asociación intentan:
 Establecer si existe una asociación causal entre un factor de riesgo y una enfermedad o
evento.
 Establecer la dirección de esta asociación.
 Establecer la magnitud de la asociación.
Ejemplos de medidas de asociación son:
 El riesgo relativo, utilizado en los estudios de cohortes. Compara la ocurrencia o incidencia

acumulada de un suceso entre quienes están expuestos a un factor de riesgo y quiénes no.
 La razón de tasas, compara tasas de incidencia, es decir, la velocidad a la que ocurre un
determinado fenómeno entre personas expuestas y no expuestas a un factor de riesgo.
 El odds ratio, que se usa en los estudios de casos y controles y nos permite relacionar
cuánto más probable es que se produzca una exposición determinada entre personas
enfermas (casos) que entre personas sanas (controles).
b.-1.-Tablas de contingencia
Las tablas de contingencia, también denominadas tetracóricas o de doble entrada, se emplean para
registrar y analizar la asociación entre dos o más variables, generalmente de carácter cualitativa
(nominales u ordinales).
En general, el interés al utilizar este tipo de tablas al ordenar los datos se centra en estudiar si existe
alguna asociación entre una variable ﬁla y otra variable columna, y/o partir de allí calcular la
intensidad de dicha asociación.
Ejemplo para un estudio de casos y controles:
Casos controles
Expuestos A b a+b
No expuestos C d c+d
a+c b+c a+b+c+d
La dirección de la lectura, horizontal o vertical, va a de depender del tipo de estudio
b.-2.-Riesgo
Se define como la probabilidad de que un evento suceda. En epidemiologia, el riesgo se refiere a la

probabilidad de que aparezcan casos de enfermedad entre poblaciones, expuestas o no, a un factor
de riesgo. El cálculo de incidencia de la enfermedad, en expuestos y no expuestos, permite evaluar el
riesgo asociado a la condición de exposición.
R= N°de casos presentados
Total de población en riesgo
Ejemplo: durante un paseo de fin de año una delegación de 120 niños visitó un balneario y, después
de bañarse en la piscina del lugar, 80 de ellos presentó irritación ocular. ¿Cuál es el riesgo al que se
expusieron los niños que hicieron uso de la piscina?
R = 80/120 = 0,66
Este valor no tiene unidad y sólo representa la probabilidad que tiene cada niño de sufrir irritación
ocular. También se denomina “riesgo individual”.
b.-3.- Riesgo relativo
Se le denomina también razón de incidencia acumulada, o bien razón entre dos riesgos. Compara la
frecuencia en que sucede el daño entre los que tienen el factor de riesgo y los que no lo tienen.
Responde a la pregunta: ¿cuántas veces es mayor el riesgo en las personas expuestas a un factor de
riesgo que en las no expuestas al mismo? Para su análisis se utiliza la tabla de contingencia, o tabla
de 2X2, en la que se comparan las incidencias:
RR = I e = a / (a+b) = Incidencia en la población

I ne c / (c+d) Incidencia en la población no expuesta
Fuerza de la asociación según valor del RR
En general, para evaluar la asociación entre el factor de exposición y el efecto en la población

expuesta, se utiliza la siguiente tabla:
1.0 - 1.2 Ninguna

1.2 – 1.5 Débil
1.5 – 3.0 Moderada
3.0 - 10.0 Fuerte
> 10 Se aproxima a infinito
Ejemplo: en una población de 1400 personas entre 55 y 65 años, con patología cardiovascular
crónica, se estudió el efecto de una nueva droga para prevenir el infarto agudo de miocardio (IAM).
Para ello se administró esta droga a un grupo de 400 personas. Después de 3 años, del grupo al que
se administró habían fallecido 40 personas, en tanto que del grupo que no recibió el medicamento
habían fallecido 60 personas. Construir una tabla de contingencia y calcular el riesgo relativo,
interpretándolo.
a.-
Controles Casos
Expuestos 360 40 400
No expuestos 940 60 1000
1300 100 1400
b.- RR = I e = a / (a+b) = 360 / (360+40) = 0.90 = 0.93

I ne c / (c+d) 960 /(940+60) 0.96
c.- El medicamento, estadísticamente, no tiene efecto en prevenir el IAM.
La razón de tasas de incidencia (RTI), también denominada densidad de incidencia (RDI), se utiliza en
estudios analíticos en que no se sigue a todos los individuos durante el mismo periodo de tiempo. Es
el cociente entre los grupos que se comparan, poniendo en el denominador el grupo de referencia.
RTI = Tasa de incidencia en la población expuesta

Tasa de incidencia en la población no expuesta
b.-4.- ODDS RATIO
La Odds Ratio (OR), o razón de oportunidades, razón de productos cruzados u oportunidad relativa,
entre otras traducciones, es una medición relativa del efecto. En los estudios de casos y controles,
debido a que la incidencia es desconocida, el método de estimación del riesgo relativo es diferente y
se estima calculando el OR, que corresponde al cociente de dos odds o chances, o “probabilidades de
ocurrencia”. En el caso de los estudios epidemiológicos usualmente se dispone de dos grupos, uno de
ellos utilizado como referencia o comparación del otro:
OR = Odds de enfermedad en expuestos = a x d

Odds Ratio en no expuestos cxb
Los datos se obtienen de una tabla tetracórica:
Casos controles
Expuestos a b
No expuestos c d
Se puede observar que el resultado va a ser el mismo, independiente de si las variables

“dependiente” e “independiente” son intercambiadas de sus posiciones en la tabla. También la
interpretación puede ser en ambas direcciones, ya sea como indicador de la posibilidad de presentar
la variable “resultado” en función de la exposición, y viceversa. En el contexto de un estudio de casos
y controles lo correcto es interpretarlo como la posibilidad de presentar la variable “exposición” de
acuerdo al resultado. Es decir, a partir de los casos observar la exposición de forma retrospectiva.
Ejemplo: en el mismo caso anterior, calcular el OR
Casos controles
Expuestos 40 360
No expuestos 100 1300
OR = a x d = 40 x 1300 = 52000 = 1.44

cx b 100 x 360 36000
Esto significa que las personas que consumieron el medicamento tienen 1.44 veces más
probabilidades de sufrir un IAM. O lo que es lo mismo, la droga actúa más como un factor de riesgo
que como un factor protector. En general, para que una exposición sea considerada un factor
protector o de prevención, debe presentar valores inferiores a 1.
b.-5.- RAZÓN DE PREVALENCIA
La razón de prevalencia (RP) es una medida utilizada en estudios de corte transversal. Se obtiene
calculando el cociente entre la prevalencia encontrada en un grupo, expuesto a un eventual factor,
en relación a la prevalencia de grupos no expuestos o con diferente nivel de exposición:
RP = Prevalencia en expuestos
Prevalencia en no expuestos
c.- MEDIDAS DE IMPACTO
Se les denomina también medidas absolutas de riesgo, es decir, hablamos de medidas de impacto sólo
cuando queda demostrado que el factor es verdaderamente de riesgo. Éstas informan sobre los
cambios en la distribución de la enfermedad que podemos esperar al variar el factor de exposición,
midiendo el aporte de un factor de riesgo a la génesis de una enfermedad o evento en los individuos
o la población expuesta, así como también cuál sería el aporte de las acciones preventivas, de
acuerdo al siguiente esquema:
Diferencia en los riesgos = Riesgo de enfermedad en expuestos - Riesgo enfermedad en no

expuestos
Si la diferencia es = 0 significa que el factor no existe o no tiene efecto.
c.- 1.- RIESGO ATRIBUIBLE EN EXPUESTOS
Se le denomina también diferencia de riesgo y establece el riesgo adicional de enfermar relacionado

con la exposición estudiada. Responde a la pregunta: ¿cuál es el riesgo de enfermar atribuible al
factor en estudio?
RA = incidencia acumulada en expuestos – incidencia acumulada en no expuestos = I e - I ne
El RA permite conocer, en términos absolutos, cuánto mayor es la frecuencia de una enfermedad en

el grupo expuesto en comparación al grupo no expuesto, asumiendo una relación causal entre la
exposición y el resultado de la misma.
c.-2 .-FRACCIÓN ETIOLÓGICA EN EXPUESTOS
La fracción etiológica en expuestos (FEE) corresponde a la medida relativa del efecto de la

exposición, en términos porcentuales, respecto a la condición de no exposición. Indica cuánto de la
enfermedad es porcentualmente explicado por la presencia del factor de riesgo, de acuerdo a la
interrogante: ¿sobre qué porcentaje de enfermos es responsable el factor estudiado?
Matemáticamente se obtiene:
FEE = RAE
Incidencia acumulada en expuestos
o también:
FEE = RR – 1
RR
El FEE establece el porcentaje atribuible al factor de riesgo, en estudio.
c.-3.- RIESGO ATRIBUIBLE POBLACIONAL
El riesgo atribuible poblacional (RAP), o exceso de riesgo poblacional, establece la frecuencia con que
se presenta la enfermedad en toda la población como consecuencia del factor de exposición, es
decir, la frecuencia de la enfermedad que se evitaría al eliminar el factor de exposición:
RAP = Incidencia acumulada en la población – Incidencia acumulada en la población no expuesta
o también:
RAP = RAE x Proporción de personas expuestas en la población
El RAP es una medida del impacto del factor de riesgo en la población general, el que debe ser menor
que en los expuestos al factor de riesgo debido a estar formada por expuestos y no expuestos a
dicho factor. Representa el "exceso" de incidencia de enfermedad que se evitaría, en la población
general, al eliminar la exposición al factor de riesgo. Junto con la proporción de riesgo atribuible
poblacional (RAP%), que corresponde al porcentaje de población afectada por la exposición a un
factor de riesgo, es la medida de efecto con mayor importancia en Salud Publica.
VII.-BIBLIOGRAFÍA
 Taucher, E. Bioestadística. Santiago de Chile: Editorial Universitaria; 1997.

 Villa R, Moreno A, García de la Torre G. Epidemiologia y Estadísticas en Salud Pública. Mc
Graw Hill; 2011; Cap. 13, 7 págs.
 Hernández-Aguado I, Gil de Miguel A, Delgado Rodríguez M, et al. Manual de Epidemiología
y Salud Pública: para grados en ciencias de la Salud. 2ª Ed. Medica Panamericana; 2011, Cap.
6, 4 págs.
 Moreno-Altamirano CD, López-Moreno S, Corcho-Berdugo A. Principales medidas en

epidemiología. Sal Públ. 2000; 42. http://www.scielosp.org/scielo.php?pid=S0036-
36342000000400009&script=sci_arttext
 Apuntes de Clases Salud Pública UNAB. Dr. Jaime Sepúlveda C.
 Apuntes de Clases Salud Pública UNAB. Pedro Henríquez Z.

1 Bioestadistica KDJKFDF

Cargado por

Copyright:

Formatos disponibles

1 Bioestadistica KDJKFDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

1 Bioestadistica KDJKFDF

Cargado por

Copyright:

Formatos disponibles

BIOESTADÍSTICA BÁSICA

Pedro Henríquez Zenteno

II.- DEFINICIONES BÁSICAS EN ESTADÍSTICA

III. POBLACIÓN Y MUESTRA

IV.- MEDIDAS DE TENDENCIA CENTRAL

V.- MEDIDAS DE DISPERSIÓN

VI.-MEDIDAS DE FRECUENCIA, ASOCIACIÓN E IMPACTO

Ejemplos de aplicaciones de la bioestadística pueden ser: pruebas de fármacos para el tratamiento

Se puede resumir entonces, que la preocupación de la estadística es:

Luego, el aporte de la estadística respecto a la investigación médica biológica está orientado,

1. Guiar el diseño de una investigación o encuesta antes de la colección de datos.

II.- DEFINICIONES BÁSICAS EN ESTADÍSTICA

En un inicio es importante entregar algunas decisiones básicas utilizadas en estadística, a fin de

Medida. Es el número o categoría que se asigna al medir un fenómeno. Un sinónimo de “medida” es

Medición. El concepto de “medir” se usa para indicar la asignación de valores numéricos, o

Numéricas: de intervalo o de razón.

Inferencia estadística. Conjunto de procedimientos que permiten confirmar o concluir propiedades

Se puede distinguir dos tipos de variables:

Ejemplos: la nota en un examen; reprobado, aprobado, notable, sobresaliente.

Puesto obtenido en una carrera: 1º, 2º, 3º,...

Ejemplo: el número de hermanos de 5 personas: 2, 1, 0, 1, 3.

Ejemplo: el peso de 5 personas: 65 Kg., 70 Kg., 62 Kg., 72 Kg y 67 Kg.

Variabilidad. Determina el grado de cercanía o distanciamiento de los valores de una distribución de

Cuando se realiza un estudio de investigación se pretende, generalmente, inferir o generalizar los

La población representa el conjunto grande de individuos que deseamos estudiar y, generalmente,

 ¿Alrededor de qué valor se agrupan los datos?

En oportunidades, para los datos u observaciones ya registrados y organizados se desea encontrar

a.- La Media Aritmética: x

La media, llamada también “media aritmética”, es la medida de tendencia central conocida

a.- 1.- La media para frecuencias simples:

a.- 2.- La media para frecuencias por intervalos:

Considerando la siguiente distribución de frecuencias de los espesores en pulgadas de recipientes de

Características de la Media Aritmética

1. La media se puede hallar sólo para variables cuantitativas.

 Si el número de valores es impar, la Mediana corresponderá al valor central de dicho

Para datos no agrupados, la mediana viene dada por:

Se ordenan en forma creciente o decreciente y se toma el valor central.

Para datos agrupados:

Del conjunto 2, 2, 3, 3, 3, 4, 5, 5, 5, 5, 5, 6, 6, 7, 8, 9, 9, 10, 10 Mediana= 5

Hallar la mediana en la siguiente distribución de frecuencias, la mediana se encuentra en el intervalo

N / 2 es la semi suma de las frecuencias

Fi-1 es la frecuencia acumulada anterior a

Fi es la frecuencia absoluta en la clase

Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4

V.- MEDIDAS DE DISPERSIÓN

La varianza de las variables aleatorias es una medida vinculada a su dispersión. Se trata de la

La varianza establece la variabilidad de la variable aleatoria. Es importante tener en cuenta que, en

1. Estudiar la aparición, distribución y desarrollo de las enfermedades en la comunidad.

a.- MEDIDAS DE FRECUENCIA

La medida simple de frecuencia de una enfermedad, o de cualquier otro suceso, es el número de

a.- 1.- PROPORCIÓN

En este cociente el numerador no forma parte del denominador.

En el ejemplo anterior, la razón entre la población con diabetes y la población no diabética es de

a.- 3.- TASA

En epidemiología, las medidas de frecuencia de enfermedad más comúnmente utilizadas so la

a.- 4.- PREVALENCIA

P= 80/240 =0,33 (este valor va ser siempre menor que 1)

Si queremos expresarlo en porcentaje, corresponde al 33%.

Otra medida de prevalencia utilizada en epidemiología es la prevalencia de periodo, también